音频处理 多格式响度标准化与峰值检测 AI 提示词 (Prompts)

适用场景

当你需要把一批播客/课程/短视频配音/旁白音频统一到目标响度(例如 -16 LUFS 或 -14 LUFS),同时确保真峰值不过载(True Peak 不超过 -1 dBTP),单靠离线命令容易出错。本文提供 1 条可直接投喂给 AI 的提示词(Prompts),让 AI 产出一个可运行/可部署的在线工具:上传音频 -> 自动分析 -> 生成标准化结果 -> 导出文件与检测报告。

交付物要求(必须产出)

AI 需要一次性产出:完整项目代码、清晰的文件结构、可直接复制执行的本地运行命令、可选的 Docker 部署、以及测试用例或 QA checklist。工具必须支持:多格式输入、响度与峰值检测、按目标参数批量标准化、结果下载、以及处理报告(JSON/CSV/Markdown 任一)。

Prompt(直接复制给 AI)

你是资深全栈工程师 + 音频工程顾问。请为我生成一个“在线音频响度标准化与峰值检测”Web 工具的完整可运行项目(不要只给片段)。 目标:用户在浏览器里上传一个或多个音频文件(MP3/WAV/FLAC/M4A/AAC/OGG),工具自动分析每个文件的: - Integrated Loudness(LUFS) - Loudness Range(LRA) - True Peak(dBTP) - Peak(dBFS)与 RMS(可选) 然后按用户设置的目标响度与峰值限制进行标准化处理,并提供下载: - 标准化后的音频文件(保持原采样率/声道,或允许选择输出格式) - 每个文件的分析与处理报告(JSON + 可选 CSV) - 批处理汇总报告(含失败原因与重试建议) 硬约束: 1) 必须产出完整项目:代码 + 文件树 + 依赖清单 + 运行命令。 2) 必须包含部署说明:本地运行 + Docker(可选但推荐)+ 生产部署建议。 3) 必须包含测试:至少提供 3 个自动化测试(或明确的 QA checklist,覆盖上传、分析、处理、下载、异常)。 4) 不能依赖任何需要付费 API Key 的第三方服务。 5) 音频分析与处理建议使用 ffmpeg/ffprobe 或等价开源方案;若用 WebAssembly 版本 ffmpeg,请给出缓存与性能策略。 6) 必须有安全限制:文件大小/时长限制、并发队列、临时文件清理、MIME/扩展名校验、CORS/CSRF 基础说明。 7) 结果可复现:所有处理参数要写入报告;每次处理生成唯一任务ID。 产品细节: - 前端:提供拖拽上传、任务队列、进度条、参数面板(目标 LUFS、True Peak 上限、输出格式、是否归一到双声道/保持原声道、是否批量打包 zip)。 - 后端:提供 API(上传、分析、处理、下载、报告),并能在本地一键启动。 - 性能:大文件采用分片上传或流式处理(任选其一并说明)。 - 可观测性:日志 + 简单的健康检查 endpoint。 请按以下结构输出: A. 项目简介(1-2 段) B. 技术选型与理由 C. 文件树(tree 形式) D. 关键代码(按文件给出完整内容,不要省略) E. 安装与运行命令(Windows/macOS/Linux) F. Docker 部署(如果提供) G. 测试用例或 QA checklist H. 常见问题与排错(例如 ffmpeg 不可用、编码不支持、True Peak 计算差异等)

参数建议

默认参数可设为:目标响度 -16 LUFS(语音类常用),True Peak 上限 -1 dBTP。若输出用于短视频平台,可提供 -14 LUFS 的快捷预设。报告中需明确写出:输入格式、采样率、声道、分析结果、处理增益(gain)、输出格式与最终指标。

验收清单

1) 上传不同格式音频均可分析;2) 批量任务可排队,失败有原因;3) 处理后可下载单文件与打包;4) 报告可下载并含全部参数;5) 本地运行命令可一键启动;6) 部署说明清晰;7) QA checklist 或测试覆盖核心流程。

用户评论 (0)

登录后参与讨论

立即登录 注册账号

暂无评论,快来抢沙发吧~

操作成功