适用场景
当你需要把一批播客/课程/短视频配音/旁白音频统一到目标响度(例如 -16 LUFS 或 -14 LUFS),同时确保真峰值不过载(True Peak 不超过 -1 dBTP),单靠离线命令容易出错。本文提供 1 条可直接投喂给 AI 的提示词(Prompts),让 AI 产出一个可运行/可部署的在线工具:上传音频 -> 自动分析 -> 生成标准化结果 -> 导出文件与检测报告。
交付物要求(必须产出)
AI 需要一次性产出:完整项目代码、清晰的文件结构、可直接复制执行的本地运行命令、可选的 Docker 部署、以及测试用例或 QA checklist。工具必须支持:多格式输入、响度与峰值检测、按目标参数批量标准化、结果下载、以及处理报告(JSON/CSV/Markdown 任一)。
Prompt(直接复制给 AI)
你是资深全栈工程师 + 音频工程顾问。请为我生成一个“在线音频响度标准化与峰值检测”Web 工具的完整可运行项目(不要只给片段)。
目标:用户在浏览器里上传一个或多个音频文件(MP3/WAV/FLAC/M4A/AAC/OGG),工具自动分析每个文件的:
- Integrated Loudness(LUFS)
- Loudness Range(LRA)
- True Peak(dBTP)
- Peak(dBFS)与 RMS(可选)
然后按用户设置的目标响度与峰值限制进行标准化处理,并提供下载:
- 标准化后的音频文件(保持原采样率/声道,或允许选择输出格式)
- 每个文件的分析与处理报告(JSON + 可选 CSV)
- 批处理汇总报告(含失败原因与重试建议)
硬约束:
1) 必须产出完整项目:代码 + 文件树 + 依赖清单 + 运行命令。
2) 必须包含部署说明:本地运行 + Docker(可选但推荐)+ 生产部署建议。
3) 必须包含测试:至少提供 3 个自动化测试(或明确的 QA checklist,覆盖上传、分析、处理、下载、异常)。
4) 不能依赖任何需要付费 API Key 的第三方服务。
5) 音频分析与处理建议使用 ffmpeg/ffprobe 或等价开源方案;若用 WebAssembly 版本 ffmpeg,请给出缓存与性能策略。
6) 必须有安全限制:文件大小/时长限制、并发队列、临时文件清理、MIME/扩展名校验、CORS/CSRF 基础说明。
7) 结果可复现:所有处理参数要写入报告;每次处理生成唯一任务ID。
产品细节:
- 前端:提供拖拽上传、任务队列、进度条、参数面板(目标 LUFS、True Peak 上限、输出格式、是否归一到双声道/保持原声道、是否批量打包 zip)。
- 后端:提供 API(上传、分析、处理、下载、报告),并能在本地一键启动。
- 性能:大文件采用分片上传或流式处理(任选其一并说明)。
- 可观测性:日志 + 简单的健康检查 endpoint。
请按以下结构输出:
A. 项目简介(1-2 段)
B. 技术选型与理由
C. 文件树(tree 形式)
D. 关键代码(按文件给出完整内容,不要省略)
E. 安装与运行命令(Windows/macOS/Linux)
F. Docker 部署(如果提供)
G. 测试用例或 QA checklist
H. 常见问题与排错(例如 ffmpeg 不可用、编码不支持、True Peak 计算差异等)
参数建议
默认参数可设为:目标响度 -16 LUFS(语音类常用),True Peak 上限 -1 dBTP。若输出用于短视频平台,可提供 -14 LUFS 的快捷预设。报告中需明确写出:输入格式、采样率、声道、分析结果、处理增益(gain)、输出格式与最终指标。
验收清单
1) 上传不同格式音频均可分析;2) 批量任务可排队,失败有原因;3) 处理后可下载单文件与打包;4) 报告可下载并含全部参数;5) 本地运行命令可一键启动;6) 部署说明清晰;7) QA checklist 或测试覆盖核心流程。