音频处理静音段检测与剪切清单导出 AI 提示词 (Prompts)

你将得到什么

这是一条可直接复用的“在线工具生成型 AI 提示词（Prompts）”。把它粘贴给任意代码能力较强的 AI，即可一次性产出一个可运行、可构建、可部署的在线音频工具：支持上传音频、检测静音段、生成可编辑剪切清单，并导出 EDL/CSV/JSON。

覆盖场景

适合播客剪辑前的静音清理、课程录音去停顿、会议录音整理、采访音频粗剪等。工具重点是“分析现有音频并输出剪切建议”，不涉及任何图像生成或渲染图导向。

功能清单（建议实现）

1) 上传音频（mp3/wav/m4a 等常见格式）；2) 后端使用 ffmpeg 的 silencedetect 分析静音区间；3) 生成“保留段/删除段”时间轴清单；4) 前端可视化列表 + 可手动微调阈值/最小静音时长；5) 导出：JSON（原始区间）、CSV（表格）、EDL（剪辑软件可导入的时间线描述）。

交付物要求（硬约束）

必须输出：完整项目源码、清晰文件树、可复制运行命令、本地开发说明、Docker 部署说明、以及测试用例或 QA checklist（至少二选一，最好两者都有）。

AI 提示词（Prompts）

你是资深全栈工程师。请为我生成一个“静音段检测与剪切清单导出”的在线工具，要求可运行、可构建、可部署。

【产品目标】
- 用户上传一段音频，系统自动检测静音段并生成剪切建议；用户可调整阈值、最小静音时长与合并间隔；最终可导出 EDL/CSV/JSON。

【必须交付的内容】
1) 完整项目代码（前后端都给出），并给出清晰的文件树。
2) 本地运行命令（含依赖安装、启动前端/后端），并说明需要的 Node 版本。
3) Docker 一键部署：Dockerfile + docker-compose.yml（或等价方案），含端口、环境变量、持久化目录说明。
4) 测试用例或 QA checklist：
   - 至少包含：上传大文件、不同格式、极短音频、无静音、全静音、阈值边界、并发上传、失败重试、导出文件校验。

【技术栈建议（可替换但要说明理由）】
- 后端：Node.js + Express（或 Fastify）
- 音频分析：服务器端 ffmpeg（调用 silencedetect 解析 stderr 输出），不要用任何“生成图片/渲染图”能力。
- 前端：React + Vite（或 Next.js），提供表单与结果表格。

【后端详细需求】
- 接口：
  - POST /api/upload：上传音频，返回 fileId
  - POST /api/analyze：入参 { fileId, silenceThresholdDb, minSilenceDuration, mergeGap }，返回 segments（包含 silentSegments 与 keepSegments）
  - GET /api/export?fileId=...&format=edl|csv|json：导出结果
- 安全：限制文件大小、校验 MIME/后缀、保存到临时目录、定期清理。
- 性能：分析过程要有进度/状态查询（可选），并避免阻塞主线程（可用子进程）。

【前端详细需求】
- 页面：上传区、参数区（阈值/时长/合并间隔）、结果区（表格 + 可编辑）、导出按钮。
- 结果表格字段：序号、开始时间、结束时间、时长、类型（静音/保留）、备注。
- 交互：修改参数后可重新分析；允许手工调整某一段的起止时间。

【导出格式规则】
- CSV：一行一个区间；时间使用秒（带 3 位小数）
- JSON：保留原始检测结果与用户修改后的最终结果
- EDL：输出通用可读格式（如 CMX3600 风格的简化版），并解释字段含义

【输出格式】
- 先给出“项目概述”和“关键决策说明”
- 再给出“文件树”
- 再按文件逐段输出代码（每个文件用清晰标题分隔）
- 最后给出“本地运行步骤”“Docker 部署步骤”“测试/QA 清单”