音频处理播客切分与章节标注工作台 AI 提示词 (Prompts)

使用说明（适用范围：音频处理）

下面每条提示词都用于让 AI 直接产出一个可运行/可构建/可部署的“在线音频工具”。每个工具都要求输出完整项目代码、文件结构、运行命令、部署说明，并自带至少 5 条测试用例或 QA checklist。同时，工具内必须提供“一键生成可直接打开的 HTML 交付页（单文件 HTML 或包含 index.html 的最小包）”，用于预览与交付。

在线音频切分与章节标注工作台

面向播客/访谈/课程录音：上传音频后进行波形预览、自动切分建议、章节标注、时间轴对齐与导出。

提示词 (Prompts):

你是资深全栈工程师。请用中文输出一个可运行的“在线音频切分与章节标注工作台”完整项目代码。

硬性要求：
1) 技术栈：Vite + React + Type ；UI 用原生 CSS 或任意轻量组件库（不强制）。
2) 音频处理：优先使用 WebAudio API；如需要转码/导出，使用 ffmpeg.wasm（给出按需加载策略与性能提示）。
3) 交付物必须包含：
- 完整文件树
- 所有源代码（可直接复制粘贴）
- 本地运行命令（npm  s）
- 生产构建命令
- 部署说明（静态站点部署到任意对象存储/Pages；可选提供 Dockerfile）
- 至少 8 条 QA checklist（覆盖：大文件、不同采样率、移动端、权限、失败重试、导出一致性等）
4) 功能清单：
- 上传/拖拽音频（mp3/wav/m4a/ogg）并显示基本信息（时长、采样率、声道、比特率估算）
- 波形可视化 + 时间轴缩放/平移
- 章节标注：在时间轴上添加/编辑/删除章节（标题、开始时间、可选备注）
- 自动切分建议：基于静音检测给出切分点候选（阈值、最短静音时长可调）
- 片段试听：点击章节可从对应时间点播放
- 导出：导出章节清单（JSON/CSV）
- 一键生成 HTML 交付页：生成一个可直接打开的 report.html，包含：项目标题、音频信息、章节表格、每章的起止时间、静音检测参数、以及波形截图（从 canvas 导出 dataURL 嵌入）。report.html 必须是单文件可离线打开。

实现细节：
- 不依赖任何云端 API；所有处理在浏览器本地完成。
- 解释你选择的波形绘制方案（Canvas）与性能优化（离屏绘制/抽样）。
- 给出关键算法：静音检测（RMS/能量阈值）与切分点合并策略。

最后请输出一个“快速自测清单”，用户按步骤 1-8 就能验证核心功能。

主要用途: 快速把长音频按章节结构拆解，生成可交付的章节报告与配置，适合播客剪辑、课程拆条、采访整理。

在线响度归一与峰值保护批处理器

将多段音频批量归一到目标响度（例如 -16 LUFS），并限制真峰值，避免播客平台音量忽大忽小。

提示词 (Prompts):

请用中文生成一个“在线响度归一与峰值保护批处理器”项目（Vite + React + TS）。

功能要求：
- 支持多文件批量导入；显示队列与每个文件的处理状态
- 计算音频的近似响度（解释近似算法：短时 RMS + K-weighting 可选；如不实现完整 LUFS，也要说明差异与风险）
- 让用户设置：目标响度、最大真峰值、压缩/限制器开关、输出格式（wav/mp3）
- 输出：可下载处理后的音频（如浏览器内无法直接编码 mp3，给出 wav 输出与可选 ffmpeg.wasm 编码方案）
- 一键生成 HTML 交付页：生成 report.html，包含每个文件的输入/输出参数、响度估算、峰值统计、处理时间、以及下载链接占位（若无法内嵌音频，则用说明）。

交付物要求：文件树 + 全部代码 + 运行/构建/部署 + 至少 6 条测试用例/QA。

主要用途: 统一音量标准、减少返工，适合播客批量处理、课程音频上架前的音量校正。

在线音频去噪与人声增强台

针对环境底噪、风噪或空调声，提供可控的去噪强度与人声增强，便于录音修复。

提示词 (Prompts):

请用中文生成一个“在线音频去噪与人声增强台”完整项目代码（Vite + React + TS）。

约束：
- 不调用任何外部在线服务；全部在浏览器本地处理。
- 去噪方案可以选择：
  A) 频谱门限（谱减法）+ 平滑
  B) 轻量滤波链（高通/低通/带通 + 动态范围压缩）
  你必须实现其中一种，并解释原理与局限。

功能：
- 上传音频后提供 A/B 对比试听（原始 vs 处理后）
- 参数面板（去噪强度、门限、平滑、EQ、人声增强开关等）
- 导出处理后音频（优先 wav；可选 ffmpeg.wasm 转码）
- 一键生成 HTML 交付页：report.html 记录参数、处理前后关键统计（RMS/峰值/频段能量概览），并附带“参数复现说明”。

交付物：文件树 + 全部源码 + 运行命令 + 部署说明 + 至少 6 条 QA checklist（包含：不同噪声类型、失真、爆音、极短音频、移动端内存等）。

主要用途: 快速修复录音质量，提高可听性，适合远程会议录音、采访录音、课程录制。

在线字幕时间轴对齐与分段器（基于音频）

给定一份粗略字幕（SRT/VTT）和音频，辅助校对时间轴、分段与导出可发布的字幕文件。

提示词 (Prompts):

请用中文输出一个“在线字幕时间轴对齐与分段器”项目（Vite + React + TS）。

输入：音频文件 + 字幕文件（SRT/VTT）。
功能：
- 解析字幕，展示为可编辑表格（开始/结束/文本）
- 音频播放时高亮当前字幕；支持快捷键微调当前字幕的起止时间（例如 +/- 100ms）
- 提供“自动对齐建议”：可以用简单的能量峰值/静音边界来建议段落边界（不要求完美语音识别）
- 导出：SRT/VTT
- 一键生成 HTML 交付页：生成 report.html，包含字幕表格、关键变更记录（diff 摘要）、以及用于审阅的时间轴截图/统计。

交付物：完整文件树 + 全部源码 + 运行/构建/部署说明 + 至少 8 条 QA checklist（含：不同字幕编码、错序行、重叠时间段、长文本、快捷键冲突）。

主要用途: 提升字幕校对效率，适合播客视频化、课程剪辑、采访内容发布。

在线片头片尾与淡入淡出批量拼接器

把固定片头/片尾与多段主体音频批量拼接，并自动加淡入淡出，适合系列节目批量制作。

提示词 (Prompts):

请用中文生成一个“在线片头片尾与淡入淡出批量拼接器”项目（Vite + React + TS）。

功能要求：
- 导入：片头、片尾、主体音频（可多文件）
- 参数：淡入淡出时长、拼接策略（片头+主体+片尾 / 仅片头+主体 / 主体+片尾）、输出格式
- 预览：对任意一个任务可试听拼接结果
- 输出：批量下载结果（如无法一次性打包，提供逐个下载；可选 zip 打包方案）
- 一键生成 HTML 交付页：report.html 列出每个任务的拼接参数、输入文件名、输出文件名、处理耗时、以及用于复核的波形截图。

交付物：文件树 + 全部源码 + 运行/构建/部署 + 至少 6 条测试用例/QA（含：采样率不同、声道不同、极短片头、无片尾、文件名含中文）。

主要用途: 批量生成标准化节目音频，减少重复操作，适合播客栏目、课程系列、音频专栏。

在线音频元数据与封面批量校验台

对音频文件的标签信息进行批量检查与修正建议（标题、作者、专辑、封面），并输出可交付报告。

提示词 (Prompts):

请用中文输出一个“在线音频元数据与封面批量校验台”项目（Vite + React + TS）。

要求：
- 支持导入多文件（mp3/m4a）并解析常见标签（ID3/MP4 tags）。
- 列表展示：标题/艺术家/专辑/年份/曲目号/封面存在与尺寸估计。
- 提供“规则校验”：缺失字段、非法字符、超长字段、封面过大/过小提示。
- 允许导出校验报告（JSON/CSV）。
- 一键生成 HTML 交付页：report.html 包含一张总览表、问题统计（按规则分组）、以及每个文件的问题详情。

交付物：完整文件树 + 全部源码 + 运行/构建/部署 + 至少 8 条 QA checklist（含：无标签文件、乱码、嵌入封面过大、不同编码）。

注意：不要涉及任何“生成图片/出图”能力，只做封面读取与校验。

主要用途: 上架前批量检查音频元数据，适合播客分发、音频课程发布、素材库管理。

在线音频静音段检测与删减建议器

快速识别长静音、停顿与疑似空录段，生成删减建议清单与可交付审阅页。

提示词 (Prompts):

请用中文生成一个“在线音频静音段检测与删减建议器”项目（Vite + React + TS）。

功能：
- 上传音频并计算能量曲线
- 让用户设置：静音阈值、最短静音时长、合并间隔
- 输出：静音段列表（开始/结束/时长/建议动作：删除/保留/人工复核）
- 试听：点击列表可从静音段前后 2 秒开始播放，便于判断
- 一键生成 HTML 交付页：report.html 包含参数、静音段表格、以及“复核快捷键说明”。

交付物：文件树 + 全部源码 + 运行/构建/部署 + 至少 6 条测试用例/QA（含：背景噪声导致误判、爆音、全程很安静、立体声/单声道）。

主要用途: 减少剪辑中寻找空段的时间，适合会议录音、播客剪辑、课程后期。

在线音频审阅与批注汇总页生成器

把多位审阅者的批注（时间点 + 备注）汇总成一个可离线打开的 HTML 审阅页，便于交付与确认。

提示词 (Prompts):

请用中文输出一个“在线音频审阅与批注汇总页生成器”项目（Vite + React + TS）。

输入：
- 音频文件
- 批注数据（支持粘贴 JSON 或导入 CSV：time,author,note,priority）

功能：
- 播放音频时同步滚动到当前批注
- 批注筛选（按作者/优先级/关键词）
- 批注编辑与导出
- 一键生成 HTML 交付页：生成一个单文件 review.html，内嵌批注数据与必要脚本，打开即可审阅（音频不强制内嵌，可给出“将音频放在同目录”的离线说明）。

交付物：完整文件树 + 全部源码 + 运行/构建/部署 + 至少 8 条 QA checklist（含：批注时间越界、不同时间格式、超长备注、移动端播放限制）。

主要用途: 音频内容交付审阅与返工沟通，适合客户审片、内部校对、外包协作。