使用说明(适用范围:音频处理)
下面每条提示词都用于让 AI 直接产出一个可运行/可构建/可部署的“在线音频工具”。每个工具都要求输出完整项目代码、文件结构、运行命令、部署说明,并自带至少 5 条测试用例或 QA checklist。同时,工具内必须提供“一键生成可直接打开的 HTML 交付页(单文件 HTML 或包含 index.html 的最小包)”,用于预览与交付。
在线音频切分与章节标注工作台
面向播客/访谈/课程录音:上传音频后进行波形预览、自动切分建议、章节标注、时间轴对齐与导出。
提示词 (Prompts):
你是资深全栈工程师。请用中文输出一个可运行的“在线音频切分与章节标注工作台”完整项目代码。
硬性要求:
1) 技术栈:Vite + React + Type ;UI 用原生 CSS 或任意轻量组件库(不强制)。
2) 音频处理:优先使用 WebAudio API;如需要转码/导出,使用 ffmpeg.wasm(给出按需加载策略与性能提示)。
3) 交付物必须包含:
- 完整文件树
- 所有源代码(可直接复制粘贴)
- 本地运行命令(npm s)
- 生产构建命令
- 部署说明(静态站点部署到任意对象存储/Pages;可选提供 Dockerfile)
- 至少 8 条 QA checklist(覆盖:大文件、不同采样率、移动端、权限、失败重试、导出一致性等)
4) 功能清单:
- 上传/拖拽音频(mp3/wav/m4a/ogg)并显示基本信息(时长、采样率、声道、比特率估算)
- 波形可视化 + 时间轴缩放/平移
- 章节标注:在时间轴上添加/编辑/删除章节(标题、开始时间、可选备注)
- 自动切分建议:基于静音检测给出切分点候选(阈值、最短静音时长可调)
- 片段试听:点击章节可从对应时间点播放
- 导出:导出章节清单(JSON/CSV)
- 一键生成 HTML 交付页:生成一个可直接打开的 report.html,包含:项目标题、音频信息、章节表格、每章的起止时间、静音检测参数、以及波形截图(从 canvas 导出 dataURL 嵌入)。report.html 必须是单文件可离线打开。
实现细节:
- 不依赖任何云端 API;所有处理在浏览器本地完成。
- 解释你选择的波形绘制方案(Canvas)与性能优化(离屏绘制/抽样)。
- 给出关键算法:静音检测(RMS/能量阈值)与切分点合并策略。
最后请输出一个“快速自测清单”,用户按步骤 1-8 就能验证核心功能。
主要用途: 快速把长音频按章节结构拆解,生成可交付的章节报告与配置,适合播客剪辑、课程拆条、采访整理。
在线响度归一与峰值保护批处理器
将多段音频批量归一到目标响度(例如 -16 LUFS),并限制真峰值,避免播客平台音量忽大忽小。
提示词 (Prompts):
请用中文生成一个“在线响度归一与峰值保护批处理器”项目(Vite + React + TS)。
功能要求:
- 支持多文件批量导入;显示队列与每个文件的处理状态
- 计算音频的近似响度(解释近似算法:短时 RMS + K-weighting 可选;如不实现完整 LUFS,也要说明差异与风险)
- 让用户设置:目标响度、最大真峰值、压缩/限制器开关、输出格式(wav/mp3)
- 输出:可下载处理后的音频(如浏览器内无法直接编码 mp3,给出 wav 输出与可选 ffmpeg.wasm 编码方案)
- 一键生成 HTML 交付页:生成 report.html,包含每个文件的输入/输出参数、响度估算、峰值统计、处理时间、以及下载链接占位(若无法内嵌音频,则用说明)。
交付物要求:文件树 + 全部代码 + 运行/构建/部署 + 至少 6 条测试用例/QA。
主要用途: 统一音量标准、减少返工,适合播客批量处理、课程音频上架前的音量校正。
在线音频去噪与人声增强台
针对环境底噪、风噪或空调声,提供可控的去噪强度与人声增强,便于录音修复。
提示词 (Prompts):
请用中文生成一个“在线音频去噪与人声增强台”完整项目代码(Vite + React + TS)。
约束:
- 不调用任何外部在线服务;全部在浏览器本地处理。
- 去噪方案可以选择:
A) 频谱门限(谱减法)+ 平滑
B) 轻量滤波链(高通/低通/带通 + 动态范围压缩)
你必须实现其中一种,并解释原理与局限。
功能:
- 上传音频后提供 A/B 对比试听(原始 vs 处理后)
- 参数面板(去噪强度、门限、平滑、EQ、人声增强开关等)
- 导出处理后音频(优先 wav;可选 ffmpeg.wasm 转码)
- 一键生成 HTML 交付页:report.html 记录参数、处理前后关键统计(RMS/峰值/频段能量概览),并附带“参数复现说明”。
交付物:文件树 + 全部源码 + 运行命令 + 部署说明 + 至少 6 条 QA checklist(包含:不同噪声类型、失真、爆音、极短音频、移动端内存等)。
主要用途: 快速修复录音质量,提高可听性,适合远程会议录音、采访录音、课程录制。
在线字幕时间轴对齐与分段器(基于音频)
给定一份粗略字幕(SRT/VTT)和音频,辅助校对时间轴、分段与导出可发布的字幕文件。
提示词 (Prompts):
请用中文输出一个“在线字幕时间轴对齐与分段器”项目(Vite + React + TS)。
输入:音频文件 + 字幕文件(SRT/VTT)。
功能:
- 解析字幕,展示为可编辑表格(开始/结束/文本)
- 音频播放时高亮当前字幕;支持快捷键微调当前字幕的起止时间(例如 +/- 100ms)
- 提供“自动对齐建议”:可以用简单的能量峰值/静音边界来建议段落边界(不要求完美语音识别)
- 导出:SRT/VTT
- 一键生成 HTML 交付页:生成 report.html,包含字幕表格、关键变更记录(diff 摘要)、以及用于审阅的时间轴截图/统计。
交付物:完整文件树 + 全部源码 + 运行/构建/部署说明 + 至少 8 条 QA checklist(含:不同字幕编码、错序行、重叠时间段、长文本、快捷键冲突)。
主要用途: 提升字幕校对效率,适合播客视频化、课程剪辑、采访内容发布。
在线片头片尾与淡入淡出批量拼接器
把固定片头/片尾与多段主体音频批量拼接,并自动加淡入淡出,适合系列节目批量制作。
提示词 (Prompts):
请用中文生成一个“在线片头片尾与淡入淡出批量拼接器”项目(Vite + React + TS)。
功能要求:
- 导入:片头、片尾、主体音频(可多文件)
- 参数:淡入淡出时长、拼接策略(片头+主体+片尾 / 仅片头+主体 / 主体+片尾)、输出格式
- 预览:对任意一个任务可试听拼接结果
- 输出:批量下载结果(如无法一次性打包,提供逐个下载;可选 zip 打包方案)
- 一键生成 HTML 交付页:report.html 列出每个任务的拼接参数、输入文件名、输出文件名、处理耗时、以及用于复核的波形截图。
交付物:文件树 + 全部源码 + 运行/构建/部署 + 至少 6 条测试用例/QA(含:采样率不同、声道不同、极短片头、无片尾、文件名含中文)。
主要用途: 批量生成标准化节目音频,减少重复操作,适合播客栏目、课程系列、音频专栏。
在线音频元数据与封面批量校验台
对音频文件的标签信息进行批量检查与修正建议(标题、作者、专辑、封面),并输出可交付报告。
提示词 (Prompts):
请用中文输出一个“在线音频元数据与封面批量校验台”项目(Vite + React + TS)。
要求:
- 支持导入多文件(mp3/m4a)并解析常见标签(ID3/MP4 tags)。
- 列表展示:标题/艺术家/专辑/年份/曲目号/封面存在与尺寸估计。
- 提供“规则校验”:缺失字段、非法字符、超长字段、封面过大/过小提示。
- 允许导出校验报告(JSON/CSV)。
- 一键生成 HTML 交付页:report.html 包含一张总览表、问题统计(按规则分组)、以及每个文件的问题详情。
交付物:完整文件树 + 全部源码 + 运行/构建/部署 + 至少 8 条 QA checklist(含:无标签文件、乱码、嵌入封面过大、不同编码)。
注意:不要涉及任何“生成图片/出图”能力,只做封面读取与校验。
主要用途: 上架前批量检查音频元数据,适合播客分发、音频课程发布、素材库管理。
在线音频静音段检测与删减建议器
快速识别长静音、停顿与疑似空录段,生成删减建议清单与可交付审阅页。
提示词 (Prompts):
请用中文生成一个“在线音频静音段检测与删减建议器”项目(Vite + React + TS)。
功能:
- 上传音频并计算能量曲线
- 让用户设置:静音阈值、最短静音时长、合并间隔
- 输出:静音段列表(开始/结束/时长/建议动作:删除/保留/人工复核)
- 试听:点击列表可从静音段前后 2 秒开始播放,便于判断
- 一键生成 HTML 交付页:report.html 包含参数、静音段表格、以及“复核快捷键说明”。
交付物:文件树 + 全部源码 + 运行/构建/部署 + 至少 6 条测试用例/QA(含:背景噪声导致误判、爆音、全程很安静、立体声/单声道)。
主要用途: 减少剪辑中寻找空段的时间,适合会议录音、播客剪辑、课程后期。
在线音频审阅与批注汇总页生成器
把多位审阅者的批注(时间点 + 备注)汇总成一个可离线打开的 HTML 审阅页,便于交付与确认。
提示词 (Prompts):
请用中文输出一个“在线音频审阅与批注汇总页生成器”项目(Vite + React + TS)。
输入:
- 音频文件
- 批注数据(支持粘贴 JSON 或导入 CSV:time,author,note,priority)
功能:
- 播放音频时同步滚动到当前批注
- 批注筛选(按作者/优先级/关键词)
- 批注编辑与导出
- 一键生成 HTML 交付页:生成一个单文件 review.html,内嵌批注数据与必要脚本,打开即可审阅(音频不强制内嵌,可给出“将音频放在同目录”的离线说明)。
交付物:完整文件树 + 全部源码 + 运行/构建/部署 + 至少 8 条 QA checklist(含:批注时间越界、不同时间格式、超长备注、移动端播放限制)。
主要用途: 音频内容交付审阅与返工沟通,适合客户审片、内部校对、外包协作。