下面是一组围绕“音频批量处理 + 在线预览 + 一键导出HTML交付”的中文 AI 提示词(Prompts)。每条 Prompt 都要求生成一个可运行的在线工具项目,包含完整源码、文件树、运行命令、部署说明与测试/QA清单,并且必须支持一键导出可直接打开的 HTML(单文件或包含 index.html 的最小包)。
音频批量切分 + 静音检测 + 一键导出HTML播放清单工具
用于把一批长音频按静音或时间规则自动切段,并生成可分享的离线HTML播放清单(含段落标题、起止时间与备注)。
中文 Prompt:
你是一名资深前端工程师与音频工具作者。请用中文输出一个“在线音频批量切分 + 静音检测 + HTML交付”工具的完整可运行项目。
目标:用户在浏览器中导入多个音频文件(mp3/wav/m4a/ogg),工具自动进行静音检测(可调阈值、最短静音时长、最短片段时长),生成切分片段列表;用户可逐段试听、重命名标题、微调起止时间、加备注;最后一键导出一个可离线打开的 HTML 播放清单(单文件 HTML,内嵌必要 CSS/JS,并把音频片段以 64 或 Blob URL 方式嵌入/打包;若单文件太大则改为导出 zip,必须包含 index.html 且可直接打开)。
硬性要求:
1) 交付物必须包含:完整项目源码、文件树、依赖说明、本地运行命令、生产构建命令、部署到 Netlify/Vercel 的步骤。
2) 必须给出至少 8 条测试用例或 QA checklist(覆盖:不同格式导入、静音阈值边界、超长文件、中文文件名、导出后离线可用、移动端兼容、错误提示、性能)。
3) 技术栈建议:Vite + React(或原生 TS 也可),音频解析用 WebAudio API;静音检测算法需解释(如 RMS/峰值计算、窗口大小、平滑)。
4) UI 需要:批量导入、参数面板、片段列表(排序/搜索)、试听播放器、导出按钮、导出前自检(是否所有片段有标题)。
5) 禁止引导生成任何“图片/插画/海报/渲染图”。
请按以下结构输出:
A. 项目简介(1段)
B. 文件树(逐行)
C. 关键实现说明(静音检测、切分、导出HTML/zip 的实现思路)
D. 完整源码(逐文件给出)
E. 运行与部署(命令 + 环境要求)
F. 测试用例/QA checklist(至少8条)
中文释义: 让 AI 生成一个浏览器端音频批量切分工具,核心是静音检测+可编辑片段列表,最终可一键导出离线可用的 HTML 播放清单作为交付物。
音频降噪与响度归一在线工具 + 一键导出HTML处理报告
用于对语音录音做降噪、响度归一、削波保护,并输出对比试听与处理参数报告(可离线HTML)。
中文 Prompt:
请用中文生成一个可运行的“在线音频降噪 + 响度归一 + 对比试听 + HTML报告导出”工具项目。
功能要求:
- 导入单个或多个音频文件,展示波形/能量概览(用 Canvas 绘制即可,不是生成图片艺术作品)。
- 提供可调的降噪与语音增强参数:噪声门限、谱减强度、平滑、保留人声频段;提供响度归一(目标 LUFS 或 RMS)、峰值限制(True Peak 近似)。
- 处理在浏览器端完成:优先用 WebAudio API + 自实现滤波/谱处理;如必须用 ffmpeg.wasm,也要说明体积与性能权衡,并提供“低配模式”(只做门限+压缩+归一)。
- 处理前后 A/B 对比试听,支持一键导出处理后的音频文件。
- 关键:必须支持“一键导出 HTML 处理报告”:报告里要包含每个文件的处理参数、处理前后峰值/RMS/时长、以及可离线播放的对比音频(单文件HTML或 zip/index.html)。
交付物要求:
1) 输出完整项目代码与文件树。
2) 给出本地运行与构建命令,以及部署到静态站点的步骤。
3) 给出至少 10 条测试/QA(包括:大文件、Safari 兼容、导出可离线打开、参数极端值、错误提示、处理耗时提示、内存占用)。
输出结构:简介、文件树、实现说明、完整源码、命令与部署、测试/QA。
中文释义: 让 AI 产出一个在线语音优化工具,既能在网页端处理音频,也能把“处理结果+报告+可离线试听页面”当作可交付成果一键导出。
播客章节点编辑器:时间轴标注 + 一键导出HTML章节播放器
用于给长音频打章节点(Chapter Marks),生成可复制到播客平台的章节列表,并导出离线HTML章节播放器。
中文 Prompt:
请用中文写一个“播客章节点编辑器(Chapter Marks)”在线工具的完整项目。
需求:
- 用户导入一段长音频;播放器支持快进/回退、变速、波形/进度条。
- 用户在当前播放位置一键添加章节点,填写章节标题、简介、关键词;支持拖拽调整时间点。
- 支持导出:
1) 纯文本章节清单(含时间码,适配常见播客平台格式)
2) JSON 章节数据
3) “一键导出离线HTML章节播放器”:导出一个可直接打开的 HTML(单文件或 zip/index.html),内嵌音频与章节数据,打开后可直接播放并跳转章节。
交付物:
- 必须给出文件树、完整源码、运行命令、构建命令、部署说明。
- 至少 8 条测试/QA(含:不同编码、中文标题、拖拽精度、导出后离线打开、移动端触控、键盘快捷键、异常文件处理)。
约束:Prompt 全文用中文;不要涉及任何生成图片/插画/海报/渲染图。
中文释义: 让 AI 生成一个专注“章节点标注”的在线工具,最终可导出离线章节播放器 HTML,方便直接交付给客户或团队审阅。
音频批量转码 + 元数据校验 + 一键导出HTML清单
用于批量把音频转为目标格式/码率,同时校验元数据(时长、采样率、声道、比特率),最后导出可分享的HTML资产清单。
中文 Prompt:
请用中文生成一个“在线音频批量转码与元数据校验”工具项目,要求可运行、可构建、可部署。
功能:
- 批量导入音频文件。
- 读取并展示元数据:时长、采样率、声道数、估算码率、峰值/RMS(可选)。
- 转码:支持输出 mp3(指定码率)、wav(指定采样率/位深)、ogg;可选择保持/转换为单声道。
- 转码实现:优先 ffmpeg.wasm(说明加载与缓存策略),并提供“仅校验不转码”模式。
- 导出:
1) 批量下载转码结果(zip)
2) 导出校验报告(JSON/CSV)
3) 关键:一键导出 HTML 资产清单(单文件HTML或 zip/index.html),包含每个文件的元数据表格、下载链接(离线模式下指向内嵌Blob/本地文件)、以及错误/警告汇总。
交付物:完整源码+文件树+命令+部署说明。
测试/QA:至少 10 条,覆盖:格式兼容、转码失败提示、浏览器内存限制、并发队列、导出HTML离线可用、中文文件名、zip内容结构正确。
请按:简介、文件树、实现要点(转码队列/worker/进度)、完整源码、运行与部署、测试清单 输出。
中文释义: 让 AI 生成一个“批量转码+质量校验+交付清单”的在线工具,并把 HTML 清单作为可交付成果一键导出。
配音对齐与台词校对:文本-音频时间码标注 + 一键导出HTML审阅页
用于把台词文本分句后进行半自动时间码标注(手动对齐为主),导出可离线审阅的HTML页面(点句播放)。
中文 Prompt:
请用中文输出一个“文本-音频对齐与台词校对”在线工具的完整项目源码。
功能:
- 导入一段音频 + 粘贴台词文本(支持按标点自动分句)。
- 提供对齐工作流:播放音频时,用户可为当前句设置起止时间(按钮或快捷键),并可微调。
- 支持校对:对每句添加状态(OK/需重录/疑似口误)、备注。
- 一键导出:
1) JSON(含每句起止时间、文本、状态、备注)
2) SRT/WEBVTT(可选)
3) 关键:导出离线HTML审阅页(单文件或 zip/index.html),打开后可点击每句直接跳转播放对应区间,并展示校对状态统计。
实现要求:
- 前端用 Type (框架不限),音频播放用 WebAudio 或 audio 标签 + 时间控制;区间播放要处理精度与暂停。
- 必须提供文件树、完整源码、运行/构建/部署命令。
- 至少 8 条测试/QA(含:快捷键、分句规则、导出后离线可用、长文本性能、移动端可用性、区间边界、异常输入提示)。
注意:禁止任何图像生成导向内容。Prompt 必须全中文。
中文释义: 让 AI 生成一个“台词校对+时间码标注”的在线工具,并可导出离线可审阅的 HTML 页面用于交付与沟通。
音频重复片段检测:相似度扫描 + 一键导出HTML标记报告
用于检测录音里可能重复/回声/重复口误段落,输出相似度时间段列表,并导出可离线查看的HTML标记报告。
中文 Prompt:
请用中文生成一个“音频重复片段检测与标记”在线工具项目(可运行/可构建/可部署)。
功能:
- 导入一段音频。
- 计算音频的特征(例如短时能量+谱特征/简化MFCC)并做相似度扫描,找出可能重复的时间段对(A段与B段相似)。
- UI:相似片段列表(显示起止时间、相似度分数、原因提示),点击可跳转试听 A/B;支持手动标记“确认重复/忽略”。
- 导出:
1) JSON 报告
2) 关键:一键导出离线HTML报告(单文件或 zip/index.html),包含可交互的片段表格与试听(音频内嵌/打包),并附上算法参数与限制说明。
实现要求:
- 解释特征提取与相似度计算方法,提供性能优化(分块、Web Worker)。
- 给出完整文件树、源码、运行与部署命令。
- 至少 10 条测试/QA(含:不同采样率、超长音频、误报/漏报说明、导出离线可用、Worker兼容、边界条件)。
约束:不要包含任何生成图片/渲染图/海报类内容;Prompt 全文中文。
中文释义: 让 AI 产出一个可解释的“重复片段检测”在线工具,并把交互报告页面当作可交付成果一键导出。
音频批量响度检测与合规检查:规范阈值 + 一键导出HTML验收报告
用于对一批音频做响度/峰值/动态范围检查,生成合规结论与建议,并导出离线HTML验收报告。
中文 Prompt:
请用中文生成一个“音频批量响度检测与合规检查”在线工具项目。
功能:
- 批量导入音频,计算并展示:时长、峰值、RMS、近似 LUFS(可说明近似算法)、动态范围指标。
- 用户可选择合规标准模板(例如:播客发布建议、短视频平台建议、内部验收阈值),每个模板包含目标范围与警戒阈值。
- 输出每个文件的结论:通过/需调整,并给出建议(例如“建议归一到 -16 LUFS,峰值限制 -1 dB”)。
- 关键:一键导出 HTML 验收报告(单文件或 zip/index.html),报告包含:汇总表、每个文件的指标卡片、结论与建议、以及可离线试听样本(可选抽取前10秒作为示例,说明这只是截取而非生成)。
交付物:必须包含完整源码、文件树、运行/构建/部署命令。
测试/QA:至少 12 条(含:并发处理队列、计算一致性、阈值边界、导出离线打开、中文文件名、错误提示、移动端、性能)。
约束:不要引导生成图片/插画/渲染图;Prompt 全中文。
中文释义: 让 AI 生成一个“批量验收/合规报告”在线工具,把 HTML 报告作为最终交付物,便于直接预览与交付。