本篇整理 8 条“音频处理”方向的在线工具生成型 AI 提示词(Prompts)。每条提示词都要求产出可运行项目(含源码/文件结构/命令/部署/测试或QA),并且工具本身必须提供“一键输出 HTML”的交付能力(生成单文件HTML或最小包含 index.html 的可运行包)。
播客去噪与响度校准台
用于把多段录音批量去噪、压限并对齐到目标响度(如 -16 LUFS),并生成可交付的处理报告页。
提示词 (Prompts):
请你用中文完成一个“播客去噪与响度校准台”的在线工具项目,要求:
1)技术栈:Vite + React + Type ,音频处理使用 WebAudio(如 AudioWorklet / OfflineAudioContext),不依赖付费服务;允许使用开源库但要写明版本与用途。
2)功能:支持拖拽导入多个音频文件(wav/mp3/ogg),为每个文件做去噪(可选:降噪强度)、响度标准化(目标 LUFS 可调)、峰值限制(True Peak 可调),并支持分段试听(A/B 对比:原始 vs 处理后)。
3)一键输出 HTML:工具必须提供一个按钮“生成交付HTML”,点击后生成一个可直接双击打开的单文件 HTML(内嵌 CSS/JS),其中包含:每个文件的处理参数、波形缩略图、响度/峰值指标、试听控件、以及可下载的处理后音频(可用 64 或 Blob URL 方案,需解释限制与体积策略)。
4)交付物:请输出完整文件树,并逐文件给出源码;同时给出本地运行命令、生产构建命令、以及静态部署到 Nginx/Netlify 的说明。
5)测试/QA:至少给出 8 条 QA checklist(含:不同格式导入、极短音频、双声道/单声道、处理后削波检查、无权限麦克风模式、Safari/Chrome 兼容、导出HTML打开离线可用、内存占用观察)。
6)你的最终回答必须直接给出可用的 HTML 代码作为交付物示例:提供一个最小可运行的 index.html(哪怕是简化版),确保复制保存后即可打开看到界面。
会议录音说话人分段与时间轴标注器
把会议录音按说话人或静音区间切分,生成可编辑时间轴,并导出交付页便于审阅。
提示词 (Prompts):
请你用中文完成一个“会议录音分段与时间轴标注器”的在线工具。
1)技术栈:Next.js(App Router)+ Type ,UI 可用 Tailwind;音频分析用 WebAudio + 简单能量阈值/VAD(无需云端)。
2)功能:上传单个长音频后,自动识别静音区间并生成建议切点;用户可拖动调整切点、为每段添加标签(例如 议题/决策/待办),支持快捷键播放与跳转。
3)一键输出 HTML:一键生成离线可打开的HTML交付页(单文件),内含时间轴、每段标签、播放控件、以及可复制的“段落摘要模板”。
4)交付物:输出完整项目代码与文件树;提供 dev/build/start 命令;提供部署到 Vercel 的步骤;提供数据本地存储方案(IndexedDB)说明。
5)测试/QA:至少 6 条(含:2小时长音频性能、静音阈值边界、切点拖动精度、导出HTML离线打开、刷新后数据保留、移动端触控)。
6)请直接给出可运行的HTML源码示例(index.html),演示一条时间轴与标注的渲染。
音频批量转码与元数据清洗工具
批量将音频转为统一格式/码率,并清理或重写 ID3/标签字段,输出交付清单。
提示词 (Prompts):
请你用中文生成一个“音频批量转码与元数据清洗”的在线工具项目。
1)技术栈:Electron + Vite + React + Type ;转码使用内置 ffmpeg.wasm(或等价开源 wasm 方案),要求说明体积与性能取舍。
2)功能:批量导入文件,选择目标格式(mp3/aac/ogg/wav)、采样率、码率;支持读取/编辑元数据(标题/作者/专辑/封面),提供一键清空敏感字段。
3)一键输出 HTML:导出一个单文件HTML“交付报告”,列出每个文件的原始参数、目标参数、处理结果、失败原因、以及可下载链接说明(若受限于本地文件路径,需提供可行的打包策略)。
4)交付物:输出文件树与全部源码;提供打包命令;提供 Windows/macOS 安装包构建说明。
5)测试/QA:至少 7 条(含:中文元数据、超长文件名、封面写入、批量失败重试、不同采样率、导出报告可打开、断电/重启恢复任务)。
6)请直接给出一个可运行的 HTML 源码(index.html)展示报告列表布局。
音频响度一致性检查与修复助手
用可视化方式对比多段音频的响度/峰值差异,并生成修复建议与可交付报告。
提示词 (Prompts):
请用中文写一个“音频响度一致性检查与修复助手”的在线工具。
1)技术栈:SvelteKit + Type ;音频指标计算用 WebAudio(RMS、峰值、简化LUFS近似或基于开源实现)。
2)功能:多文件导入后,自动计算响度、峰值、动态范围,给出“目标修复动作”(增益/压缩/限制器建议),并允许一键应用修复生成新文件。
3)一键输出 HTML:生成离线HTML报告(单文件),包含各文件指标表、图表(柱状/雷达任选)、修复前后对比,以及“复核清单”。
4)交付物:输出完整源码与文件树;给出运行/构建/部署;写明浏览器权限与本地处理限制。
5)测试/QA:至少 6 条(含:多文件排序、极低音量文件、削波检测、应用修复后差值验证、导出HTML离线可用、不同浏览器解码差异)。
6)请直接输出一个可用的 index.html(简化版也可)展示指标表+图表。
音频波形对齐与口播剪辑点建议器
对两段口播(或口播+BGM)做对齐分析,给出建议剪辑点,并生成交付页方便复核。
提示词 (Prompts):
请用中文实现一个“音频波形对齐与剪辑点建议器”的在线工具。
1)技术栈:Vite + Vue3 + Type ;波形渲染可用 Canvas;对齐算法可用互相关/峰值匹配等简单方法并解释。
2)功能:导入两条音频后可视化波形,自动估计时间偏移并一键对齐;提供剪辑点建议(例如静音处/能量突变处);支持导出 EDL/CSV。
3)一键输出 HTML:一键生成包含波形截图、偏移量、剪辑点列表的单文件HTML交付页,支持离线打开。
4)交付物:给出文件树、源码、命令、部署说明;提供至少 5 条 QA(含:不同采样率、长音频性能、波形缩放、剪辑点编辑、导出HTML离线打开)。
5)请直接给出一个可用 index.html(包含简易波形渲染与列表)。
音频字幕时间轴校对台
把现成字幕(SRT/VTT)与音频对齐校对,批量修正时间轴偏移,并输出交付页。
提示词 (Prompts):
请用中文生成一个“音频字幕时间轴校对台”在线工具。
1)技术栈:React + Type (任意构建工具),字幕解析自己实现(SRT/VTT),音频播放用 WebAudio/HTMLAudio。
2)功能:导入音频 + 字幕文件,支持整体偏移、分段微调、快捷键逐条播放与对齐;支持预览字幕与音频同步效果。
3)一键输出 HTML:导出单文件HTML交付页,包含:字幕列表、每条的播放跳转按钮、修改记录、以及最终字幕文件内容(可复制)。
4)交付物:输出文件树与源码、命令、部署;至少 6 条 QA(含:不同编码、长字幕、偏移回滚、导出HTML离线打开、移动端触控、性能)。
5)请直接输出一个可运行的 index.html 示例,展示字幕列表与播放跳转。
音频批处理任务队列与失败重试面板
把多种处理步骤串成可视化流水线,支持暂停/继续/重试,并导出交付报告。
提示词 (Prompts):
请用中文写一个“音频批处理任务队列面板”的在线工具项目。
1)技术栈:Node.js + Express(或 Fastify)+ 前端任意框架;处理步骤可用 ffmpeg.wasm 或 WebAudio(按你选型说明)。
2)功能:用户上传多个文件后,可配置流水线步骤(去噪/标准化/切分/转码),展示队列进度、失败原因、重试、断点续跑;结果可批量下载。
3)一键输出 HTML:生成单文件HTML交付报告,包含任务配置、每个文件的处理链、日志摘要、失败重试记录、以及复核清单。
4)交付物:输出完整源码与文件树;给出运行命令;写明本地存储目录与安全注意事项;提供 Dockerfile + 一键启动 docker compose。
5)测试/QA:至少 8 条(含:并发限制、失败重试、断点续跑、不同格式、超大文件、日志查看、导出HTML离线可用、权限与路径安全)。
6)请直接提供一个可用的 index.html(简化版)用于报告页的静态展示。
音频采样率与声道一致性检查器
用于在交付前做批量质检:采样率、位深、声道布局、时长、峰值等,并输出统一报告。
提示词 (Prompts):
请用中文实现一个“音频一致性检查器”的在线工具。
1)技术栈:纯前端(不需要后端),Type + 任意轻量框架;音频解码与指标读取用 WebAudio。
2)功能:批量导入音频后,检测采样率/声道数/时长/峰值/静音比例,支持按规则高亮异常,并允许导出 CSV。
3)一键输出 HTML:生成单文件HTML质检报告(离线可打开),包含规则配置、结果表格、异常说明与建议修复动作。
4)交付物:输出文件树与源码;给出运行/构建/部署;至少 6 条 QA(含:不同格式、极短音频、双声道检测、异常规则、导出HTML离线打开、导出CSV)。
5)请直接输出一个可用的 index.html 示例,展示规则区+结果表。