音频处理播客去噪与响度校准台 AI 提示词 (Prompts)

本篇整理 8 条“音频处理”方向的在线工具生成型 AI 提示词（Prompts）。每条提示词都要求产出可运行项目（含源码/文件结构/命令/部署/测试或QA），并且工具本身必须提供“一键输出 HTML”的交付能力（生成单文件HTML或最小包含 index.html 的可运行包）。

播客去噪与响度校准台

用于把多段录音批量去噪、压限并对齐到目标响度（如 -16 LUFS），并生成可交付的处理报告页。

提示词 (Prompts):

请你用中文完成一个“播客去噪与响度校准台”的在线工具项目，要求： 1）技术栈：Vite + React + Type ，音频处理使用 WebAudio（如 AudioWorklet / OfflineAudioContext），不依赖付费服务；允许使用开源库但要写明版本与用途。 2）功能：支持拖拽导入多个音频文件（wav/mp3/ogg），为每个文件做去噪（可选：降噪强度）、响度标准化（目标 LUFS 可调）、峰值限制（True Peak 可调），并支持分段试听（A/B 对比：原始 vs 处理后）。 3）一键输出 HTML：工具必须提供一个按钮“生成交付HTML”，点击后生成一个可直接双击打开的单文件 HTML（内嵌 CSS/JS），其中包含：每个文件的处理参数、波形缩略图、响度/峰值指标、试听控件、以及可下载的处理后音频（可用 64 或 Blob URL 方案，需解释限制与体积策略）。 4）交付物：请输出完整文件树，并逐文件给出源码；同时给出本地运行命令、生产构建命令、以及静态部署到 Nginx/Netlify 的说明。 5）测试/QA：至少给出 8 条 QA checklist（含：不同格式导入、极短音频、双声道/单声道、处理后削波检查、无权限麦克风模式、Safari/Chrome 兼容、导出HTML打开离线可用、内存占用观察）。 6）你的最终回答必须直接给出可用的 HTML 代码作为交付物示例：提供一个最小可运行的 index.html（哪怕是简化版），确保复制保存后即可打开看到界面。

会议录音说话人分段与时间轴标注器

把会议录音按说话人或静音区间切分，生成可编辑时间轴，并导出交付页便于审阅。

提示词 (Prompts):

请你用中文完成一个“会议录音分段与时间轴标注器”的在线工具。 1）技术栈：Next.js（App Router）+ Type ，UI 可用 Tailwind；音频分析用 WebAudio + 简单能量阈值/VAD（无需云端）。 2）功能：上传单个长音频后，自动识别静音区间并生成建议切点；用户可拖动调整切点、为每段添加标签（例如议题/决策/待办），支持快捷键播放与跳转。 3）一键输出 HTML：一键生成离线可打开的HTML交付页（单文件），内含时间轴、每段标签、播放控件、以及可复制的“段落摘要模板”。 4）交付物：输出完整项目代码与文件树；提供 dev/build/start 命令；提供部署到 Vercel 的步骤；提供数据本地存储方案（IndexedDB）说明。 5）测试/QA：至少 6 条（含：2小时长音频性能、静音阈值边界、切点拖动精度、导出HTML离线打开、刷新后数据保留、移动端触控）。 6）请直接给出可运行的HTML源码示例（index.html），演示一条时间轴与标注的渲染。

音频批量转码与元数据清洗工具

批量将音频转为统一格式/码率，并清理或重写 ID3/标签字段，输出交付清单。

提示词 (Prompts):

请你用中文生成一个“音频批量转码与元数据清洗”的在线工具项目。 1）技术栈：Electron + Vite + React + Type ；转码使用内置 ffmpeg.wasm（或等价开源 wasm 方案），要求说明体积与性能取舍。 2）功能：批量导入文件，选择目标格式（mp3/aac/ogg/wav）、采样率、码率；支持读取/编辑元数据（标题/作者/专辑/封面），提供一键清空敏感字段。 3）一键输出 HTML：导出一个单文件HTML“交付报告”，列出每个文件的原始参数、目标参数、处理结果、失败原因、以及可下载链接说明（若受限于本地文件路径，需提供可行的打包策略）。 4）交付物：输出文件树与全部源码；提供打包命令；提供 Windows/macOS 安装包构建说明。 5）测试/QA：至少 7 条（含：中文元数据、超长文件名、封面写入、批量失败重试、不同采样率、导出报告可打开、断电/重启恢复任务）。 6）请直接给出一个可运行的 HTML 源码（index.html）展示报告列表布局。

音频响度一致性检查与修复助手

用可视化方式对比多段音频的响度/峰值差异，并生成修复建议与可交付报告。

提示词 (Prompts):

请用中文写一个“音频响度一致性检查与修复助手”的在线工具。 1）技术栈：SvelteKit + Type ；音频指标计算用 WebAudio（RMS、峰值、简化LUFS近似或基于开源实现）。 2）功能：多文件导入后，自动计算响度、峰值、动态范围，给出“目标修复动作”（增益/压缩/限制器建议），并允许一键应用修复生成新文件。 3）一键输出 HTML：生成离线HTML报告（单文件），包含各文件指标表、图表（柱状/雷达任选）、修复前后对比，以及“复核清单”。 4）交付物：输出完整源码与文件树；给出运行/构建/部署；写明浏览器权限与本地处理限制。 5）测试/QA：至少 6 条（含：多文件排序、极低音量文件、削波检测、应用修复后差值验证、导出HTML离线可用、不同浏览器解码差异）。 6）请直接输出一个可用的 index.html（简化版也可）展示指标表+图表。

音频波形对齐与口播剪辑点建议器

对两段口播（或口播+BGM）做对齐分析，给出建议剪辑点，并生成交付页方便复核。

提示词 (Prompts):

请用中文实现一个“音频波形对齐与剪辑点建议器”的在线工具。 1）技术栈：Vite + Vue3 + Type ；波形渲染可用 Canvas；对齐算法可用互相关/峰值匹配等简单方法并解释。 2）功能：导入两条音频后可视化波形，自动估计时间偏移并一键对齐；提供剪辑点建议（例如静音处/能量突变处）；支持导出 EDL/CSV。 3）一键输出 HTML：一键生成包含波形截图、偏移量、剪辑点列表的单文件HTML交付页，支持离线打开。 4）交付物：给出文件树、源码、命令、部署说明；提供至少 5 条 QA（含：不同采样率、长音频性能、波形缩放、剪辑点编辑、导出HTML离线打开）。 5）请直接给出一个可用 index.html（包含简易波形渲染与列表）。

音频字幕时间轴校对台

把现成字幕（SRT/VTT）与音频对齐校对，批量修正时间轴偏移，并输出交付页。

提示词 (Prompts):

请用中文生成一个“音频字幕时间轴校对台”在线工具。 1）技术栈：React + Type （任意构建工具），字幕解析自己实现（SRT/VTT），音频播放用 WebAudio/HTMLAudio。 2）功能：导入音频 + 字幕文件，支持整体偏移、分段微调、快捷键逐条播放与对齐；支持预览字幕与音频同步效果。 3）一键输出 HTML：导出单文件HTML交付页，包含：字幕列表、每条的播放跳转按钮、修改记录、以及最终字幕文件内容（可复制）。 4）交付物：输出文件树与源码、命令、部署；至少 6 条 QA（含：不同编码、长字幕、偏移回滚、导出HTML离线打开、移动端触控、性能）。 5）请直接输出一个可运行的 index.html 示例，展示字幕列表与播放跳转。

音频批处理任务队列与失败重试面板

把多种处理步骤串成可视化流水线，支持暂停/继续/重试，并导出交付报告。

提示词 (Prompts):

请用中文写一个“音频批处理任务队列面板”的在线工具项目。 1）技术栈：Node.js + Express（或 Fastify）+ 前端任意框架；处理步骤可用 ffmpeg.wasm 或 WebAudio（按你选型说明）。 2）功能：用户上传多个文件后，可配置流水线步骤（去噪/标准化/切分/转码），展示队列进度、失败原因、重试、断点续跑；结果可批量下载。 3）一键输出 HTML：生成单文件HTML交付报告，包含任务配置、每个文件的处理链、日志摘要、失败重试记录、以及复核清单。 4）交付物：输出完整源码与文件树；给出运行命令；写明本地存储目录与安全注意事项；提供 Dockerfile + 一键启动 docker compose。 5）测试/QA：至少 8 条（含：并发限制、失败重试、断点续跑、不同格式、超大文件、日志查看、导出HTML离线可用、权限与路径安全）。 6）请直接提供一个可用的 index.html（简化版）用于报告页的静态展示。

音频采样率与声道一致性检查器

用于在交付前做批量质检：采样率、位深、声道布局、时长、峰值等，并输出统一报告。

提示词 (Prompts):

请用中文实现一个“音频一致性检查器”的在线工具。 1）技术栈：纯前端（不需要后端），Type + 任意轻量框架；音频解码与指标读取用 WebAudio。 2）功能：批量导入音频后，检测采样率/声道数/时长/峰值/静音比例，支持按规则高亮异常，并允许导出 CSV。 3）一键输出 HTML：生成单文件HTML质检报告（离线可打开），包含规则配置、结果表格、异常说明与建议修复动作。 4）交付物：输出文件树与源码；给出运行/构建/部署；至少 6 条 QA（含：不同格式、极短音频、双声道检测、异常规则、导出HTML离线打开、导出CSV）。 5）请直接输出一个可用的 index.html 示例，展示规则区+结果表。