本文整理 8 条“在线工具生成型 AI 提示词(Prompts)”,聚焦音频处理与播客后期交付。每条 Prompt 都要求输出可运行项目源码、文件结构、运行/构建/部署命令,以及可直接预览的“一键输出 HTML”交付物,方便把工具或报告页直接交给同事/客户审阅。
注意:本文不包含任何“生成图片/渲染图/出图”导向内容;涉及可视化仅用于波形/频谱/报告展示。
在线响度标准化 + 章节标记 + HTML试听包
适合把播客成片做标准化与结构化交付,一键导出可离线打开的试听页。
中文 Prompt:
你是一名资深前端工程师与音频后期工具作者。请生成一个“在线响度标准化 + 章节标记 + 一键导出HTML试听包”的网页工具,面向播客后期。
硬性要求:
1) 必须是可运行/可构建/可部署的完整项目(给出文件树+所有关键源码)。
2) 支持本地导入音频文件(mp3/wav/m4a),在浏览器端完成处理;允许使用 ffmpeg.wasm,但要说明首次加载体积与缓存策略。
3) 提供响度目标:-16 LUFS(立体声)/ -19 LUFS(单声道)可切换,并显示测量结果、峰值、动态范围。
4) 章节标记:用户可在时间轴上添加/编辑章节标题与时间点;导出时写入 JSON 与可视化目录。
5) “一键输出HTML”:点击导出后生成一个可直接打开的 index.html(或打包为包含 index.html 的最小目录),离线可播放音频、查看章节目录、响度报告、处理参数;提供下载按钮。
6) 交付物必须包含:运行命令(npm/yarn/pnpm均可)、构建命令、部署到 Vercel/Netlify 的说明。
7) 至少提供 8 条 QA checklist(含边界情况:超长音频、VBR、无元数据、移动端Safari等)。
技术栈建议:Vite + React + Type (可替换为 Vue 亦可,但要自洽)。请直接给出完整实现。
中文释义: 生成一个浏览器端播客后期工具:测量并规范响度、编辑章节目录,并把试听页+报告一键导出为可打开的HTML交付包。
在线降噪去混响 + A/B对比 + HTML审听页
适合访谈/课程录音清理,强调可解释参数与可复核的对比试听。
中文 Prompt:
你是一名音频工具产品工程师。请生成一个“在线降噪 + 去混响 + A/B 对比 + 一键导出HTML审听页”的网页工具。
功能要求:
1) 支持上传音频,提供两种降噪策略:轻度/强力(可基于频谱门限+噪声采样或WebAudio处理;如使用模型/库需说明离线与性能)。
2) 去混响提供强度滑杆(0-100),并在UI中明确这是对语音清晰度优化,而非生成新内容。
3) A/B 对比:原始/处理后可快速切换;提供波形/频谱可视化。
4) 一键导出HTML:导出一个可直接打开的 HTML 文件,内含两轨播放器、对比按钮、处理参数与“是否通过”的QA勾选表;支持把当前处理后的音频以 64 或 blob 下载(需解释大小限制与建议)。
5) 给出完整项目文件树、源码、运行与构建命令、部署说明。
6) 至少 6 条测试用例/QA清单。
中文释义: 生成可离线审听的对比页,把处理参数与结论以HTML形式交付,便于审核与返工。
在线无损裁剪拼接 + 片头片尾模板 + HTML交付包
适合快速剪掉静音与废话段,套用片头片尾,输出可直接打开的交付包。
中文 Prompt:
你是一名播客剪辑助手工具开发者。请生成一个“在线无损裁剪/切段/拼接 + 片头片尾模板 + 一键导出HTML交付包”的网页工具。
需求:
1) 导入一段或多段音频,支持在波形上打点切段、删除静音段(可设置静音阈值与最短静音时长)。
2) 允许选择片头/片尾模板(内置几段短音效用纯代码生成或提供可替换占位),并可设置淡入淡出。
3) 输出:生成合并后的音频文件(格式可选 mp3/wav)与一份 index.html 试听包(含章节/片段列表、试听按钮、导出参数与制作日志)。
4) 一键导出HTML:保证导出的包在本地双击即可打开并播放(解释需要的浏览器限制与本地文件权限)。
5) 完整项目:文件树、源码、命令、部署;至少 8 条QA清单。
中文释义: 生成一套可视化剪辑工具与导出机制:把成片与制作日志打包为HTML,降低沟通成本。
在线转写对齐 + 字幕审校 + HTML字幕页
适合把音频内容转成可校对字幕并可导出SRT/VTT,支持离线优先。
中文 Prompt:
你是一名音频转写与校对工具作者。请生成一个“在线转写(本地/离线优先) + 时间轴对齐 + 一键导出HTML字幕审校页”的网页工具。
约束:
1) 不依赖外部付费API;如使用开源模型(例如 Whisper.cpp / wasm 版)需要说明模型加载方式、体积、以及在低配设备上的降级策略(例如只做字幕编辑器不做转写)。
2) 提供字幕编辑:逐句编辑、时间轴拖拽、合并/拆分句子;播放时高亮当前句。
3) 一键导出HTML:导出一个可直接打开的 HTML 文件,包含播放器、字幕时间轴、导出 SRT/VTT 的按钮、以及“校对完成度”勾选清单。
4) 给出完整项目实现(文件树+源码+命令+部署)。
5) 至少 10 条QA清单(含中文标点、多人说话、口癖、长停顿、嘈杂环境)。
中文释义: 生成“转写+校对+导出”的闭环工具,并把字幕审校页以HTML形式一键交付。
在线音频格式批处理转换 + 元数据编辑 + HTML报告
适合批量整理素材库:统一格式参数并生成离线报告页。
中文 Prompt:
你是一名视频/音频素材管理工具作者。请生成一个“在线音频格式批处理转换 + 元数据编辑 + 一键导出HTML报告”的网页工具。
功能:
1) 支持拖拽导入多个音频文件,批量转换为 mp3(320k)/aac/m4a/wav;可设置采样率、声道、比特率。
2) 支持读取与编辑基础元数据:标题、作者、专辑、封面(封面仅允许用户上传现有图片文件,不要生成图片)。
3) 转换结果可批量下载,并生成一份 index.html 报告:列出每个文件的原始/目标参数、文件大小变化、转换日志、失败原因。
4) 一键输出HTML:报告页必须可离线打开;报告中可点开试听每个输出文件(解释本地播放限制)。
5) 输出完整项目源码、文件树、命令与部署;至少 7 条测试用例。
中文释义: 生成一个批处理转换器与报告导出器,报告可离线打开并包含试听与日志。
在线BGM自动Ducking混音 + HTML审听包
适合播客混音:人声优先自动压低背景音乐,并导出可复核试听包。
中文 Prompt:
你是一名播客混音自动化工具作者。请生成一个“在线BGM自动Ducking(人声优先) + 预设模板 + 一键导出HTML审听包”的网页工具。
要求:
1) 输入:人声轨与BGM轨(各一段音频)。
2) 提供自动ducking:检测人声段落,自动降低BGM音量;可调参数:duck深度、攻击/释放时间、阈值。
3) 输出:混音结果音频 + 可下载的工程参数 JSON。
4) 一键导出HTML:导出一个可直接打开的 index.html,包含三轨试听(人声/BGM/混音),以及参数说明与QA勾选表。
5) 完整项目实现(文件树+源码+命令+部署),至少 8 条QA。
中文释义: 生成“自动ducking + 参数可调 + 三轨对比试听 + HTML交付”的混音工具。
在线音频QC质检 + 规则校验 + HTML质检报告
适合交付前质检:把响度/峰值/静音/参数等规则结果导出为可审阅报告。
中文 Prompt:
你是一名音频质量检测工具作者。请生成一个“在线音频QC质检 + 规则校验 + 一键导出HTML质检报告”的网页工具。
规则示例(可配置):
- 峰值不超过 -1dBTP
- 综合响度在目标范围内(-16±1 LUFS 或 -19±1 LUFS)
- 静音段长度不超过阈值
- 采样率/声道符合目标
要求:
1) 支持上传音频并自动分析,输出可解释的检测结果。
2) 允许用户导出一份 HTML 报告(单文件或最小包),包含:规则列表、通过/失败、建议修复动作、时间点定位(如静音段起止)。
3) 给出完整项目源码、文件树、命令、部署与至少 10 条QA清单。
中文释义: 生成可配置规则的质检工具,并把检测结果与定位信息一键导出为HTML报告。
在线波形标注评论 + 评审结论 + HTML评审页
适合团队评审:对具体时间点做标注、评论与分派,并导出离线评审页。
中文 Prompt:
你是一名面向交付的工具开发者。请生成一个“在线音频波形标注 + 评论批注 + 一键导出HTML评审页”的网页工具。
功能:
1) 上传音频后显示波形,可在任意时间点添加标注(类型:口误/噪声/剪辑点/需要重录/背景音过大),支持评论与负责人字段。
2) 标注列表可筛选/搜索,点击跳转到对应时间。
3) 一键输出HTML:导出一个可直接打开的 HTML 文件,内含播放器+波形+所有标注与评论;支持导出JSON;并提供“评审结论”表单(通过/需返工/备注)。
4) 完整项目源码、文件树、命令、部署;至少 8 条QA。
中文释义: 生成“波形+标注+评论+导出”的协作评审工具,导出页可直接打开复盘问题点。