音频处理 播客音频章节切分与 Show Notes 生成 AI 提示词 (Prompts)

适用范围

这是一组面向“在线工具生成”的 AI 提示词(Prompts),目标是让 AI 直接产出一个可运行/可构建/可部署的网页工具:用户上传音频(或提供 URL/本地文件),工具自动做分段与章节点建议,生成播客 Show Notes(摘要、要点、时间轴、关键片段),并提供可导出的多种格式。

强调:这里不引导生成任何图片/海报/插画/渲染图;仅做音频处理、文本生成与结构化导出。

交付物与验收口径

你将得到:完整可运行项目代码(前后端可合并或分离)、清晰文件结构、安装与运行命令、环境变量示例、部署说明(Docker/Node/Vercel/自建任选其一或多项)、以及测试用例或 QA checklist。验收要点:在不改代码的情况下,按文档命令即可启动;上传一段音频能生成章节与Show Notes;导出文件可用;错误提示明确;处理超时/大文件有降级策略。

Prompt:生成“播客音频章节切分与 Show Notes”在线工具(MVP 可运行版)

你是资深全栈工程师+产品经理。请从零生成一个可运行的在线工具项目: 工具名称:播客音频章节切分与 Show Notes 生成器 核心能力: 1) 用户在网页中上传音频文件(优先支持 mp3/m4a/wav),显示音频时长与文件信息。 2) 进行音频转写(如果无法调用付费API,请提供:A) 本地开源方案占位实现 + 接口设计;B) 可插拔的转写适配层,支持后续接入任意ASR)。 3) 基于转写结果生成: - 章节时间轴(每段包含 start/end/timecode + 标题 + 1-2句摘要) - Show Notes(摘要、要点列表、关键名词/人名/术语、提到的链接占位) 4) 导出:Markdown(Show Notes)、JSON(结构化章节+要点)、SRT(按章节或按转写片段) 5) 页面提供“复制到剪贴板”按钮与下载按钮。 技术要求(必须落实到代码与文件结构): - 前端:React + Vite + Type (或 Next.js 也可,但必须可直接跑起来)。 - 后端:Node.js(Express/Fastify 均可),用于处理上传、转写/分段/生成。 - 文件上传:限制大小(例如 200MB),并在UI中明确提示;若超出限制给出可操作建议。 - 任务处理:长任务必须有进度状态(至少:上传中/转写中/生成中/完成/失败)。 - 安全:不要把用户音频长期保存;临时文件处理完成后清理;接口做基本校验。 输出格式(必须全部给出): A) 项目文件树(包含每个文件的用途说明) B) 完整代码(按文件逐段输出) C) 安装与运行命令(开发/生产) D) 配置说明(.env.example) E) 部署说明(至少一种:Docker 或 Vercel/自建服务器) F) 测试用例或 QA checklist(覆盖上传失败、转写失败、空音频、超长音频等) 实现策略提示: - 若转写不可用,请做“模拟转写”模式:允许用户粘贴一段文本当作转写结果进行后续章节切分与Show Notes生成,以保证项目可运行、可演示、可测试。 - 章节切分可以先用启发式:按语义段落/停顿/话题转折分段,并给出可调参数(最小章节时长、最大章节数等)。 请直接开始生成。

Prompt:增强版(可编辑章节、可复用模板、质量控制)

在已有MVP基础上继续迭代,请输出代码diff或新增文件: 新增功能: 1) 章节编辑器:用户可拖拽调整章节边界(start/end),可编辑章节标题与摘要,实时刷新导出结果。 2) 模板系统:提供3种Show Notes模板(精简/标准/深度),每种模板的字段定义(YAML或JSON)可扩展。 3) 质量控制: - 对转写文本进行清洗(去口头语、重复、无意义词可选开关) - 对章节命名做一致性校验(长度、重复标题、过短章节提示) - 生成结果附带“置信度/风险提示”(例如:疑似人名识别不准、章节切分过碎) 4) 多语言:至少支持中文/英文UI切换;Show Notes输出语言可选。 5) 隐私说明:在页面底部输出简短隐私声明(不保存音频/可一键清理)。 工程要求: - 状态管理清晰(例如 Zustand/Redux 或 React Query),避免巨型组件。 - 前端导出使用 Blob 下载;后端导出也可选。 - 增加单元测试(至少覆盖:章节切分函数、模板渲染函数)。 请给出:新增/修改文件列表、关键代码片段、以及如何验证每个功能点。

Prompt:部署与测试(可交付版)

请把该项目提升到“可交付”标准,并输出: 1) Dockerfile + docker-compose.yml(前后端一键启动),包含健康检查。 2) 生产构建与反向代理建议(Nginx示例或 Node静态托管方案)。 3) 性能与成本策略: - 大文件分片上传(可选) - 后端队列/并发限制 - 失败重试与取消任务 4) QA checklist:至少覆盖20条,包括: - 不同音频格式 - 低质量音频/噪声 - 空白音频 - 超大文件提示 - 断网/刷新页面后的恢复策略 - 导出文件内容正确性 5) 最小化日志与隐私:日志不打印音频内容与全文转写;提供日志级别开关。 请给出完整配置文件与验证步骤。

使用建议

如果你已经有转写结果(例如会议纪要、访谈文字稿),可以直接使用“粘贴文本模式”快速生成章节与Show Notes;如果要接入真实ASR,请把适配层接口保留为可替换实现,避免把某个API写死在业务逻辑里。

QA Checklist(简版)

上传:格式错误提示清晰;超限提示给出解决方案;上传中不可重复提交;取消上传可用。生成:空转写/空音频给出可操作反馈;章节数量过多/过少有提示;导出文件可打开;复制按钮在主流浏览器可用。安全:任务结束后临时文件清理;不在日志里输出敏感文本;错误信息不泄露服务器路径。

用户评论 (0)

登录后参与讨论

立即登录 注册账号

暂无评论,快来抢沙发吧~

操作成功