你将得到什么
把会议录音、网课音频或采访素材,快速转成「可搜索的文字笔记」,再由 AI 自动提炼要点、待办与关键结论。本文给出两套可直接照做的流程:本地转写(更隐私)与云端转写(更省事)。
开始前的准备(3分钟检查)
- 确认音频格式:优先用 m4a / mp3 / wav,不要用过度压缩的语音消息。
- 确认录音质量:尽量靠近说话人;有条件可开「降噪」。噪声越大,转写越容易错。
- 准备一个笔记承载地:推荐 Obsidian(本地 Markdown)或 Notion(云端协作)。
方案 A:本地转写(更隐私)——Whisper / whisper.cpp
适合:对隐私敏感、不想上传录音、或想批量处理很多音频。
- 安装 FFmpeg(用于解码音频)。
Windows 可用 winget:winget install Gyan.FFmpeg;macOS 可用 Homebrew:brew install ffmpeg。
- 选择转写工具
新手建议用图形界面或封装版(更省心);动手能力强可用 whisper.cpp(更轻更快)。
- 开始转写
把音频拖入工具,语言选择「中文」或「自动识别」,导出为 txt / srt。若支持「分段标点」「说话人分离」,建议开启。
- 整理成笔记模板
把转写文本粘贴到笔记里,按下面模板快速结构化:
笔记模板(复制即用)
标题:会议主题|日期
参与人:A、B、C
结论摘要:3-5 条
待办(Action Items):负责人 + 截止时间
原始转写:粘贴全文(可折叠)
方案 B:云端转写(更省事)——语音转写服务 + AI 总结
适合:希望一键出纪要、多人协作共享、或需要在手机上快速处理。
- 上传/导入音频:选择正规的转写服务(支持中文标点与时间轴更好)。
- 导出转写文本:优先导出带时间戳版本,方便回听定位。
- 用 AI 做总结(不含敏感内容):把转写文本分段粘贴给 AI,让它输出「要点、待办、风险点、下一步」。
- 落到可搜索的知识库:保存到 Obsidian/Notion,并加上标签:#会议纪要 #项目名 #负责人。
推荐的 AI 提示词(直接复制)
请基于以下会议转写,输出:
- 3-7 条结论要点(每条不超过 40 字)
- 待办清单(事项/负责人/截止时间/依赖)
- 存在争议或不确定点(需要二次确认的问题)
- 会议中提到的数字、时间、关键名词(做成一张小表)
要求:不要编造未出现的信息;如果缺少负责人或时间,请标注“未明确”。
常见问题与排查(最容易卡住的 6 个点)
- 转写结果一堆乱码/没标点:把语言改成「中文」或「自动」重新跑一次;尽量使用原始音频而不是语音消息转存。
- 提示 ffmpeg 找不到:确认 FFmpeg 已安装且加入 PATH;重开终端/重启软件后再试。
- 音频太大/太长:先用工具按 30-60 分钟切分;或转成 16kHz 单声道 wav 提升速度。
- 人声很小、背景噪声大:先做降噪/人声增强;重新录音时把麦克风靠近说话人。
- 专有名词识别错误:建立“自定义词表/热词”(如果服务支持);或在 AI 总结前先手工把关键名词统一改正。
- 担心隐私:敏感会议优先用方案 A 本地转写;云端方案避免上传含身份证号/银行卡/商业机密的原始录音。
进阶:把纪要变成可复用知识
- 每次会议统一模板与命名:项目-主题-日期,方便检索。
- 纪要里只保留“可行动信息”:结论、决策、待办、风险与下次会议议题。
- 每周复盘一次:把重复出现的问题汇总成「FAQ / SOP」,长期减少沟通成本。