PDF工具 PDF 批注/高亮提取与 Markdown 纪要生成 AI 提示词 (Prompts)

这是一条可直接复用的在线工具生成型 AI 提示词(Prompts):让 AI 生成一个“PDF 批注/高亮提取与 Markdown 纪要导出”的在线工具。目标是拿到完整可运行项目,而不是零散代码片段。

适用场景

设计评审、法务审阅、论文批注、合同修改等场景里,PDF 往往包含高亮、批注、下划线、便签、图章等注释信息。你希望把这些注释自动汇总成可读的纪要(Markdown/JSON),并能按页码、作者、时间、颜色、类型进行筛选和导出。

交付物要求

AI 的输出必须包含:完整项目源码、清晰的文件树、可复制的安装与运行命令、Docker 部署说明、以及测试用例或 QA checklist(可手工)。

功能清单

1)上传/拖拽单个 PDF;2)支持批量(多文件队列,逐个解析);3)解析并提取常见注释:高亮、文本批注、下划线、删除线、方框/线条标注(以可用信息为准);4)按页码聚合并生成 Markdown 纪要;5)同时导出结构化 JSON;6)在页面中可预览提取结果并支持复制;7)生成一个“处理报告”区域,显示解析耗时、页数、注释数量、异常警告。

输入与输出格式

输入:用户上传的 PDF 文件(不要求联网)。输出:Markdown(含页码小标题与条目列表)、JSON(包含 annotations 数组、每条含 page、type、content、color、rect 或 quadPoints 等尽可能多的字段)。

技术选型建议

前端优先用 Next.js + Type ;PDF 解析可选 pdf.js(在浏览器端读取 annotations)或在服务端用 Node 库解析(需要说明差异与限制)。整体要保证“能跑起来”,优先选择实现成本低、兼容性更好的方案。

核心 AI 提示词(Prompts)

你是资深全栈工程师与技术写作者。请为我生成一个可运行、可构建、可部署的在线工具:PDF 批注/高亮提取与 Markdown 纪要导出。 目标:我复制你的输出后,可以在本地一键启动(npm/pnpm),打开浏览器上传 PDF,看到提取结果,并能导出 Markdown/JSON。 硬性输出要求(必须全部满足): 1) 输出完整项目代码(不是伪代码),并给出清晰文件树。 2) 给出逐步运行命令(安装依赖、开发启动、生产构建、生产启动)。 3) 给出 Docker 部署方案(Dockerfile + 可选 docker-compose),并说明环境变量。 4) 给出测试用例或 QA checklist(至少覆盖:无注释 PDF、有高亮、有文本批注、多页、多文件、损坏文件、超大文件)。 5) UI 必须包含:上传区、文件列表、解析状态、结果预览、导出按钮、错误提示。 功能要求: - 支持单文件与多文件队列。 - 提取并归一化常见注释:Highlight(高亮)、Text(便签批注/文本批注)、Underline、StrikeOut、Square/Circle、Line/Polygon/Polyline(如能拿到)。 - 以“页码”为主分组;每页下按注释类型再分组;Markdown 里必须有清晰层级。 - JSON 输出包含:fileName、pageCount、extractedAt、annotations[]。 - 每条 annotation 尽量包含:page、type、text/contents、author、created/modified(如可获取)、color、position(rect/quadPoints)。获取不到要解释原因。 - 生成的 Markdown 必须可读:每页用二级小节(例如:## Page 3),每条注释用列表项,并在条目里附带类型、颜色与简短定位信息。 实现建议(可调整但需说明理由): - 优先采用浏览器端 pdf.js 解析 annotations,避免后端解析差异。 - 若使用 pdf.js:请给出稳定的提取实现(遍历每页 getAnnotations 或同等 API),并说明哪些类型能提取、哪些可能缺失。 工程要求: - Type 严格模式。 - 代码要有必要的注释(解释关键解析逻辑)。 - 不能依赖外部在线服务(例如第三方 OCR API)。 请按以下结构输出: A. 项目简介(包含适用场景与限制) B. 文件树 C. 关键代码(按文件给出完整内容) D. 如何运行(Dev/Build/Start) E. Docker 部署 F. 测试用例或 QA checklist G. 常见问题与排错(例如:某些 PDF 注释拿不到、跨阅读器不一致、字体/坐标问题)

Markdown 纪要示例(期望效果)

示例结构(你的工具导出的 Markdown 应接近此结构):

# PDF Annotation Summary - File: example.pdf - ExtractedAt: 2026-03-21T14:50:00+08:00 - PageCount: 12 ## Page 1 ### Highlight - [Highlight] (yellow) p1 @ (x:120,y:340,w:220,h:18) : 这里是一段高亮内容 ### Text - [Text] (none) p1 : 这里是一条批注内容(作者/时间如可用则附上) ## Page 2 ...

实现提示

如果你需要在浏览器端解析注释坐标,请说明坐标系(viewport vs PDF points)与缩放对矩形显示的影响。若要在 UI 中可视化定位(可选),请保证不影响核心导出功能。

验收清单

1)复制粘贴项目后可启动;2)上传带高亮与批注的 PDF 能输出 Markdown/JSON;3)批量处理可用;4)导出文件名与编码正确;5)错误提示可理解;6)Docker 可构建并运行;7)附 QA checklist。

用户评论 (0)

登录后参与讨论

立即登录 注册账号

暂无评论,快来抢沙发吧~

操作成功