PDF工具 PDF 字体嵌入与缺失字体诊断 AI 提示词 (Prompts)

这条 Prompt 能生成什么

目标是让 AI 一次性产出一个“PDF 字体嵌入与缺失字体诊断”在线工具的完整项目：包含前端页面、后端解析接口、可下载的诊断报告（JSON/HTML/PDF 三选二即可）、运行命令、部署说明（Docker/无服务器二选一也可），并附带可执行的测试用例或 QA checklist。

适用场景

印前交付前检查：避免“字体未嵌入导致替换/乱码”。归档与合规：确认字体嵌入、子集化、Type0/TrueType/OTF 等信息完整。团队协作：把“字体问题”从口头描述变成结构化报告，便于设计/印刷/法务快速沟通。

功能清单（建议最小可用）

上传 PDF（单个/多个可选）；解析每一页引用到的字体：字体名、Post 名、是否嵌入、是否子集化、字体类型、编码信息；输出缺失字体列表与风险等级；给出修复建议（例如：重新导出时勾选嵌入字体、替换为可嵌入字体、用 Ghost 重新写入等）；生成可分享的报告链接（短期存储即可）。

技术选型建议

实现路径 1：Node.js + pdfjs-dist/puppeteer（解析+渲染兜底）。实现路径 2：Python + pikepdf/qpdf（解析更强）+ 前端轻量页面。为了易部署与前端体验，这条 Prompt 默认走“Next.js + API Routes + pdf.js”的方案，你也可以在 Prompt 中要求 AI 输出双实现（Node 与 Python）但不建议混写到同一项目里。

核心 Prompt（直接复制给 AI）

你是资深全栈工程师与 PDF 工具链专家。请为我生成一个可运行、可构建、可部署的“PDF 字体嵌入与缺失字体诊断”在线工具完整项目。

【硬性交付物】
1) 完整项目源码（请按文件逐个给出关键代码），并输出最终文件树。
2) 本地运行命令（安装、开发、构建、生产启动）。
3) 部署说明（二选一：Docker 一键部署；或 Vercel/Netlify 等无服务器部署）。
4) 至少 6 条可执行测试用例（单测/集成测任选其一）或 QA Checklist（覆盖边界情况）。
5) 输出一个示例诊断报告 JSON 结构（字段清晰、可扩展）。

【功能需求】
- 前端：上传 PDF，展示诊断结果表格（字体名、是否嵌入、是否子集化、字体类型、首次出现页码、风险等级、建议）。支持导出报告（JSON + HTML 至少两种）。
- 后端：解析 PDF 字体信息。优先使用 pdfjs-dist 获取字体资源信息；如某些字段无法直接获得，请采用“渲染页 -> 抽取字体对象信息/或结合解析库”作为兜底，并明确限制与降级策略。
- 规则：
  - 未嵌入字体 = 高风险
  - 嵌入但非子集化 = 中风险（体积/授权提示）
  - 嵌入且子集化 = 低风险
  - 字体名包含随机前缀（疑似子集）要做识别并标注
- 安全：限制文件大小/页数；只在内存或临时目录处理；不持久化用户文件；清理临时文件。

【实现约束】
- 技术栈：Next.js 14 + Type （如需后端单独服务，请用 Node.js/Express，但仍要给出一键启动方式）。
- 不要依赖任何需要付费密钥的服务。
- 不要生成任何图片/插画/海报/渲染图相关功能。

【输出格式】
- 先给“项目简介 + 快速开始”。
- 再给“文件树”。
- 然后按文件路径依次给代码块。
- 最后给“部署说明 + 测试/QA”。

示例报告字段（你可以让 AI 复用这套结构）

建议字段：document（页数、版本、是否加密）、fonts[]（name、post Name、type、embedded、subset、firstPage、usedPages、risk、notes、fixSuggestions[]）、summary（high/medium/low 数量、总体结论）、limits（解析降级说明）。这能让工具既可读也可机器处理，方便接入 CI 或批处理流程。