PDF工具 PDF扫描件OCR可搜索化工作台 AI 提示词 (Prompts)

PDF 扫描件 OCR 可搜索化与校对台

把扫描版 PDF 在线识别成可搜索文本，并提供逐页校对与导出能力。

提示词 (Prompts):

你是一名资深全栈工程师。请用中文输出一个可运行/可构建/可部署的在线工具项目：工具名称：PDF 扫描件 OCR 可搜索化与校对台（Web）硬性要求： - 交付物必须包含完整项目代码与文件结构树；并给出本地运行命令、构建命令、生产部署说明（静态部署与Node服务两种任选其一即可，但要完整）。 - 工具必须支持“一键输出 HTML”：提供一个按钮，生成并下载一个可直接打开的单文件 HTML 报告（内含识别结果、页缩略预览、关键统计与错误提示），或一键生成包含 index.html 的最小可运行包（zip）。 - 不要引导生成任何图片/海报/插画/渲染图；仅允许展示从原PDF提取/渲染的现有页面。功能清单： - 上传 PDF（支持拖拽），用 PDF.js 渲染每页；允许分页/缩放；显示页码与进度。 - OCR：对每页渲染后的画布做 OCR（可选 Tesseract.js），支持语言选择（至少：中文简体、英文），支持逐页识别与批量识别。 - 校对：左侧 PDF 预览，右侧可编辑识别文本；支持搜索/高亮（在文本侧），支持标记“疑似错误词”。 - 导出：导出可搜索 PDF（将文本层叠加到原页面渲染坐标上，或生成新的PDF并保留原图层）；并提供“导出 HTML 报告”按钮（见硬性要求）。 - 质量检查：统计每页字符数、疑似乱码比例、空页识别、耗时；生成可复制的QA清单。技术栈建议：Vite + React + Type ；PDF渲染用 PDF.js；OCR用 Tesseract.js；导出PDF可用 pdf-lib（或你选择的同类库）。输出格式： 1) 项目简介（纯文本） 2) 文件树（必须完整） 3) 关键源码（必须给出可直接运行的完整代码，不要省略为伪代码） 4) 运行与构建命令 5) 部署说明 6) 至少 8 条测试用例或 QA checklist（覆盖上传失败、超大PDF、中文识别、导出HTML可打开、导出PDF可搜索等）

主要用途: 将扫描PDF转为可搜索PDF，在线校对识别文本，输出可交付的HTML报告与可搜索PDF文件。

PDF 批量 OCR 队列与断点续跑工具

针对多份 PDF 扫描件，提供队列、断点续跑与任务报告，适合批处理交付。

提示词 (Prompts):

请用中文生成一个在线PDF批处理工具的完整项目代码：支持一次选择多份PDF，建立任务队列，逐页OCR并保存中间结果到浏览器本地存储（IndexedDB），支持暂停/继续/失败重试/断点续跑。必须交付：完整文件树+源码+运行命令+部署说明+不少于5项QA清单。硬约束：必须支持“一键输出 HTML”——对每个任务生成一个可直接打开的单文件HTML报告（包含：文件名、页数、每页识别摘要、错误列表、耗时统计、下载链接），并提供“打包导出”把全部报告与结果文件放进一个zip（包含 index.html 汇总页）。禁止：任何生成图片的提示词；只能渲染原PDF页面用于预览。

主要用途: 多文件OCR批处理、断点续跑、交付统一HTML报告与可搜索PDF结果。

PDF 版面区域选择 OCR（表格/票据）

允许在页面上框选区域做 OCR，提升票据、发票与表格的可用性。

提示词 (Prompts):

请用中文输出一个可部署的在线工具项目：用户上传PDF后，用PDF.js渲染页面；支持鼠标框选区域（矩形选择），只对选区做OCR，并将结果按字段分组（例如：抬头、金额、日期、税号等可自定义字段）。交付物：完整源码、文件树、运行/构建/部署说明、至少8条QA清单。一键输出HTML：提供按钮导出单文件HTML验收报告，必须包含：每个字段的识别结果、对应页面选区截图（由原PDF渲染得到，不是生成图片）、置信度、人工校对记录、导出时间与版本号。同时提供导出JSON与导出可搜索PDF（可选）。

主要用途: 票据/表格类PDF的区域OCR、结构化提取、输出可验收HTML报告。

PDF 文字层抽取与可搜索性检测

快速判断PDF是否可搜索，并输出差异报告，避免交付后才发现不可检索。

提示词 (Prompts):

请用中文生成一个在线PDF可搜索性检测工具：上传PDF后，逐页抽取文字层（如果存在）并统计字符数/覆盖率；若无文字层则提示需要OCR；支持对比“OCR前/后”两份PDF的可搜索性指标差异。交付：完整项目源码+文件树+命令+部署+至少5项测试或QA清单。一键输出HTML：导出单文件HTML报告（包含每页指标、整体结论、建议处理策略、错误日志），可直接打开用于交付。

主要用途: 检测PDF是否可搜索、给出量化指标，并输出可交付的HTML诊断报告。

PDF OCR 结果对齐与高亮校对视图

把识别文本按坐标对齐回页面，支持高亮与点击定位，提升校对效率。

提示词 (Prompts):

请用中文输出一个在线工具：上传PDF后渲染页面；OCR获得文字与近似坐标；在预览层把识别出的词块以半透明高亮覆盖在原页面上，点击高亮可在右侧编辑文本；支持搜索词并在页面上滚动定位。交付物必须包含：完整代码、文件树、运行命令、部署说明、至少8条QA清单。一键输出HTML：导出单文件HTML校对报告，包含：每页高亮统计、疑似低置信度词列表、人工修改记录（前后对比）、以及可折叠的每页文本摘要。禁止生成任何新图片；所有可视化只能来自原PDF渲染。

主要用途: OCR结果与页面对齐的可视化校对、检索定位、输出可审阅的HTML报告。

PDF 合并前 OCR 预检与风险提示器

合并多个PDF前先做OCR与可搜索性预检，避免合并后难以追溯问题来源。

提示词 (Prompts):

请用中文生成一个在线工具项目：用户拖入多份PDF；工具先并行做每份的可搜索性检测与抽样OCR（前N页）；给出风险提示（例如：空白页、倾斜严重、分辨率过低、识别率可能很差）。必须交付：完整源码与文件树、运行/构建/部署说明、至少5项测试或QA清单。一键输出HTML：导出单文件HTML“合并前预检报告”，包含每个文件的指标摘要、风险标签、建议处理动作，以及合并建议顺序；并支持导出一个包含 index.html 的最小报告包。

主要用途: PDF批量合并前的OCR预检与风险评估，输出交付用HTML报告。

PDF OCR 文本清洗与术语纠错台

对OCR文本做清洗、正则替换、术语表纠错与一致性检查，适合标准化交付。

提示词 (Prompts):

请用中文输出一个可部署的在线工具：上传PDF并OCR后，提供文本清洗管线（去多余空格、合并断行、全角半角转换、常见错别字替换），支持导入术语表（CSV）进行一致性校对；支持对替换规则做预览与回滚。交付物：完整项目代码+文件树+运行/构建命令+部署说明+至少8条QA清单。一键输出HTML：导出单文件HTML“清洗与纠错报告”，包含：命中规则统计、替换前后对比、未命中术语列表、以及可复制的交付说明段落。

主要用途: OCR文本的标准化清洗与术语一致性校对，输出可交付HTML对比报告。

PDF 可搜索化一键交付包生成器

把处理后的文件与说明一次性打包，交付方只需打开一个 HTML 即可验收。

提示词 (Prompts):

请用中文生成一个在线工具项目：用户上传扫描PDF，工具完成OCR并导出可搜索PDF；然后提供“一键生成交付包”按钮，打包内容必须包含： - index.html（离线可打开的验收页：包含处理摘要、下载链接、QA清单、版本与时间） - output.pdf（可搜索PDF） - report.html（单文件详细报告，可选） - README.txt（纯文本交付说明）要求：输出完整源码与文件树；给出运行、构建、部署说明；至少8条测试用例或QA清单。注意：不要任何图像生成导向；页面预览仅来自原PDF渲染。

主要用途: 生成可搜索PDF并一键打包交付，确保包含可直接打开的HTML验收页。