PDF工具 PDF扫描件OCR可搜索化工作台 AI 提示词 (Prompts)

PDF 扫描件 OCR 可搜索化与校对台

把扫描版 PDF 在线识别成可搜索文本,并提供逐页校对与导出能力。

提示词 (Prompts):

你是一名资深全栈工程师。请用中文输出一个可运行/可构建/可部署的在线工具项目: 工具名称:PDF 扫描件 OCR 可搜索化与校对台(Web) 硬性要求: - 交付物必须包含完整项目代码与文件结构树;并给出本地运行命令、构建命令、生产部署说明(静态部署与Node服务两种任选其一即可,但要完整)。 - 工具必须支持“一键输出 HTML”:提供一个按钮,生成并下载一个可直接打开的单文件 HTML 报告(内含识别结果、页缩略预览、关键统计与错误提示),或一键生成包含 index.html 的最小可运行包(zip)。 - 不要引导生成任何图片/海报/插画/渲染图;仅允许展示从原PDF提取/渲染的现有页面。 功能清单: - 上传 PDF(支持拖拽),用 PDF.js 渲染每页;允许分页/缩放;显示页码与进度。 - OCR:对每页渲染后的画布做 OCR(可选 Tesseract.js),支持语言选择(至少:中文简体、英文),支持逐页识别与批量识别。 - 校对:左侧 PDF 预览,右侧可编辑识别文本;支持搜索/高亮(在文本侧),支持标记“疑似错误词”。 - 导出:导出可搜索 PDF(将文本层叠加到原页面渲染坐标上,或生成新的PDF并保留原图层);并提供“导出 HTML 报告”按钮(见硬性要求)。 - 质量检查:统计每页字符数、疑似乱码比例、空页识别、耗时;生成可复制的QA清单。 技术栈建议:Vite + React + Type ;PDF渲染用 PDF.js;OCR用 Tesseract.js;导出PDF可用 pdf-lib(或你选择的同类库)。 输出格式: 1) 项目简介(纯文本) 2) 文件树(必须完整) 3) 关键源码(必须给出可直接运行的完整代码,不要省略为伪代码) 4) 运行与构建命令 5) 部署说明 6) 至少 8 条测试用例或 QA checklist(覆盖上传失败、超大PDF、中文识别、导出HTML可打开、导出PDF可搜索等)

主要用途: 将扫描PDF转为可搜索PDF,在线校对识别文本,输出可交付的HTML报告与可搜索PDF文件。

PDF 批量 OCR 队列与断点续跑工具

针对多份 PDF 扫描件,提供队列、断点续跑与任务报告,适合批处理交付。

提示词 (Prompts):

请用中文生成一个在线PDF批处理工具的完整项目代码:支持一次选择多份PDF,建立任务队列,逐页OCR并保存中间结果到浏览器本地存储(IndexedDB),支持暂停/继续/失败重试/断点续跑。 必须交付:完整文件树+源码+运行命令+部署说明+不少于5项QA清单。 硬约束:必须支持“一键输出 HTML”——对每个任务生成一个可直接打开的单文件HTML报告(包含:文件名、页数、每页识别摘要、错误列表、耗时统计、下载链接),并提供“打包导出”把全部报告与结果文件放进一个zip(包含 index.html 汇总页)。 禁止:任何生成图片的提示词;只能渲染原PDF页面用于预览。

主要用途: 多文件OCR批处理、断点续跑、交付统一HTML报告与可搜索PDF结果。

PDF 版面区域选择 OCR(表格/票据)

允许在页面上框选区域做 OCR,提升票据、发票与表格的可用性。

提示词 (Prompts):

请用中文输出一个可部署的在线工具项目:用户上传PDF后,用PDF.js渲染页面;支持鼠标框选区域(矩形选择),只对选区做OCR,并将结果按字段分组(例如:抬头、金额、日期、税号等可自定义字段)。 交付物:完整源码、文件树、运行/构建/部署说明、至少8条QA清单。 一键输出HTML:提供按钮导出单文件HTML验收报告,必须包含:每个字段的识别结果、对应页面选区截图(由原PDF渲染得到,不是生成图片)、置信度、人工校对记录、导出时间与版本号。 同时提供导出JSON与导出可搜索PDF(可选)。

主要用途: 票据/表格类PDF的区域OCR、结构化提取、输出可验收HTML报告。

PDF 文字层抽取与可搜索性检测

快速判断PDF是否可搜索,并输出差异报告,避免交付后才发现不可检索。

提示词 (Prompts):

请用中文生成一个在线PDF可搜索性检测工具:上传PDF后,逐页抽取文字层(如果存在)并统计字符数/覆盖率;若无文字层则提示需要OCR;支持对比“OCR前/后”两份PDF的可搜索性指标差异。 交付:完整项目源码+文件树+命令+部署+至少5项测试或QA清单。 一键输出HTML:导出单文件HTML报告(包含每页指标、整体结论、建议处理策略、错误日志),可直接打开用于交付。

主要用途: 检测PDF是否可搜索、给出量化指标,并输出可交付的HTML诊断报告。

PDF OCR 结果对齐与高亮校对视图

把识别文本按坐标对齐回页面,支持高亮与点击定位,提升校对效率。

提示词 (Prompts):

请用中文输出一个在线工具:上传PDF后渲染页面;OCR获得文字与近似坐标;在预览层把识别出的词块以半透明高亮覆盖在原页面上,点击高亮可在右侧编辑文本;支持搜索词并在页面上滚动定位。 交付物必须包含:完整代码、文件树、运行命令、部署说明、至少8条QA清单。 一键输出HTML:导出单文件HTML校对报告,包含:每页高亮统计、疑似低置信度词列表、人工修改记录(前后对比)、以及可折叠的每页文本摘要。 禁止生成任何新图片;所有可视化只能来自原PDF渲染。

主要用途: OCR结果与页面对齐的可视化校对、检索定位、输出可审阅的HTML报告。

PDF 合并前 OCR 预检与风险提示器

合并多个PDF前先做OCR与可搜索性预检,避免合并后难以追溯问题来源。

提示词 (Prompts):

请用中文生成一个在线工具项目:用户拖入多份PDF;工具先并行做每份的可搜索性检测与抽样OCR(前N页);给出风险提示(例如:空白页、倾斜严重、分辨率过低、识别率可能很差)。 必须交付:完整源码与文件树、运行/构建/部署说明、至少5项测试或QA清单。 一键输出HTML:导出单文件HTML“合并前预检报告”,包含每个文件的指标摘要、风险标签、建议处理动作,以及合并建议顺序;并支持导出一个包含 index.html 的最小报告包。

主要用途: PDF批量合并前的OCR预检与风险评估,输出交付用HTML报告。

PDF OCR 文本清洗与术语纠错台

对OCR文本做清洗、正则替换、术语表纠错与一致性检查,适合标准化交付。

提示词 (Prompts):

请用中文输出一个可部署的在线工具:上传PDF并OCR后,提供文本清洗管线(去多余空格、合并断行、全角半角转换、常见错别字替换),支持导入术语表(CSV)进行一致性校对;支持对替换规则做预览与回滚。 交付物:完整项目代码+文件树+运行/构建命令+部署说明+至少8条QA清单。 一键输出HTML:导出单文件HTML“清洗与纠错报告”,包含:命中规则统计、替换前后对比、未命中术语列表、以及可复制的交付说明段落。

主要用途: OCR文本的标准化清洗与术语一致性校对,输出可交付HTML对比报告。

PDF 可搜索化一键交付包生成器

把处理后的文件与说明一次性打包,交付方只需打开一个 HTML 即可验收。

提示词 (Prompts):

请用中文生成一个在线工具项目:用户上传扫描PDF,工具完成OCR并导出可搜索PDF;然后提供“一键生成交付包”按钮,打包内容必须包含: - index.html(离线可打开的验收页:包含处理摘要、下载链接、QA清单、版本与时间) - output.pdf(可搜索PDF) - report.html(单文件详细报告,可选) - README.txt(纯文本交付说明) 要求:输出完整源码与文件树;给出运行、构建、部署说明;至少8条测试用例或QA清单。 注意:不要任何图像生成导向;页面预览仅来自原PDF渲染。

主要用途: 生成可搜索PDF并一键打包交付,确保包含可直接打开的HTML验收页。

用户评论 (0)

登录后参与讨论

立即登录 注册账号

暂无评论,快来抢沙发吧~

操作成功