[ad_1]

#Github情报 #OCR
OCRmyPDF 给你的PDF文档添加文字层
Github | WiKi
使用 OCRmyPDF 将 OCR 文本层添加到扫描的PDF文件中,从而可以对其进行搜索或复制粘贴。
✨ 特点
– 使用强大的开源 Tesseract OCR引擎识别,支持100多种语言
– 调用全部可用CPU资源进行OCR(耗电警告⚠️
– 从常规PDF生成可搜索的PDF文件
– 优化PDF尺寸,生成比输入文件小的文件
– 在执行OCR之前对图像进行歪斜校正和/或清洁
? 部署
– 支持多种操作系统 Linux, Win, macOS …
– 支持 brew install ocrmypdf 但需要自己安装语言库
– macOS 一键安装脚本 (努力更新中
– 可配合 Alfred / Launchabr 制作成 Workflow 使用
? 没有文字层的PDF文献/文档真的难受,OCRmyPDF的扫描精准度虽然说不是特别高, 但有了文字层,我们就可以方便的在文档里做标注了~
频道:@blog4563
[ad_2]