Umi-OCR批量图片转文字工具是一款离线OCR软件,批量导入本地图片 / 读取剪贴板,识别图片中的文本,输出到软件面板或本地 .txt / .md 文件。
免费:本项目所有代码开源,完全免费。
方便:解压即用,无需安装。不需要网络。
高效:OCR识别引擎是C++编译的PaddleOCR-json(PP-OCRv2.6 cpu_avx_mkl),比前代提速20%。只要电脑性能足够且支持mkldnn,通常能比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对非常规字形(手写、艺术字、小字、方向不正、杂乱背景等)也有不错的识别率。可设置忽略区域排除水印,进一步提高精准性。
系统支持 Win10 x64 。
不建议使用 Win7 ,识别引擎很可能无法运行。如果想尝试,win7 x64 sp1 打满系统升级补丁+安装vc运行库后有小概率能跑起来。
CPU必须具有AVX指令集。常见的家用CPU一般都满足该条件。
AVX | 支持的产品系列 | 不支持 | 存疑 |
---|---|---|---|
Intel | 酷睿Core,至强Xeon | 凌动Atom,安腾Itanium | 赛扬CEleron,奔腾Pentium |
AMD | 推土机架构及之后的产品,如锐龙Ryzen、速龙Athlon、FX 等 | K10架构及之前的产品 |
注意,Umi-OCR 软件本体只含简体中文&英文识别库。下面链接中的多国语言识别扩展包可导入繁中,日,韩,德,法语言,请按需下载。
下载压缩包并解压全部文件即可。
打开主程序,将任意图片/文件夹拖入窗口中的白色背景表格区域,或点击左上方的浏览选择图片。
点击右上方开始任务,等待进度条走完。
点击识别内容选项卡查看输出文字,或者前往第一张图片的目录查看识别结果txt文件。
快速识别剪贴板截图
按 [Win+Shift+S] 截取一张系统截图,或者在网页等地方复制一张图片。
切换到识别内容选项卡,点击剪贴板读取。
可以在设置选项卡中录制并启用全局快捷键,快速唤起程序识别。若此时程序窗口处在被覆盖的后方或者被最小化,则会自动挪到最前的位置。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
Umi-OCR_Paddle_v2.0.0.7z.exe
Rapid 引擎插件版
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.0.7z.exe
新增:批量任务(图片、文档)支持 暂停任务 。只要不退出软件,在待机/休眠后可以恢复任务。
新增:文档任务支持保存为 单层纯文本PDF 。
新增:HTTP OCR接口 允许设置 忽略区域 参数。???? 文档
新增:HTTP 二维码接口 允许设置 图像预处理 参数。???? 文档
新增:命令行–screenshot允许 指定屏幕范围 ,自动进行截图。???? 文档
修复:文档内容提取和写入时的坐标旋转、比例适配问题。
优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。
优化:文档任务保存的文件名规则。
UI:优化一些布局,调整一些文本,美化一些视觉效果。
提示:该资源为网盘资源,请提前安装好百度网盘电脑版