windows 10环境下安装Tesseract-OCR与python集成

2020-05-17 原文

前言

Tesseract是一个开源的ocr引擎，可以开箱即用，项目最初由惠普实验室支持，1996年被移植到Windows上，1998年进行了C++化。在2005年Tesseract由惠普公司宣布开源。2006年到现在，都由Google公司开发。

官网宣传目前支持100多种语言的识别，根据我的测试，目前感觉其对机器打印的比较规整的英语，或者阿拉伯数字的识别准确率还是挺高的，但是对手写的任何东西，效果都非常一般，不过这已经相当不错了。

环境介绍

基础软件介绍：

windows 10
anaconda 4.5.4
python 3.6.5
opencv 3.4.1 (非必须)
pycharm 2018 (非必须，可以用自己爱好的ide)

注意这里我直接装的anaconda4.x（一个python的科学管理软件与java的maven比较类似）的版本，它已经内置支持python的各种版本，省去了一些兼容问题，同时在anaconda的cmd窗口中，如果不想使用自身的conda命令安装软件，我们还可以用pip命令安装，这一点是不冲突的，关于anaconda的安装请参考我前面的文章。

Tesseract的安装

Tesseract的github地址：https://github.com/tesseract-ocr/tesseract

Tesseract的安装：

（1）Tesseract本身没有windows的安装包，不过它指定了一个第三方的封装的windows安装包，在其wiki上有说明，大家可直接到这个地址进行下载：https://digi.bib.uni-mannheim.de/tesseract/

下载后就是一个exe安装包，直接右击安装即可，安装完成之后，配置一下环境变量，编辑系统变量里面 path，添加下面的安装路径：

C:\Program Files (x86)\Tesseract-OCR

安装完成之后，直接cmd输入：

命令：
tesseract -v
输出如下，即代表成功：
tesseract 4.0.0-beta.1-108-gf291
 leptonica-1.76.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.2.0

注意，这一步在windows上是必须安装的，否则运行程序时，会抛出异常：

[WinError 2] 系统找不到指定的文件

（2）安装python的封装接口：

pip install pillow  #一个python的图像处理库，PyTesseract依赖
pip install PyTesseract

注意第一步必须安装成功，同时配置好环境变量，否则第二步必会报错，因为第二步是接口，运行时候会调用第一步的原C++写的类库。

Tesseract的使用

测试图1，纯数字：

结果：

测试图2，英文：

As you can see in this screenshot,the thresholded image is very clear and the background has been removed. Our script correctly prints the contents of the image to the console.

测试图3，手写数字：

ar oe

python代码如下：

from  PIL import  Image
import PyTesseract
import  cv2 as cv


img_path='F:/fb/xxx.jpg'

# img_path='orgin.jpg'

# img_path='F:/fb/hpop.jpg'

# 依赖opencv
img=cv.imread(img_path)
text=PyTesseract.image_to_string(Image.fromarray(img))


不依赖opencv写法
# text=PyTesseract.image_to_string(Image.open(img_path))


print(text)

前面说过，对于机器打印的比较规则的字符，Tesseract识别起来还是比较给力的，至于手写的字符，识别效果比较差，可以看到上面的手写数字识别出来的都是错误的，当然这里也有调优的余地，比如给图片做灰度，模糊，去燥，二值化等等，可能结果会稍微好一点。

总结

本篇文章介绍了Tesseract在windows环境下的安装配置，同时介绍了如何在python中集成使用，感兴趣的朋友可以尝试一下。

windows 10环境下安装Tesseract-OCR与python集成的更多相关文章

XCode 3.2 Ruby和Python模板

在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板？我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板
ios – 在哪里可以找到tesseract-> setvariable函数的第一个参数的可用属性名称列表？

从很多护目镜中,我只能找到其中几个,如下图所示：tesseract的setvariable我想知道他们中有多少人？有没有列表可用？如果有的话请给我链接.解决方法这个代码应该是iOS的诀窍…可能需要一点调整.
ios – 是否可以使用Tesseract OCR识别iPhone屏幕上绘制的角色？

从过去的2周开始,我正在努力实现“识别iPhone屏幕上绘制的角色”.我搜索这个,我找到了TesseractOCR.通过使用TesseractOCR,我们能够识别图片中的字符.现在我的问题是,是否可以使用TesseractOCR识别iPhone屏幕上绘制的角色？
Swift基本使用-函数和闭包(三)

声明函数和其他脚本语言有相似的地方，比较明显的地方是声明函数的关键字swift也出现了Python中的组元，可以通过一个组元返回多个值。传递可变参数，函数以数组的形式获取参数swift中函数可以嵌套，被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。
10 个Python中Pip的使用技巧分享

众所周知，pip 可以安装、更新、卸载 Python 的第三方库，非常方便。本文小编为大家总结了Python中Pip的使用技巧，需要的可以参考一下
Swift、Go、Julia与R能否挑战 Python 的王者地位

本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
红薯因 Swift 重写开源中国失败，貌似欲改用 Python

本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
你没看错：Swift可以直接调用Python函数库

上周Perfect又推出了新一轮服务器端Swift增强函数库：Perfect-Python。对，你没看错，在服务器端Swift其实可以轻松从其他语种的函数库中直接拿来调用，不需要修改任何内容。以如下python脚本为例：Perfect-Python可以用下列方法封装并调用以上函数，您所需要注意的仅仅是其函数名称以及参数。
Swift中的列表解析

在Swift中完成这个的最简单的方法是什么？我在寻找类似的东西：从Swift2.x开始，有一些与你的Python样式列表解析相当的东西。(在这个意义上，它更像是Python的xrange。如果你想保持集合懒惰一路通过，只是这样说：与Python中的列表解析语法不同，Swift中的这些操作遵循与其他操作相同的语法。
swift抛出终端的python错误

每当我尝试启动与python相关的swift时,我都会收到错误.我该如何解决？

随机推荐

static – 在页面之间共享数据的最佳实践

我想知道在UWP的页面之间发送像’selectedItem’等变量的最佳做法是什么？创建一个每个页面都知道的静态全局变量类是一个好主意吗？
.net – 为Windows窗体控件提供百分比宽度/高度

WindowsForm开发的新手,但在Web开发方面经验丰富.有没有办法为Windows窗体控件指定百分比宽度/高度,以便在用户调整窗口大小时扩展/缩小？当窗口调整大小时,可以编写代码来改变控件的宽度/高度,但我希望有更好的方法,比如在HTML/CSS中.在那儿？
使用Windows Azure查询表存储数据

我需要使用特定帐户吗？>将应用程序部署到Azure服务后,如何查询数据？GoogleAppEngine有一个数据查看器/查询工具,Azure有类似的东西吗？>您可以看到的sqlExpressintance仅在开发结构中,并且一旦您表示没有等效,所以请小心使用它.>您可以尝试使用Linqpad查询表格.看看JamieThomson的thispost.
windows – SetupDiGetClassDevs是否与文档中的设备实例ID一起使用？

有没有更好的方法可以使用DBT_DEVICEARRIVAL事件中的数据获取设备的更多信息？您似乎必须指定DIGCF_ALLCLASSES标志以查找与给定设备实例ID匹配的所有类,或者指定ClassGuid并使用DIGCF_DEFAULT标志.这对我有用：带输出：
Windows Live ID是OpenID提供商吗？

不,WindowsLiveID不是OpenID提供商.他们使用专有协议.自从他们的“测试版”期结束以来,他们从未宣布计划继续它.
如果我在代码中进行了更改,是否需要重新安装Windows服务？

我写了一个Windows服务并安装它.现在我对代码进行了一些更改并重新构建了解决方案.我还应该重新安装服务吗？不,只需停止它,替换文件,然后重新启动它.
带有双引号的字符串回显使用Windows批处理输出文件

我正在尝试使用Windows批处理文件重写配置文件.我循环遍历文件的行并查找我想要用指定的新行替换的行.我有一个’函数’将行写入文件问题是％Text％是一个嵌入双引号的字符串.然后失败了.可能还有其他角色也会导致失败.如何才能使用配置文件中的所有文本？尝试将所有“在文本中替换为^”.^是转义字符,因此“将被视为常规字符你可以尝试以下方法：其他可能导致错误的字符是：
.net – 将控制台应用程序转换为服务？

我正在寻找不同的优势/劣势,将我们长期使用的控制台应用程序转换为Windows服务.我们为ActiveMQ使用了一个叫做java服务包装器的东西,我相信人们告诉我你可以用它包装任何东西.这并不是说你应该用它包装任何东西;我们遇到了这个问题.控制台应用程序是一个.NET控制台应用程序,默认情况下会将大量信息记录到控制台,尽管这是可配置的.任何推荐？我们应该在VisualStudio中将其重建为服务吗？我使用“-install”/“-uninstall”开关执行此操作.例如,seehere.
windows – 捕获外部程序的STDOUT和STDERR *同时*它正在执行(Ruby)

哦,我在Windows上:-(实际上,它比我想象的要简单,这看起来很完美：…是的,它适用于Windows！
windows – 当我试图批量打印变量时,为什么我得到“Echo is on”

我想要执行一个简单的批处理文件脚本：当我在XP中运行时,它给了我预期的输出,但是当我在Vista或Windows7中运行它时,我在尝试打印值时得到“EchoisOn”.以下是程序的输出：摆脱集合表达式中的空格.等号(=)的两侧可以并且应该没有空格BTW：我通常在@echo关闭的情况下启动所有批处理文件,并以@echo结束它们,所以我可以避免将代码与批处理文件的输出混合.它只是使您的批处理文件输出更好,更清洁.