1、安装过程:

安装ocr

yum install tesseract-ocr

查找中文包
yum search tesseract-ocr | grep sim

安装中文包
yum install tesseract-langpack-chi_sim

安装版本信息:

? test-ugc-api01 tesseract tesseract -v
tesseract 3.04.00
leptonica-1.72
libgif 4.1.6(?) : libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7 : libwebp 0.3.0

2、java开发

注意版本匹配:3.04.00,采用tess4j

  
  
< dependency > < groupId > net.sourceforge.tess4j </ groupId > < artifactId > tess4j </ artifactId > < version > 3.0 . 0 </ version > </ dependency >

简单测试代码

  
  
public String ocr(String url) { String datapath = " /usr/share/tesseract/ " ; String language = " chi_sim " ; // 进行相关的检测 try { url = url.trim(); System. out .println( " url is: " + url); URL targetUrl = new URL(url); BufferedImage image = ImageIO.read(targetUrl); ByteBuffer buf = ImageIOHelper.convertimageData(image); int bpp = image.getColorModel().getPixelSize(); int bytespp = bpp / 8 ; int bytespl = ( int ) Math.ceil(image.getWidth() * bpp / 8.0 ); System. out .println( " bpp is: " + bpp + " ;bytespp is: " + bytespp + " ;bytespl is: " + bytespl); // 初始化 ITessAPI.TessBaseAPI handle = TessAPI1.TessBaseAPICreate(); TessAPI1.TessBaseAPIInit3(handle,datapath,language); TessAPI1.TessBaseAPISetPageSegMode(handle,ITessAPI.TesspageSegMode.PSM_AUTO); Pointer utf8Text = TessAPI1.TessBaseAPIRect(handle,buf,bytespp,bytespl, 0 ,image.getWidth(),image.getHeight()); String result = utf8Text.getString( 0 ); TessAPI1.TessDeleteText(utf8Text); TessAPI1.TessBaseAPIDelete(handle); System. out .println( " ============================================== " ); System. out .println( " result is: " + result); System. out .println( " ============================================== " ); if (result.equalsIgnoreCase( "" )){ System. out .println( " no detected words!! " ); } return result; } catch (Exception ex){ ex.printstacktrace(); } return " no detected words!! " ; }

注意:datapath要设置在tessdata的上一级目录

3、yum安装所在目录查询相关命令

  
  
#查询相关包 test - ugc - api01 tesseract rpm - qa | grep tesseract tesseract - langpack - chi_sim - 3.04 . 00 - 3 .el7.noarch tesseract - 3.04 . 00 - 3 .el7.x86_64 #查询包具体安装位置 test - ugc - api01 tesseract rpm - ql tesseract - 3.04 . 00 - 3 .el7.x86_64 / usr / bin / ambiguous_words / usr / bin / classifier_tester / usr / bin / cntraining / usr / bin / combine_tessdata / usr / bin / dawg2wordlist / usr / bin / mftraining / usr / bin / set_unicharset_properties / usr / bin / shapeclustering / usr / bin / tesseract / usr / bin / text2image / usr / bin / unicharset_extractor / usr / bin / wordlist2dawg / usr / lib64 / libtesseract.so. 3 / usr / lib64 / libtesseract.so. 3.0 . 4 / usr / share / doc / tesseract - 3.04 . 00 / usr / share / doc / tesseract - 3.04 . 00 / AUTHORS / usr / share / doc / tesseract - 3.04 . 00 / ChangeLog / usr / share / doc / tesseract - 3.04 . 00 / NEWS / usr / share / doc / tesseract - 3.04 . 00 / README / usr / share / doc / tesseract - 3.04 . 00 / eurotext.tif / usr / share / doc / tesseract - 3.04 . 00 / phototest.tif / usr / share / licenses / tesseract - 3.04 . 00 / usr / share / licenses / tesseract - 3.04 . 00 / copYING / usr / share / man / man1 / ambiguous_words. 1 .gz / usr / share / man / man1 / cntraining. 1 .gz / usr / share / man / man1 / combine_tessdata. 1 .gz / usr / share / man / man1 / dawg2wordlist. 1 .gz / usr / share / man / man1 / mftraining. 1 .gz / usr / share / man / man1 / shapeclustering. 1 .gz / usr / share / man / man1 / tesseract. 1 .gz / usr / share / man / man1 / unicharset_extractor. 1 .gz / usr / share / man / man1 / wordlist2dawg. 1 .gz / usr / share / man / man5 / unicharambigs. 5 .gz / usr / share / man / man5 / unicharset. 5 .gz / usr / share / tesseract / usr / share / tesseract / tessdata / usr / share / tesseract / tessdata / configs / usr / share / tesseract / tessdata / configs / ambigs.train / usr / share / tesseract / tessdata / configs / api_config / usr / share / tesseract / tessdata / configs / bigram / usr / share / tesseract / tessdata / configs / Box.train / usr / share / tesseract / tessdata / configs / Box.train.stderr / usr / share / tesseract / tessdata / configs / digits / usr / share / tesseract / tessdata / configs / hocr / usr / share / tesseract / tessdata / configs / inter / usr / share / tesseract / tessdata / configs / kannada / usr / share / tesseract / tessdata / configs / lineBox / usr / share / tesseract / tessdata / configs / logfile / usr / share / tesseract / tessdata / configs / makeBox / usr / share / tesseract / tessdata / configs / pdf / usr / share / tesseract / tessdata / configs / quiet / usr / share / tesseract / tessdata / configs / reBox / usr / share / tesseract / tessdata / configs / strokewidth / usr / share / tesseract / tessdata / configs / unlv / usr / share / tesseract / tessdata / eng.cube.bigrams / usr / share / tesseract / tessdata / eng.cube.fold / usr / share / tesseract / tessdata / eng.cube.lm / usr / share / tesseract / tessdata / eng.cube.nn / usr / share / tesseract / tessdata / eng.cube. params / usr / share / tesseract / tessdata / eng.cube.size / usr / share / tesseract / tessdata / eng.cube.word - freq / usr / share / tesseract / tessdata / eng.tesseract_cube.nn / usr / share / tesseract / tessdata / eng.traineddata / usr / share / tesseract / tessdata / pdf.ttf / usr / share / tesseract / tessdata / tessconfigs / usr / share / tesseract / tessdata / tessconfigs / batch / usr / share / tesseract / tessdata / tessconfigs / batch.nochop / usr / share / tesseract / tessdata / tessconfigs / matdemo / usr / share / tesseract / tessdata / tessconfigs / msdemo / usr / share / tesseract / tessdata / tessconfigs / nobatch / usr / share / tesseract / tessdata / tessconfigs / segdemo

查看.so文件接口

nm -D xxx.so

centos上 java使用Tesseract进行ocr识别的更多相关文章

  1. ios – 在哪里可以找到tesseract-&gt; setvariable函数的第一个参数的可用属性名称列表?

    从很多护目镜中,我只能找到其中几个,如下图所示:tesseract的setvariable我想知道他们中有多少人?有没有列表可用?如果有的话请给我链接.解决方法这个代码应该是iOS的诀窍…可能需要一点调整.

  2. ios – 是否可以使用Tesseract OCR识别iPhone屏幕上绘制的角色?

    从过去的2周开始,我正在努力实现“识别iPhone屏幕上绘制的角色”.我搜索这个,我找到了TesseractOCR.通过使用TesseractOCR,我们能够识别图片中的字符.现在我的问题是,是否可以使用TesseractOCR识别iPhone屏幕上绘制的角色?

  3. CentOS 8.2服务器上安装最新版Node.js的方法

    这篇文章主要介绍了CentOS 8.2服务器上安装最新版Node.js的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  4. centos+php+coreseek+sphinx+mysql之一coreseek安装篇

    这篇文章主要介绍了centos+php+coreseek+sphinx+mysql之一coreseek安装篇的相关资料,非常不错具有参考借鉴价值,需要的朋友可以参考下

  5. Centos7 中 Node.js安装简单方法

    这篇文章主要介绍了Centos7 中 Node.js安装简单方法,非常不错具有一定的参考借鉴价值,需要的朋友可以参考下

  6. nodejs脚本centos开机启动实操方法

    在本篇文章里小编给大家整理的是关于nodejs脚本centos开机启动实操方法,有兴趣的朋友们参考下。

  7. Centos PHP 扩展Xchche的安装教程

    这篇文章主要介绍了Centos PHP 扩展Xchche的安装教程的相关资料,非常不错,具有参考借鉴价值,需要的朋友可以参考下

  8. Linux CentOS系统下安装node.js与express的方法

    这篇文章主要给大家介绍了在Linux CentOS系统下安装node.js与express的方法,文中介绍的非常详细,相信对大家具有一定的参考价值,需要的朋友们下面来一起看看吧。

  9. CentOS上安装Node.js和mongodb笔记

    这篇文章主要介绍了CentOS上安装Node.js和mongodb笔记,本文讲解了Python安装、Node.js安装、npm安装、mongodb驱动安装、mongodb数据库操作测试代码等内容,需要的朋友可以参考下

  10. opencv+tesseract实现验证码识别的示例

    本文主要介绍了opencv+tesseract实现验证码识别的示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

随机推荐

  1. 在airgapped(离线)CentOS 6系统上安装yum软件包

    我有一个CentOS6系统,出于安全考虑,它已经被空气泄漏.它可能从未连接到互联网,如果有,它很长时间没有更新.我想将所有.rpm软件包放在一个驱动器上,这样它们就可以脱机安装而无需查询互联网.但是,我在测试VM上遇到的问题是,即使指定了本地路径,yum仍然会挂起并尝试从在线存储库进行更新.另外,有没有办法使用yum-utils/yumdownloader轻松获取该包的所有依赖项和所有依赖项?目前

  2. centos – 命名在日志旋转后停止记录到rsyslog

    CentOS6.2,绑定9.7.3,rsyslog4.6.2我最近设置了一个服务器,我注意到在日志轮换后,named已停止记录到/var/log/messages.我认为这很奇怪,因为所有日志记录都是通过rsyslog进行的,并且named不会直接写入日志文件.这更奇怪,因为我在更新区域文件后命名了HUPed,但它仍然没有记录.在我停止并重新启动命名后,记录恢复.这里发生了什么?

  3. centos – 显示错误的磁盘大小

    对于其中一个磁盘,Df-h在我的服务器上显示错误的空白区域:Cpanel表明它只有34GB免费,但还有更多.几分钟前,我删除了超过80GB的日志文件.所以,我确信它完全错了.fdisk-l/dev/sda2也显示错误:如果没有格式化,我该怎么做才能解决这个问题?并且打开文件描述符就是它需要使用才能做到这一点.所以…使用“lsof”并查找已删除的文件.重新启动写入日志文件的服务,你很可能会看到空间可用.

  4. 如何在centos 6.9上安装docker-ce 17?

    我目前正在尝试在centOS6.9服务器上安装docker-ce17,但是,当运行yuminstalldocker-ce时,我收到以下错误:如果我用跳过的标志运行它我仍然得到相同的消息,有没有人知道这方面的方法?

  5. centos – 闲置工作站的异常负载平均值

    我有一个新的工作站,具有不寻常的高负载平均值.机器规格是:>至强cpu>256GB的RAM>4x512GBSSD连接到LSI2108RAID控制器我从livecd安装了CentOS6.564位,配置了分区,网络,用户/组,并安装了一些软件,如开发工具和MATLAB.在启动几分钟后,工作站负载平均值的值介于0.5到0.9之间.但它没有做任何事情.因此我无法理解为什么负载平均值如此之高.你能帮我诊断一下这个问题吗?

  6. centos – Cryptsetup luks – 检查内核是否支持aes-xts-plain64密码

    我在CentOS5上使用cryptsetupluks加密加密了一堆硬盘.一切都很好,直到我将系统升级到CentOS6.现在我再也无法安装磁盘了.使用我的关键短语装载:我收到此错误:在/var/log/messages中:有关如何装载的任何想法?找到解决方案问题是驱动器使用大约512个字符长的交互式关键短语加密.出于某种原因,CentOS6中的新内核模块在由旧版本创建时无法正确读取512个字符的加密密钥.似乎只会影响内核或cryptsetup的不同版本,因为在同一系统上创建和打开时,512字符的密钥将起作用

  7. centos – 大量ssh登录尝试

    22个我今天登录CentOS盒找到以下内容这是过去3天内的11次登录尝试.WTF?请注意,这是我从我的提供商处获得的全新IP,该盒子是全新的.我还没有发布任何关于此框的内容.为什么我会进行如此大量的登录尝试?是某种IP/端口扫描?基本上有4名匪徒,其中2名来自中国,1名来自香港,1名来自Verizon.这只发生在SSH上.HTTP上没有问题.我应该将罪魁祸首子网路由吗?你们有什么建议?

  8. centos – kswap使用100%的CPU,即使有100GB的RAM也可用

    >Linux内核是否应该足够智能,只需从内存中清除旧缓存页而不是启动kswap?

  9. centos – Azure将VM从A2 / 3调整为DS2 v2

    我正在尝试调整前一段时间创建的几个AzureVM,从基本的A3和标准A3到标准的DS2v2.我似乎没有能力调整到这个大小的VM.必须从头开始重建服务器会有点痛苦.如果它有所不同我在VM中运行CentOS,每个都有一个带有应用程序和操作系统的磁盘.任何人都可以告诉我是否可以在不删除磁盘的情况下删除VM,创建新VM然后将磁盘附加到新VM?

  10. centos – 广泛使用RAM时服务器计算速度减慢

    我在非常具体的情况下遇到服务器速度下降的问题.事实是:>1)我使用计算应用WRF>2)我使用双XeonE5-2620v3和128GBRAM(NUMA架构–可能与问题有关!

返回
顶部