网站维护有多长时间,郑州手工外发加工网,每天看七个广告赚40元的app,wordpress 旅游 主题生活中我们可能会遇到想从图片上直接复制上边的文字#xff0c;该如何获取呢#xff0c;接下来看看如何使用Java程序实现从图片中读取文字。
实现过程
1、引入Tess4J 依赖
!--Tess4J 依赖--
dependencygroupIdnet.sourceforge.tess4j/groupId…生活中我们可能会遇到想从图片上直接复制上边的文字该如何获取呢接下来看看如何使用Java程序实现从图片中读取文字。
实现过程
1、引入Tess4J 依赖
!--Tess4J 依赖--
dependencygroupIdnet.sourceforge.tess4j/groupIdartifactIdtess4j/artifactIdversion5.12.0/version/dependency2、下载字体库 https://github.com/tesseract-ocr/tessdata 3、核心代码 // imagePath为图片路径language为识别语言public String getWordFromImage(String imagePath, String language) {//创建Tesseract对象ITesseract tesseract new Tesseract();//设置字体库路径tesseract.setDatapath(E:\\xxxx\\traineddata);//设置识别语言 chi_sim/engtesseract.setLanguage(language);//执行ocr识别String result null;try {result tesseract.doOCR(new File(imagePath));} catch (TesseractException e) {log.error(识别有误,e);}return result;}错误处理
Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory 出现这个问题的原因是设置字体库路径时路径中包含中文无法识别需要把字体库放到一个全英文的路径下即可
ITesseract tesseract new Tesseract();
//设置字体库路径
tesseract.setDatapath(E:\\xxx\\xxx\\traineddata);这里的路径不可以包含中文不然读取不到