当前位置: 首页 > news >正文

北京网站设计公司网站建设专家如何选

北京网站设计公司,网站建设专家如何选,网站视觉规范怎么做,常用网站建设软件有哪些最近几天#xff0c;paddleOCR开发了新的功能#xff0c;通过将图片中的表格提取出来#xff0c;效果还不错#xff0c;今天#xff0c;作者按照步骤测试了一波。 首先#xff0c;讲下这个工具是干什么用的#xff1a;它的功能主要是针对一张完整的PDF图片#xff0c;可…最近几天paddleOCR开发了新的功能通过将图片中的表格提取出来效果还不错今天作者按照步骤测试了一波。 首先讲下这个工具是干什么用的它的功能主要是针对一张完整的PDF图片可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以利用表格识别技术完整地提取表格结构信息使得表格图片变为可编辑的Excel文件。如下图所示可以进行版面分析表格识别。 核心技术在于两个一个是PP-Structure的版面分析技术另一个是PaddleDetection开源的高效检测算法PP-YOLO v2。 PP-Structure Pipeline介绍 下面作者按照官网的说明进行安装(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure/README_ch.md) #step1: 首先需要安装paddle # GPU安装 python -m pip install paddlepaddle-gpu2.1.1 -i https://mirror.baidu.com/pypi/simple # CPU安装作者在这里使用CPU安装  python -m pip install paddlepaddle2.1.1 -i https://mirror.baidu.com/pypi/simple #step2安装 Layout-Parser pip  install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl #step3安装PaddleOCR包含PP-OCR和PP-Structure pip install paddleocr2.2 这样就算安装好了但是途中会有一些报错信息一个是 ImportError: DLL load failed: 找不到指定的模块。 在查阅了相关的资料之后发现重新安装也没有用作者是通过安装旧版本的软件就解决了这个问题。另一个报错是cv2.imread读取图像结果为none,这个错误是由于你的路径中有中文字体全部修改为英文的即可。 接下来就是运行主要的程序代码 1 import os2 import cv23 from paddleocr import PPStructure,draw_structure_result,save_structure_res4 5 table_engine PPStructure(show_logTrue)6 7 #你的文件结果目录8 save_folder C:/Users/hp/Desktop/pdf_ocr/output/table9  10 #输入的图片 11 img_path C:/Users/hp/Desktop/pdf_ocr/table/5.png 12 img cv2.imread(img_path) 13  14 result table_engine(img) 15 save_structure_res(result, save_folder,os.path.basename(img_path).split(.)[0]) 16  17 for line in result: 18     line.pop(img) 19     print(line) 20  21 from PIL import Image 22  23 #字体路径可以从paddleOCR的github上面下载 24 font_path C:/Users/hp/Desktop/pdf_ocr/fonts/simfang.ttf25 image Image.open(img_path).convert(RGB) 26 im_show draw_structure_result(image, result,font_pathfont_path) 27 im_show Image.fromarray(im_show) 28 im_show.save(result.jpg)运行完成后每张图片会在​​output​​字段指定的目录下有一个同名目录图片里的每个表格会存储为一个excel图片区域会被裁剪之后保存下来excel文件和图片名名为表格在图片里的坐标。 这样就可以看到识别出来的excel表格了。
http://www.w-s-a.com/news/801388/

相关文章:

  • 在线网站备案站长seo综合查询工具
  • 网站根 html网站建设行业数据
  • 网站公司做的网站有最字设计说明室内设计
  • 在线网站代码生成我想做个百度网站怎么做
  • 网站的建设费用分为长治市建设厅官方网站
  • 做网站都有哪些费用建设免费手机网站
  • 网站 组成代码做网站图片怎么插
  • 2020中国企业500强榜单南宁seo标准
  • 北美购物网站排名烟台专业的网站建站公司
  • 门户网站设计特点营销策划咨询机构
  • 天津做网站就到徽信xiala5中国营销型网站
  • 外汇网站建设制作深圳三站合一网站建设
  • 深圳坂田网站设计公司有哪些学校网站建设管理办法
  • 太原建设银行网站中山营销型网站设计
  • 广东省建设厅官方网站多少钱江苏省江建集团有限公司建设网站
  • 网站开发主流服装网站开发课程设计
  • 在iis里面创建网站wordpress响应式视频
  • 学设计哪个网站好网页设计音乐网站
  • 可以自己做斗图的网站上海模板建站多少钱
  • 山东川畅信息技术有限公司网站建设网站开发任务书
  • 网站排版设计欣赏搭建公司介绍网站
  • 网站弹窗是怎么做的长沙智优营家
  • 手机网站菜单设计模板菜单网站图片素材
  • 浙江网站推广爱企查企业查询入口
  • 公司网站平台vs2012网站开发课程设计
  • 哪些方法可以建设网站做网站失败
  • 龙岗网站建设技术wordpress左右两栏
  • 电子商务网站开发与应用的介绍怎么查询域名是否备案
  • 想做一个自己设计公司的网站怎么做的权威发布型舆情回应
  • 做ppt用的音效网站python基础教程网易