郎创网站建设,做搞笑app好还是做电影网站好,网站嵌入js,网络架构的基本特征是什么目录 一、更新概述
二、环境安装 1.基础环境配置 2.模型参数下载 3.参数地址配置——settings.py
三、指令使用 1.命令指令运行 一、更新概述 surya项目Github地址#xff1a;https://github.com/VikParuchuri/surya 号称今年最强OCR的surya近期迎来新的更新#xff0c;Vik…目录 一、更新概述
二、环境安装 1.基础环境配置 2.模型参数下载 3.参数地址配置——settings.py
三、指令使用 1.命令指令运行 一、更新概述 surya项目Github地址https://github.com/VikParuchuri/surya 号称今年最强OCR的surya近期迎来新的更新Vik大佬更新了表格检测的模型。 最新surya——0.6.1版本的识别效果如下。现在还可以识别文章阅读的行文顺序对表格内的数字信息也可以很好的提取。 二、环境安装 1.基础环境配置 在之前使用surya的0.3.0版本中使用的是torch1.12.1更新后的surya的0.6.0版本需要更高的torch环境因此需要重新创建虚拟环境并安装高于2.3.0的Pytorch。 此处python版本虽然官方文档说和0.3.0版本一样3.9即可但使用3.9会红字报错因为一些代码使用和书写规范在3.9后发生改变最好使用版本在3.10以上如果坚持使用3.9按下面使用部分报错修改处处理源码。
# 创建虚拟conda环境
conda create -n surya0.6 python3.10
# 激活环境
conda activate surya0.6# 安装更高版本pytorch
pip install torch2.4.0 torchvision0.19.0 torchaudio2.4.0 --index-url https://download.pytorch.org/whl/cu118# 或者官网稳定版2.4.1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118## cpu版本
pip install torch2.4.0 torchvision0.19.0 torchaudio2.4.0 --index-url https://download.pytorch.org/whl/cpu pytorch安装好了以后直接pip安装最新版surya即可。在编写此文时最新版的为0.6.1版本。
# 安装最新版本surya
pip install --upgrade surya-ocr 最好将其最新的源码也下载下来方便后续项目的查看和调试。 Github地址Suryahttps://github.com/VikParuchuri/surya 2.模型参数下载 和之前一样如果想直接使用surya需要有良好的“科学上网”配置因为源码或安装库里面都不直接下载好的了模型参数第一次使用会到huggingface下载对应模型参数。 因此有两种解决办法一是使用huggingface的国内镜像网站hf-mirror或者提前下载好模型参数到项目目录在设置中修改模型地址。本文选择后者。 huggingface作者surya模型参数保存地址https://huggingface.co/vikp 推荐国内hugging-mirror镜像地址https://hf-mirror.com/models?searchvikp 下载好的模型参数可以在surya源码下载处新建一个huggingmodel子文件夹下存放各种模型参数。 3.参数地址配置——settings.py 推荐将模型下载到本地后再在surya项目环境安装包源码处修改全局参数中关于模型加载地址部分这样更不容易报错。 首先打开在conda中安装的虚拟环境文件夹地址在以下文件路径中。所有安装在虚拟环境中的库都在此路径下。
miniconda\envs\surya0.6\Lib\site-packages 在所有安装库中找到surya名称的文件再打开就可以看到settings.py文件了。 根据之前源码拆解博文修改其中的模型配置参数。 博文快速链接https://blog.csdn.net/qq_58718853/article/details/137815688 三、指令使用 1.命令指令运行 有了上述环境准备后可以直接使用指令快速使用。只需将实际本地图片地址替换下方Data_Path即可。
# ocr文本检测识别
surya_ocr Data_Path# detect文本行检测
surya_detect Data_Path# layout板式分析
surya_layout Data_PATH# table表格检测
surya_table Data_PATH# order文本阅读顺序
surya_order Data_PATH首先实验一下检测模型只需要surya_det3是否可以使用。结果会在项目项新建一个results文件夹。 再来测试一下ocr模型。需要surya_det3和surya_rec2模型 还有表格模型。需要surya_rec2和surya_layout3和surya_tablerec模型 2.可视化结果 只需在上述命令行指令后面加上“--images”即可完成可视化保存。
# 可视化保存
surya_detect DataPath --images 本文随意截取了两张csdn界面的图像使用surya进行识别检测测试。 文本行检测模型可视化结果如下。其检测框似乎还不错至少有95%以上的正确框。 板式分析layout模型检测效果如下。 表格检测模型效果如下。