网站网页制作图片素材,直播带货平台,虹口基础微网站开发,网站开发学校有哪些介绍
什么是OCR#xff1f;
OCR是“Optical Character Recognition”的缩写#xff0c;中文意为“光学字符识别”。它是一种技术#xff0c;可以识别和转换打印在纸张或图像上的文字和字符为机器可处理的格式#xff0c;如计算机文本文件。通过使用OCR技术#xff0c;可…介绍
什么是OCR
OCR是“Optical Character Recognition”的缩写中文意为“光学字符识别”。它是一种技术可以识别和转换打印在纸张或图像上的文字和字符为机器可处理的格式如计算机文本文件。通过使用OCR技术可以快速地将纸质文档数字化从而使文本可以被编辑、搜索和分析。这项技术广泛应用于各种场合如图书馆和档案馆的文献数字化、 pdf 文件的文本搜索、以及扫描文档中的条形码和二维码等。
阿里云文字识别OCR读光OCR
阿里云文字识别OCR读光OCR是一款由阿里巴巴达摩院打造的OCR产品用于识别图片、文档、卡证等文件所包含的文字信息。
行识别模型
行识别模型是一种用于识别文本行中的字符内容的算法模型。它在光学字符识别OCR领域中扮演着重要的角色专注于将文本行中的字符转换成可识别的文本。
行识别模型可以应用于各种应用场景如自动化文档处理、车牌识别、手写体识别等为实现自动化文本识别提供了重要的基础有助于提高工作效率和准确性。
我们这里使用的是 “阿里云文字识别OCR读光OCR” 的模型放到本地来进行识别测试。
前置条件
1、准备电脑环境我当前用的是 4060 显卡 2、安装环境conda、python 3、下载模型通过下方链接地址下载模型
https://www.modelscope.cn/models/iic/cv_convnextTiny_ocr-recognition-general_damo/summary克隆下来后。 from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasksocr_recognition pipeline(Tasks.ocr_recognition, modeldamo/cv_convnextTiny_ocr-recognition-general_damo)
img_url cropped_image_1.png
result ocr_recognition(img_url)
print(result) from modelscope.pipelines import pipeline从 ModelScope 库中的 pipelines 模块导入 pipeline 函数。这个函数用于创建一个模型管道可以用来执行各种任务如文本分类、命名实体识别、OCR 等。 from modelscope.utils.constant import Tasks从 ModelScope 库中的 utils.constant 模块导入 Tasks 常量。这个常量包含了 ModelScope 支持的不同任务类型包括 OCR。 ocr_recognition pipeline(Tasks.ocr_recognition, modeldamo/cv_convnextTiny_ocr-recognition-general_damo)调用 pipeline 函数创建一个 OCR 识别任务的管道。Tasks.ocr_recognition 指定了这是一个 OCR 识别任务而 damo/cv_convnextTiny_ocr-recognition-general_damo 则指定了使用的模型名称或者模型路径。 img_url cropped_image_1.png定义一个变量 img_url用来存储待识别的图像文件的路径或者 URL。 result ocr_recognition(img_url)调用 ocr_recognition 管道传入待识别的图像路径并将识别结果保存在 result 变量中。 print(result)打印 OCR 识别的结果。
需要识别的图片 运行结果