制造网站开发,手机网站开发+手机模拟器,wordpress转app,网站版面的图文是怎么做的一、数据集 本文以开源的CDLA数据集做为实验#xff0c;CDLA是一个中文文档版面分析数据集#xff0c;面向中文文献类#xff08;论文#xff09;场景。包含以下10个label#xff1a; 数据集下载地址#xff1a;https://github.com/buptlihang/CDLA
数据集是labelme格式…一、数据集 本文以开源的CDLA数据集做为实验CDLA是一个中文文档版面分析数据集面向中文文献类论文场景。包含以下10个label 数据集下载地址https://github.com/buptlihang/CDLA
数据集是labelme格式的文件需要自行转化成yolo训练所需要的格式最后文件放置形式如下 注意这个数据集有个问题就是缺乏段落标注含相关段落标注的开源模型可以查看上篇《【文档智能】包含段落的开源的中文版面分析模型》
二、安装所需要的依赖
pip install ultralytics三、配置yaml文件
cdla.yaml
#path: ./datasets/ # dataset root dir
train: cdla/images/train
val: cdla/images/dev
test: # test images (optional)nc: 10 # 数据集类别数量
names: [ # 数据集标签Text,Title,Figure,Figure caption,Table,Table caption,Header,Footer,Reference,Equation,
]
三、训练代码
from ultralytics import YOLO# model YOLO(yolov8n.yaml) # 重新训练模型
model YOLO(yolov8n.pt) # 加载预训练模型# Train the model
results model.train(datacdla.yaml, epochs100, imgsz640, device0)四、预测代码
from ultralytics import YOLOimage_path # 待预测图片路径
model_path # 权重路径
model YOLO(model_path)result model(image_path, saveTrue, conf0.5, save_cropFalse, line_width2)
print(result)print(result[0].names) # 输出id2label map
print(result[0].boxes) # 输出所有的检测到的bounding box
print(result[0].boxes.xyxy) # 输出所有的检测到的bounding box的左上和右下坐标
print(result[0].boxes.cls) # 输出所有的检测到的bounding box类别对应的id
print(result[0].boxes.conf) # 输出所有的检测到的bounding box的置信度