建设银行国际互联网站,如何做好网站建设工作,网站对公司的作用是什么,百度售后服务电话人工赛题分析
大赛地址
https://tianchi.aliyun.com/competition/entrance/532098/introduction?spma2c22.12281925.0.0.52b97137bpVnmh
任务描述
主体事件检测是语言文本分析和金融领域智能应用的重要任务之一#xff0c;如在金融风控领域往往会对公司主体进行风险事件的检测…赛题分析
大赛地址
https://tianchi.aliyun.com/competition/entrance/532098/introduction?spma2c22.12281925.0.0.52b97137bpVnmh
任务描述
主体事件检测是语言文本分析和金融领域智能应用的重要任务之一如在金融风控领域往往会对公司主体进行风险事件的检测。基于句子粒度的上下文进行公司事件检测事件包含事件类型和主体要素即公司主体句中可能存在多个事件多个公司主体且每个公司都可能存在多个事件类型标签并且各类型标注样本分布不均匀部分类型样本量较少我们希望检测出文本中包含的所有主体事件。本次评测任务的文本语料来自于互联上的公开新闻、报告。
数据描述
输入 一段文本X
输出 文本X中所有的事件类型及对应的公司主体
示例 输入{text_id: 123456, text: 播州城投多次被列为被执行人同时涉及一系列诉讼案件并多次被纳入失信被执行人名单由于公司债务逾期规模大区域债务负担重 7月母公司遵义道桥建设(集团)有限公司遵义道桥开始进行债务重组并将银行类债权延期 10年} 输出{text_id: 123456, events: [{type:被列为失信被执行人 ,entity:播州城投} {type: 债务违约,entity: 播州城投}, {type: 债务重组, entity: 遵义道桥建设(集团)有限公司}, {type: 债务重组, entity: 遵义道桥}]} 方案陈述
整体方案的模型架构
结构图如下所示 传统模型主要依赖传统的信息抽取方法来做包括 bertcrf、 bertspan 和 bertglobal pointer等方案 LLMs依赖已经预训练好的大模型包括 mt5、mt0、Ziya-LLaMA、 chatglm 等微调方式包括全量指令微调以及基于 Lora 的指令微调 后处理针对预测的数据进行异常符、原文修正、大小写修正、繁体 简体修正等 融合采用加权投票融合 下面依次介绍每个方案的细节。 传统方案之bert-crf
crf这么基础的内容这里就不说了用的就是原生的crf没有进行魔改需要说明一点的就是这个任务中同一个公司主体如果有多个事件类型crf这个方案是解决不了的好在这个任务中这种一个公司主体对应多个事件类型的情况不多。
传统方案之bert-span
上文也说了这个任务中存在一个公司主体对应多个事件类型的情况为了兼容这种情况我对原来的span编码解码框架稍稍进行了魔改结构图如下 原生的span结构以双指针的形式替代 CRF 模块可以解决实体嵌套 问题首尾指针可以截取一个实体首位指针的类型指代这个截取的实体的标签类型但是在本次任务中为了解决一个公司主体对应多个事件类型的情况我们改变了首尾指针的形式融入多标签的思想基于多标签的span指针可以轻松实现一个实体(公司主体)指向多个类型(事件类型)。 传统方案之bert-gp
gp用的就是苏剑林原生的方案没有进行改动所以呢我也不想废话了估计你们也不想听我废话你们直接看苏神的讲解吧。苏剑林科学空间https://spaces.ac.cn/archives/8265 大模型(LLM)方案
本次任务我们将大模型用在了事件检测任务上主要尝试了mt5、chatglm、以及llma模型训练方式是全参数微调和Lora微调。
指令构造
指令 1
使用自然语言抽取二元组,请从句子中抽取出所有的事件类型及对应的公司主体, 句中可能存在多个事件、多个公司主体且每个公司都可能存在多个事件类型标签,最后以 (公司主体,事件类型)的形式回答。
例子
instruction:使用自然语言抽取二元组,请从句子中抽取出所有的事件类型 及对应的公司主体,句中可能存在多个事件、多个公司主体且每个公司都可能存在多个事 件类型标签,最后以(公司主体,事件类型)的形式回答。,input:而在此之前从 2013 开始至 2018 年连续 5 年时间苏州银行的核心一级资本充足率、一级资本充足率 均在下降资本充足率在 2015 年出现回升后也再度连续三年下降,output:(苏州 银行,资本充足不足) 指令 2
这是一个金融实体抽取的任务请从以下句子抽取公司主体以及相应的事件类 型按(公司主体,事件类型)的形式回答。
例子
这是一个金融实体抽取的任务请从以下句子抽取公司主体以及相应的事件类 型按(公司主体,事件类型)的形式回答。 例子instruction:这是一个金融实体抽取的任务请从以下句子抽取公司主体 以及相应的事件类型按(公司主体,事件类型)的形式回答。,input:而在此之 前从 2013 开始至 2018 年连续 5 年时间苏州银行的核心一级资本充足率、一级资 本充足率均在下降资本充足率在 2015 年出现回升后也再度连续三年下降 ,output:(苏州银行,资本充足不足) 微调
mt5、mt0 以及 umt5 经过多语种预训练对于这个任务 也适配在 large 模型可以模型并行来训练 在 xl 以及 xxl 模 型需要基于 deepspeed 对模型参数进行切分来提高模型训练速度 xxl 模型在 A100 卡上全量微调。
Lora 指令微调当前中文模型包括 chatglm、ziya-llama、ZhiXi (智 析
本次基于大模型做事件检测任务部分参考如下范例 总结
本次赛道任务我们总结如下 在数据层面我们做了一些数据增广聚合相同事件类型下所有公司主体随机替换同个类型的公司 实体进行数据生成 在传统方案上(crf、span、gp)我们通过一些手段(fgm、pgd、swa、ema、r-drop、multi-drop等)增强了模型的泛化性和鲁棒性 选择了多种的编码框架crf是序列标记span是指针抽取gp是片段排列LLM是基于指令的生成式每一种框架都有自己的优势和短板融合起来增益良多
最后值得一提的是通过本次任务大模型(LLM)虽然参数大很多训练时间长很多但是单个大模型的效果并没有比传统方案的效果好从性价比上甚至处于劣势但是差异大不同框架之间差异大融合效果提升很多。