当前位置: 首页 > news >正文

百度智能建站平台微信开放平台账号怎么注销

百度智能建站平台,微信开放平台账号怎么注销,网站一般用什么语言,工业风 网站建设摘要 近年来#xff0c;自我增强成为在低资源场景下提升命名实体识别性能的研究热点。Token substitution and mixup #xff08;token替换和表征混合#xff09;是两种有效提升NER性能的自增强方法。明显#xff0c;自增强方法得到的增强数据可能由潜在的噪声。先前的研究…摘要 近年来自我增强成为在低资源场景下提升命名实体识别性能的研究热点。Token substitution and mixup token替换和表征混合是两种有效提升NER性能的自增强方法。明显自增强方法得到的增强数据可能由潜在的噪声。先前的研究针对特定的自增强方法设计特定的基于规则约束来降低噪声。在这篇文章中我们反思了这两个典型的针对NER的自增强方法。提出来提出了一个联合的 meta-reweighting 的策略去实现自然整合。我们的方法很容易扩展到其他自增强方法Experiments on different Chinese and English NER benchmarks。我们的方法可以有效的提升自增强方法的表现。 介绍 NER目的是从一些无结构文本中提取预训练命名实体。是NLP的一个基础任务。几十年来都已经被广泛的研究。 近期supervised sequence labeling neural models推动NER不断取得效果。 基于神经网络的方法推动NER任务不断取得更好的表现但是其通常需要大规模标注数据这在真实场景中是不现实的 the low-resource setting with only a small amount of annotated corpus available普遍应用是更加切合实际的 The major motivation is to generate a pseudo training example set deduced from the original gold-labeled training data automatically a pseudo training example set: 伪训练示例集。由原始的基于标签的训练数据集自动推导。 a token-level task, token substitution.mixup.the ground-level inputs and the high-level hidden representations (低层次的输入和高层次的隐藏表示 数据自增强是一个小样本任务可行的解法对于 token-level 的 NER 任务token 替换和表征混合是常用的方法。但自增强也有局限性我们需要为每种特定的自增强方法单独进行一些设计来降低自增强所带来的噪声缓解噪声对效果的影响。本文提出了 meta-reweighting 框架将各类方法联合起来。 尽管如此我们尝试放宽前人方法中的约束得到更多的伪训练示例。这样必然会产生更多低质量增强样本。这可能会降低模型的效果。此我们提出 meta reweighting 策略来控制增强样本的质量。同时使用 example reweighting 机制可以很自然的将两种方法结合在一起。 数据集 最后on several Chinese and English NER benchmark datasets our Approach Baseline model 基准模型架构 BERT-BiLSTM-CRF input representation 输入序列 X(x1,x2,⋯,xN)X (x_1,x_2,\cdots,x_N)X(x1​,x2​,⋯,xN​) of length n使用预训练BERT,将其转换为 sequential hidden vectors e1,e2,⋯,eNBERT(x)e_1,e_2,\cdots,e_N BERT(x)e1​,e2​,⋯,eN​BERT(x) BiLSTM encoding h1,h2,⋯,hnBiLSTM(e1,e2,⋯,eN)h_1,h_2,\cdots,h_n BiLSTM(e_1,e_2,\cdots,e_N)h1​,h2​,⋯,hn​BiLSTM(e1​,e2​,⋯,eN​) CRF decoding 最后解码过程使用 CRF 进行解码先将得到的表征过一层线性层作为初始的标签分数定义一个标签转移矩阵 TTT 来建模标签之间的依赖关系**。对于一个标签序列 其分数 计算如下 oiwhib,o_i wh_i b,oi​whi​b, s(Y∣X)∑i1n(Tyi−1,yioi[yi])s(Y|X) \sum^n_{i 1}(T_{y_{i -1},y_i} o_i[y_i])s(Y∣X)i1∑n​(Tyi−1​,yi​​oi​[yi​]) 标签转移矩阵TTT 其中W,b,TW,b,TW,b,T都是模型参数最后使用维比特算法**得到最佳的标签序列训练的损失函数采用句子级别的交叉熵损失 对于给定的监督样本对(X,Y)(X,Y)(X,Y),其条件概率P(Y∣X)P(Y|X)P(Y∣X)计算公式如下: 自增强方法 自增强方法减少了大规模的人工标注需求这能够被应用在the input level and the representation level.Token substitution and mixup 是命名实体识别的两个有效的方法因此我们去尝试扩展这两个有效的方法。 Token Substitution tokentokentoken替换是在原始的训练文本中对部分tokentokentoken进行替换得到伪样本本文通过构建同义词词典来进行token替换。 asynonymdictionarya synonym dictionaryasynonymdictionary:同一词词典。 词典中即包含实体词也包含大量的普通词遵循前人的设置我们将所有属于同一实体类型的词当做同义词。 并且添加到实体词典中作者将其称为entity mention substitution (EMS)。同时我们也将将 token 替换扩展到了“O”类型中作者将其称为 normal word substitution (NWS)。作者使用word2vecword2vecword2vec方法在 wikidata 上通过余弦相似度找到 k 个最近邻的词作为“O”类型词的同义词。 这里作者设置了参数来平衡 EMS 和 NWS 的比率在 entity diversity 和 context diversity 之间达到更好的 trade-off。 Mixup for CRF 不同与tokentokentoken替换在原始文本上做增强mixup 是在表征上进行处理。 heuristic rules 启发式算法。 本文将mixup方法扩展到CRF层。 the gold-labeled training set 给出示例 (X1,Y1)(X_1,Y_1)(X1​,Y1​)和 (X2,X2)(X_2,X_2)(X2​,X2​) the linear interpolation: 线性插值法。 形式上给定一个样本对首先用BERTBERTBERT得到其向量和然后通过参数将两个样本混合。 损失函数可以被计算为 重点关注mixup和词替换方法。 Meta Reweighting 自增强技术可以有效的产生大量的伪样本如何控制增强示例的质量是一个不容忽视的挑战。sentence-level classification task 句子级别的分类任务。the semantics of the context. 上下文信息. 作者使用 meta reweighting 策略为 mini batch 中的训练数据分配样本级的权重。Intuitively 直觉上看。the meta-data set, 标注样本the example-wise weights 样本级别权重。 在少样本设置中我们希望少量的标注样本能够引导增强样本进行模型参数更新觉上看如果增强样本的数据分布和其梯度下降的方向与标注样本相似说明模型能够从增强样本中学到更多有用的信息。 算法流程如下 实验 数据集采用 OntoNotes 4、OntoNotes 5、微博和 CoNLL03所有数据集均采用 BIOES 标注方式。 执行细节 Gradient clipping 梯度裁剪manual annotations 手工标注sophisticated model architecture 复杂的模型架构。 运行模型 the BiLSTM-CRF mode pre-trained BERT 自增强主流的方法 token substitutionparaphrasingmixup 文章灵感激发 Many previous studies have explored the example weighting mechanism in domain adaption looked into the example weighting methods for cross-domain tasks。Ren et al. (2018) adapted the MAML algorithm (Finn et al., 2017) and proposed a meta-learning algorithm to automatically weight training examples of the noisy label using a small unbiased validation set. 结论 本文提出了 meta reweighting 策略来增强伪样本的效果。是一篇很有启发性的文章从梯度的角度出发结合类似于 MAML 中 gradient by gradient 的思想用标注样本来指导伪样本训练为伪样本的损失加权对伪样本的梯度下降的方向进行修正使其与标注样本更加相似。 经验 同一个技术使用的跟前人不一样就叫做创新。罗列常见的数据增强方法换种方法后续都能发文章。借鉴其他领域的主流方法换个话题用到之知识图谱中比如领域自适应中的the example weighting mechanism应用到命名实体识别中。现在做的小步骤都是复现代码然后再代码上做微小的改动。继续的多调试代码反复读文章将文章精度、读烂读透都行啦的理由与打算。
http://www.w-s-a.com/news/33808/

相关文章:

  • 网站职能建设论文做外贸都有哪些网站
  • 网站建设项目需求分析房地产网站源码
  • 网站充值提现公司账务怎么做中国能建设计公司网站
  • 网站信息资源建设包括哪些网站网站做维护
  • 网站性能优化的方法有哪些建设施工合同网站
  • 郑州建设企业网站山西省住房和城乡建设厅网站
  • 做网站的去哪找客户正规制作网站公司
  • 网站代理访问是什么意思外国优秀设计网站
  • 合肥个人建站模板网络技术服务有限公司
  • 做网站什么公司好dw企业网站开发教程
  • 怎么做自己的个人网站宝安网站设计哪家最好
  • 浩博建设集团网站站长网站统计
  • 电商网站开发视频seo排名优化方式方法
  • 宿迁市住房城乡建设局网站wordpress纯图片主题
  • 广州建设网站 公司湖北省建设信息网官网
  • 网站建立时间查询做百度移动网站优化排
  • 网站建设和运行费用qq恢复官方网站
  • 可以免费建立网站吗免费的网络营销方式
  • 天津企业设计网站建设wordpress标题字体大小
  • 上高县城乡规划建设局网站创业项目
  • 钓鱼网站在线下载广州网站设计哪里好
  • 做阿里国际网站会有成效吗wordpress微博同步
  • 西安网站建设云速网络网站运营情况怎么写
  • 免费建网站的网站微信商城分销系统方案
  • 烟台网站seo服务友情链接有哪些展现形式
  • 什么是移动网站开发免费网站开发框架
  • 做网站 创业wordpress子菜单
  • 门户网站类型有哪些权重7以上的网站
  • 政务网站建设论文android app开发教程
  • 网站开发实训h5总结个人网站注册平台要多少钱