当前位置: 首页 > news >正文

哪个网站可以做兼职ppt模板微信平台公众号

哪个网站可以做兼职ppt模板,微信平台公众号,做网站工作室名字,怎么显示wordpress里元素的源代码BGE的技术亮点#xff1a; 高效预训练和大规模文本微调#xff1b;在两个大规模语料集上采用了RetroMAE预训练算法#xff0c;进一步增强了模型的语义表征能力#xff1b;通过负采样和难负样例挖掘#xff0c;增强了语义向量的判别力#xff1b;借鉴Instruction Tuning的…BGE的技术亮点 高效预训练和大规模文本微调在两个大规模语料集上采用了RetroMAE预训练算法进一步增强了模型的语义表征能力通过负采样和难负样例挖掘增强了语义向量的判别力借鉴Instruction Tuning的策略增强了在多任务场景下的通用能力。 数据集的构成 RetroMAE预训练 主要思想是encoder用小一点的mask rate得到sentence embedding然后decoder用大一点的mask rate结合encoder得到的sentence embedding进行重构 此外为了使得每个token使用的context信息不同RetroMAE还使用了增强解码的方法 解码的时候每一行都带上下文信息和位置信息 微调 主要通过对比学习和Instruction Tuning的思想 对比学习是一种训练模型的方法通过比较正例和反例来学习数据的表示。 输入数据的格式模型接受三元组格式的数据作为输入包括一个查询query一个正例positive和一个反例negative。 in-batch negatives 策略除了上述三元组中的反例外他们还采用了“in-batch negatives”策略意思是在同一个批次的数据中使用其他数据作为额外的反例。 cross-device negatives sharing method这是一种在不同的GPU之间共享反例的方法目的是大大增加反例的数量。 训练硬件和参数使用了48个A100(40G)的GPU进行训练。批次大小为32,768因此每个查询在批次中有65,535个反例。使用了AdamW优化器学习率为1e-5。对比损失的温度为0.01。 在训练中为检索任务的查询添加了instruction。 对于英语指令是Represent this sentence for searching relevant passages: ; 对于中文指令是为这个句子生成表示以用于检索相关文章. 在评测中针对段落检索任务的任务需要在查询中添加指令但不需要为段落文档添加指令。
http://www.w-s-a.com/news/855153/

相关文章:

  • 门户网站广告的特点有网站的建设初步定位
  • 建设网站第一步网页建设方案
  • 网站开发需要那些人才wordpress 小工具原理
  • 广州建设局官方网站佛山高端网站制作公司
  • 东莞哪里能学建设网站网站备案值得吗
  • 中山 网站建设 骏域小程序开发课程
  • 北京网站建设成都微商城app官方下载
  • 网站开发用户登陆的安全wordpress 开发网站
  • 网站建设容易出现的问题四川seo关键词工具
  • 做外单网站有哪些内容服务好的南京网站建设
  • 阜阳微商城网站建设百度网站两两学一做心得体会
  • 建设银行积分网站观光农业规划设计
  • jsp项目个人网站开发用织梦做网站有什么公司会要
  • 和田网站制作无限动力网站
  • 长沙口碑好网站建设企业网站 需求
  • 哪个网站建设公司wordpress陌陌主题
  • 湖滨区建设局网站北京国际建设集团网站
  • 做服装团购有哪些网站wordpress 端口修改
  • 上海礼品定制网站响应式网站模版建站
  • 那种自行提取卡密的网站怎么做网站攻击
  • 洛阳免费网站建设qq是哪家公司开发的软件
  • 怎么做网站网页wordpress网址导航
  • 专业微信网站建设公司首选公司wordpress自动分类插件
  • 网站设计登录界面怎么做网站突然排名没了
  • wordpress 人物页面seo优化公司信
  • 高端网站建设报价网站建设需要硬件设备
  • 做国际物流在哪些网站找客户营销qq怎么申请
  • 网站做推广百度好还是360好科技厅
  • 网站开发工具排名万户网络建一个网站虽要多少钱
  • 用凡科做的网站要钱吗WordPress城市切换