当前位置: 首页 > news >正文

永州网站建设效果亳州网站网站建设

永州网站建设效果,亳州网站网站建设,有域名之后怎样进行网站建设,个人主页页面使用 bert 来实现一个完形填空的案例#xff0c;使用预训练模型 bert-base-chinese #xff0c;这个模型下载到跟代码同目录下即可#xff0c;下载可参考#xff1a;bert预训练模型下载-CSDN博客 通过这个案例来了解一下怎么使用预训练模型来完成下游任务#xff0c;算是对…使用 bert 来实现一个完形填空的案例使用预训练模型 bert-base-chinese 这个模型下载到跟代码同目录下即可下载可参考bert预训练模型下载-CSDN博客 通过这个案例来了解一下怎么使用预训练模型来完成下游任务算是对怎么使用 bert 的流程有一个初步的了解代码都写注释了直接看代码注释就好 import torch from transformers import BertTokenizer, BertForMaskedLM, BertConfig#加载预训练模型 tokenizer (vocabulary)词表文件 tokenizer BertTokenizer.from_pretrained(bert-base-chinese)#输入文本 # [CLS] 表示段落开始只有一个 # [SEP] 表示句子的结束可以有多个 text [CLS] 我是谁 ? [SEP] zjk原来是程序员 [SEP] # 转换输入文本有点像分词如词在词表中找不到会以 # 开头 tokenized_text tokenizer.tokenize(text) print(tokenized_text)# 将索引为 11 的字用 [MASK] 屏蔽如果被屏蔽的是 # 那么预测不出来结果 masked_index 11 # 掩码一个标记用 BertForMaskedLM 预测回来 tokenized_text[masked_index] [MASK] print(tokenized_text)# 将标记转换为词汇表索引 indexed_tokens tokenizer.convert_tokens_to_ids(tokenized_text) print(indexed_tokens)# 将输入转换为PyTorch张量 tokens_tensor torch.tensor([indexed_tokens]) print(tokens_tensor)#指定设备 device torch.device(cuda:0 if torch.cuda.is_available() else cpu) print(device)# 加载预训练模型 (weights) model BertForMaskedLM.from_pretrained(bert-base-chinese) # 为了确保模型在处理新样本时能提供稳定且具有代表性的预测结果禁用dropout和batch normalization等在训练阶段启用但在预测时应关闭的功能。 model.eval() model.to(device)# 段标识索引标识输入文本中的第一句第2据0对应属于第一个句子的1代表对应属于第二个句子的 segments_ids [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1] segments_tensors torch.tensor([segments_ids]).to(device)tokens_tensor tokens_tensor.to(device) # 输入句子的张量其实就是每个字在词表中的索引 # 预测所有的tokens可以理解为标准固定写法 with torch.no_grad(): # 模型不会累积梯度适合用于预测任务outputs model(tokens_tensor, token_type_idssegments_tensors) # 传入了tokens张量和对应的句子类型张量 # BERT模型的输出是一个元组其中第一个元素通常是 mask 对应于每个位置上所有可能token的概率分布 # 形状与输入tokens张量相同这里为 [1, 16, 21128]表示batch大小为1、序列长度为16、词汇表大小为21128的三维张量 # 的是模型在每次迭代更新参数时处理的样本数量这里我们就处理了一个样本 predictions outputs[0] # [1, 16, 21128] # 找到在mask位置上的概率最高的token索引。masked_index 是待预测 token 在 tokens 张量中的位置 predicted_index torch.argmax(predictions[0, masked_index]).item() predicted_token tokenizer.convert_ids_to_tokens([predicted_index])[0] # 转成单词 print(Predicted token is:, predicted_token) 运行结果
http://www.w-s-a.com/news/536572/

相关文章:

  • 保定网站建设多少钱公司网页网站建设+ppt模板下载
  • 用户上传商品网站用什么做建设跳转公积金网站
  • 买程序的网站上海市网站建设公司
  • 南通网站建设排名公司哪家好wordpress网站图片迁移
  • 河南省汝州文明建设门户网站博客网站建设源码
  • 单位建设网站的请示手机移动端网站案例
  • 国内做网站的企业网站结构有哪些类型
  • 南通网站建设制作公司苏州好的网站公司名称
  • 咸阳做网站开发公司哪家好珠海公司制作网站
  • 深圳网站建设好不好医疗网站前置审批
  • 做ic什么网站好安溪网站建设
  • 网站建设 慕课企业文化标语经典
  • 做短视频的网站都有哪些简约 时尚 高端 网站建设
  • 浦口区网站建设售后服务建设一个网站多少钱
  • 做个小网站大概多少钱广州h5网站
  • 360免费建站视频wordpress标签显示图片
  • 创建简易个人网站国外做网站被动收入
  • 轻定制网站建设网页培训哪个机构好
  • 青岛海诚互联做网站好吗计算机软件开发培训机构
  • 德钦网站建设如何在网站上做用工登记
  • 创意品牌网站云服务
  • 个人备案网站可以做商城展示如何制作网页二维码
  • 网站建设php教程视频百度seo 站长工具
  • 外包小程序两个相同的网站对做优化有帮助
  • 网站备案主体修改wordpress 导航图片
  • 怎么建设网站数据库用vs代码做网站
  • 运营企业网站怎么赚钱动漫制作专业概念
  • 宜春网站建设推广网络推广工作好干吗
  • 网站程序0day平顶山市做网站
  • 企业网站名称怎么写哔哩哔哩网页版官网在线观看