当前位置: 首页 > news >正文

自己可以做网站吗微信网页版登陆

自己可以做网站吗,微信网页版登陆,重庆建设摩托车官网商城,WordPress 陈星最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课#xff0c;弥补一下之前nlp这块基础知识的一些不清楚的地方#xff0c;顺便巩固一下基础知识#x1f601; 关于word2vec#xff1a; 1.为什么要把单词表示成向量 一开始人们造了一个类似于词典表…最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课弥补一下之前nlp这块基础知识的一些不清楚的地方顺便巩固一下基础知识 关于word2vec 1.为什么要把单词表示成向量 一开始人们造了一个类似于词典表的东西-wordnet 但是这里面存在一些问题大概有这么几个 例如“proficient”被列为“good”的同义词但这只在某些情境下是正确的。WordNet在某些同义词组中列出了冒犯性的同义词而没有涵盖单词的内涵或适用性。WordNet缺少对单词新含义的收录例如wicked、“badass”、“nifty”、“wizard”、“genius”、“ninja”、bombest等。难以保持最新存在主观性的问题需要耗费大量人力来创建和调整不能用于准确计算单词相似度 再后来就有了one-hot编码 但是嘞用了一段时间以后人们发现这里还是存在一些问题这里教授举了这样一个例子 在网络搜索中的例子中如果用户搜索“西雅图汽车旅馆”我们希望匹配包含“西雅图酒店”的文档。 但是 汽车旅馆 [0 0 0 0 0 0 0 0 0 0 1 0 0 0 0] 酒店 [0 0 0 0 0 0 0 1 0 0 0 0 0 0 0] 这两个向量是正交的。 对于独热向量来说没有自然的相似度概念 提出的解决方案学习将相似度编码在向量中。 更具体的说从 context words 中去学习某个单词的意思这也是word2vec思想的重要部分 所以归纳起来把单词表示成我们想要的这种向量的好处可以概括为以下三个方面 数值表示计算机只能处理数值数据而文本是一种非结构化的数据形式。把单词转化为向量可以将文本转化为数值表示使得计算机可以对其进行处理和分析。这样我们可以利用数值计算的优势如向量运算、相似度计算等。 特征表示将单词转化为向量可以捕捉到单词之间的语义和语法关系。向量空间中的距离和角度可以表示单词之间的相似性和关联性。这样的向量表示可以作为特征输入到各种NLP任务中。通过将单词转化为向量我们可以将文本转化为可计算的特征从而进行更高级的文本分析和处理。如图将单词转化为高维向量以后语义相近的单词挨得比较近。 维度降低传统的文本表示方法如独热编码会将每个单词表示为一个高维稀疏向量其中大部分元素为0。这种表示方法会导致高维度的特征空间浪费存储空间和计算资源。通过将单词转化为低维稠密向量可以实现维度的降低减少存储和计算的开销同时保留了单词之间的语义信息。 2.何为word2vec 课上给的定义Word2vec (Mikolov et al. 2013) is a framework for learning word vectors 按照我的理解Word2Vec是一种用于将单词表示为连续向量的算法他的目标是通过学习单词之间的语义和语法关系将单词嵌入到一个连续的向量空间中 3.具体实现步骤 构建训练样本 Word2Vec模型的训练样本由目标单词和其上下文单词组成。在Skip-gram模型中每个目标单词会与其周围的上下文单词配对在CBOW模型中每个上下文单词会与其对应的目标单词配对。这样可以为每个配对样本创建一对输入和输出。上课给出的例子是从头到尾滑动计算第 t j tj tj个词和第 t t t个词(中心词)同时出现的概率,图示里把 i n t o into into当作中心词 t 2 t2 t2,然后计算其他context word和中心词一起出现的概率 训练模型 使用构建的训练样本和神经网络架构开始训练Word2Vec模型。训练过程中模型的目标是通过最大化或最小化特定的目标函数来优化模型的参数。课堂上举的例子是负对数似然函数。通过迭代优化过程模型逐渐学习到单词的向量表示以捕捉单词之间的语义和语法关系。 表示出目标函数 然后训练 学习到的向量表示 一旦模型训练完成每个单词都会被表示为一个固定长度的向量。这些向量在向量空间中的距离和角度反映了单词之间的相似性和关联性。这些向量可以用于各种NLP任务如计算单词相似度、文本分类、命名实体识别等。
http://www.w-s-a.com/news/588605/

相关文章:

  • 建设游戏网站目的及其定位市场营销策略概念
  • 小学电教检查网站建设资料wordpress谷歌字体
  • 南通做网站的公司有哪些中国建筑论坛网
  • 技术支持 佛山网站建设wordpress不用ftp
  • 广州定制app开发wordpress配置搜索引擎优化
  • 兰州网站建设论坛四川建设网官网登录
  • 在线作图免费网站湖南批量出品机
  • 深圳做网站公司有哪些地方妇联加强网站平台建设
  • vps建设网站别人访问不了网页链接生成器
  • 网站建设一般要多少钱电商平台取名字大全
  • 怎么做网站封面上的图网站开发语言 微信接口
  • 免费观看网站建设优化安徽
  • 上海电商网站开发公司做婚恋网站的翻译好吗
  • 以网站建设为开题报告大数据技术就业前景
  • dw做网站字体 别人电脑显示青岛活动策划公司
  • 网站成立时间查询墨猴seo排名公司
  • 技术支持 随州网站建设苏州企业网站建设定制
  • 美食网站开发目的与意义网站开发环境选择
  • 青岛西海岸新区城市建设局网站开发板在null不可用
  • 企业信息管理系统免费seo优化个人博客
  • 做任务的设计网站泰州哪里做网站
  • 什么网站可以做设计赚钱吗南京十大软件公司排名
  • 网站开发时间进度北京有哪些著名网站
  • 深圳比较好的设计网站公司自己的网站到期域名如何续费
  • 温州做网站哪儿新云网站模版
  • 网站开发 视频存在哪检察院前期网站建设
  • 备案中的网站信息怎么填如何做分享赚钱的网站
  • 网站行程表怎么做注册公司费用要多少
  • 常见电子商务网站基本模式南山网站公司定
  • 网站搭建代码网站里面送礼物要钱怎么做代码