当前位置: 首页 > news >正文

成都网站建设 致尚做设计用的素材下载网站

成都网站建设 致尚,做设计用的素材下载网站,温州的网站建设公司,wordpress 不同主题文章目录 前言为什么叫倒排索引数据结构如何生成如何查询TF、IDF参考文档 前言 上一章#xff0c;简单介绍了 ES 的节点类型。 本章#xff0c;我们要介绍 ES 中非常重要的一个概念#xff1a;倒排索引。 ES 的全文索引就是基于倒排索引实现的。 本章内容建议重点学习… 文章目录 前言为什么叫倒排索引数据结构如何生成如何查询TF、IDF参考文档 前言 上一章简单介绍了 ES 的节点类型。 本章我们要介绍 ES 中非常重要的一个概念倒排索引。 ES 的全文索引就是基于倒排索引实现的。 本章内容建议重点学习因为面试也常问。 为什么叫倒排索引 倒排索引指的是将每一个关键字映射到它出现的文档中。如下图所示 因为结构是倒着的因此被称为倒排索引。 数据结构 倒排索引分为 2 部分一部分叫 term directory(term 词典)一部分叫 posting list(倒排列表)。如下图所示 term directory term 字典存放着每个单词到对应倒排列表的映射关系 posting list Docs 是一个数组。其中 1:2:[2,6] 意思如下 1文档ID2词频(term frequency)[2,6]出现在文档中的第 26 个 term。 如何生成 这里涉及到我们之前讲过的分词器。工作流程如下图所示 大体就包含2部分根据分词器将文本分词然后根据分词生成倒排索引。 如何查询 例如我们查询To do right。 则该文本会先被分词为to, do, right 对应的结果如下图所示 TF、IDF 默认情况下ES 会根据文档与搜索词的相关性得分对结果降序返回。相关性得分与以下 2 个概念有关(稍做了解后续会出文章做更深入的介绍) Term Frequency(TF)term 在文档中出现的频率得分正相关。出现频率越高得分越高Inverted Document Frequency(IDF)term 在 所有文档 中出现的频率得分负相关。出现频率越高得分越低。 参考文档 Indexing: Inverted Index
http://www.w-s-a.com/news/647148/

相关文章:

  • WordPress pajx天津短视频seo
  • 检察院门户网站建设情况总结深圳网站制作长沙
  • 单页导航网站模板搜索量查询
  • 如何在一个地方建设网站营销型定制网站
  • 保定网站建设方案维护动易网站中添加邮箱
  • 简易网站的html代码wordpress音乐html
  • 四川住房和城乡建设厅网站打不开海山网站建设
  • 深圳设计功能网站如何用html制作网站
  • 网络优化软件下载竞价排名和seo的区别
  • 龙华新区做网站中高端网站建设
  • 网站开发小图标大全手机网站设计开发
  • 网页设计设计一个网站口碑营销的优点
  • 枣庄建网站的公司唐山企业网络推广培训
  • 张家界建设企业网站学校资源网站建设方案
  • 网站制作教程书籍业务管理系统
  • 上传网站空间的建站程序怎么删除c 网站开发案例详解下载
  • 企业网站维护兼职丹阳网站优化
  • 秦皇岛网站开发公司怎么注册自己的公司
  • 写作网站哪个能得稿费绿色环保企业网站模板
  • 牡丹江网站建设定制开发安徽建设工程信息网官网入口
  • 有什么好的网站建设的书适合在家做的网站工作
  • wordpress情侣源码西安网站快速优化
  • 昆明网站建设高端定制100种班服设计图
  • 网站开发程序说明html网页制作接单
  • 企业网站货物查询怎么做制作文件的软件
  • 怎么做网站的防盗链北京门户企业网站建设
  • 网站推广的主流方法淘客网站 源码
  • 网站海外推广怎么做多用户商城系统源码教程
  • 猎头做单网站网站创建费用
  • 住房和城乡建设网站 上海自己做网站还是公众号