当前位置: 首页 > news >正文

网站建设需要什么硬件和软件有哪些方面设计师常用的素材网站

网站建设需要什么硬件和软件有哪些方面,设计师常用的素材网站,辽宁建设工程信息网官网新网址,手机做个人简历简介 Elasticsearch (ES) 是一个基于 Lucene 的搜索引擎#xff0c;分词器是其核心组件之一#xff0c;负责对文本数据进行分析和处理。 1. 文本分析 分词器将输入的文本拆分成一个个单独的词#xff08;tokens#xff09;#xff0c;以便后续的索引和搜索。例如#x…简介 Elasticsearch (ES) 是一个基于 Lucene 的搜索引擎分词器是其核心组件之一负责对文本数据进行分析和处理。 1. 文本分析 分词器将输入的文本拆分成一个个单独的词tokens以便后续的索引和搜索。例如输入的文本 Elasticsearch分词器 可能会被分词器拆分为 [Elasticsearch, 分词器]。2. 索引优化 在将文档存储到 Elasticsearch 中之前分词器可以去除一些不必要的字符和停用词如“的”、“是”等并将文本标准化例如小写化。这有助于减少索引的大小和提高搜索效率。3. 多语言支持 Elasticsearch 支持多种语言的分词器例如中文分词器、英文分词器等。不同的分词器使用不同的规则和算法来处理特定语言的文本以便提供更精确的搜索结果。4. 提升搜索质量 通过有效的分词分词器可以提高搜索的相关性和准确性。分词器能够识别出用户查询中的关键词并将其与索引中的词进行匹配从而提高搜索结果的质量。5. 分析文本数据 分词器还可以用于分析文本数据的特点比如词频统计、短语提取等。这对后续的数据挖掘和分析工作非常重要。6. 自定义分词 Elasticsearch 允许用户自定义分词器开发者可以根据具体需求定义分词规则和过滤器以满足特定场景的需求。7. 创建和配置索引 在创建索引时可以指定使用的分词器。根据文档类型或应用场景的不同可以选择不同的分词器来满足需求。常见的分词器 Elasticsearch 提供了多种分词器analyzers以支持不同类型的文本分析和搜索需求。以下是一些常见的分词器1. 标准分词器Standard Analyzer 这是 Elasticsearch 默认的分词器适用于大多数语言。它会将文本分割为单词并去除停用词如“的”、“是”等。2. 中文分词器 IK Analyzer一个流行的中文分词插件支持细粒度和粗粒度两种分词模式适合处理中文文本。 HanLP另一种中文分词器支持多种自然语言处理功能包括分词、词性标注等。3. Whitespace 分词器 将输入文本按空白字符进行分词适合处理不需要复杂分析的情况。4. Keyword 分词器 将整个输入文本视为一个单一的词适用于需要精确匹配的场景如 ID 和特定标签。5. NGram 分词器 生成输入文本的 N-gram 形式适合用于模糊搜索和自动补全功能。6. Path Hierarchy 分词器 适用于处理文件路径和层级结构数据能够正确分词层级关系。7. Edge NGram 分词器 仅生成输入文本的前 N 个字符的 N-gram适合用于前缀匹配的搜索场景。8. Stop Token 分词器 用于去除常见的停用词这些词通常不会对搜索结果产生实质性影响。9. Custom Analyzer 用户可以根据需求自定义分词器组合不同的分词和过滤器以满足特定的分析需求。中文分词器 ik 默认的分词器是标准分词器它会将文本分割为单词并去除停用词如“的”、“是”等在生产实际使用过程中是不符合国内的业务的 所以我们需要引入中文分词器 ik IK Analyzer一个流行的中文分词插件支持细粒度和粗粒度两种分词模式适合处理中文文本。 安装步骤 注意安装的版本需要跟es的版本保持一致我这里使用的7.3.2的 下载 方式一如果需要的ik是7.3.2 否则可以选择其他的方式公众号获取回复ikfont stylecolor:rgb(26, 27, 28);分词器/font 方式二github下载 https://github.com/infinilabs/analysis-ik/tags 找到自己需要的版本 例如我需要下载v7.3.2 下载zip的方式 上传解压 # 切换到es下的plugins 这里根据自己es的安装目录 cd elasticsearch-7.3.2/plugins # 上传 rz # 解压 unzip elasticsearch-analysis-ik-7.3.2.zip -d ik # 删除压缩包否则启动会报错 rm -rf elasticsearch-analysis-ik-7.3.2.zip重启es ps -ef|grep elasticsearch 查看es的pid 杀死程序 kill -9 pid进入es的bin目录执行 ./elasticsearch -d 分词测试 使用kibana进行查看 标准分词器测试 POST /_analyze {tokenizer: standard, text: Elasticsearch分词器测试 }ik分词器测试 POST /_analyze {tokenizer: ik_max_word,text: Elasticsearch分词器测试 }可以看出二者的区别
http://www.w-s-a.com/news/974920/

相关文章:

  • 吉安建站公司wordpress企业
  • 河北住房和城乡建设厅网站6thinkphp做视频网站
  • 遵义网站制作一般需要多少钱深圳全国网站制作哪个好
  • 公众平台网站价格哪个网站做餐饮推广最好
  • 深圳 公司网站设计重庆的网站设计公司价格
  • 网站开发市场分析餐饮平台app有哪些
  • 制作一个收费网站要多少钱开发网站需要什么技术
  • 网站流量统计平台二手域名做网站不收录
  • 蒙古网站后缀mysql8.0 wordpress
  • 免费建立一个网站互联网推广培训
  • WordPress多站点绑定域名深圳住房建设部官方网站
  • 网站建设公司zgkr上海网页网络技术有限公司
  • wordpress附件扩展格式徐州seo关键词
  • wordpress博客站模板织梦网站 联系方式修改
  • 北京城乡建设厅网站重庆网站建设解决方案
  • 网站建设和维护工作内容网站的空间与域名
  • 济南做门户网站开发公司网页发布的步骤
  • 江苏省交通厅门户网站建设管理办法做的网站怎么让百度收录
  • 关于怎么做网站网站site的收录数量要多远索引量
  • 传世网站建设阳光创信-网站建设首选品牌
  • 周口建设网站中国装修公司十大排名
  • wordpress自助发卡青浦网站优化
  • 南京建设银行公积金查询网站wordpress加载插件下载
  • 做网站怎么那么难网站的建设与管理的心得体会
  • 黄冈网站建设哪家快些网站规划与建设评分标准
  • 建站平台 绑定域名怎么在手机上做网站
  • 做电影网站违法吗莱芜 网站
  • 品牌咨询公司泉州seo不到首页不扣费
  • 做网站做一个什么主题的怎样搭建一个企业网站
  • 做设计的有什么网站桂林论坛网站有哪些