当前位置: 首页 > news >正文

西安营销型网站制作价格如何在万网建设网站

西安营销型网站制作价格,如何在万网建设网站,购物网站创业时是如何做宣传的,网站的域名起什么好处ElasticSearch 内置了分词器#xff0c;如标准分词器、简单分词器、空白词器等。但这些分词器对我们最常使用的中文并不友好#xff0c;不能按我们的语言习惯进行分词。 ik分词器就是一个标准的中文分词器。它可以根据定义的字典对域进行分词#xff0c;并且支持用户配置自…ElasticSearch 内置了分词器如标准分词器、简单分词器、空白词器等。但这些分词器对我们最常使用的中文并不友好不能按我们的语言习惯进行分词。 ik分词器就是一个标准的中文分词器。它可以根据定义的字典对域进行分词并且支持用户配置自己的字典所以它除了可以按通用的习惯分词外我们还可以定制化分词。 ik分词器是一个插件包我们可以用插件的方式将它接入到ES。 一、安装 1.1 下载 下载地址ik分词器地址 注意要选择跟自己es保持一致的版本下载。 1.2解压 将下载的安装包在es安装目录下的plugins下新建一个ik文件夹、将文件解压。 1.3启动 启动成功之后可以看见ik插件已经运行 也可以通过当前命令查看插件是否安装。 插箱即用到此ik分词器的安装就完成了。 二、使用IK分词器 IK分词器有两种分词模式ik_max_word和ik_smart模式。 1、ik_max_word 会将文本做最细粒度的拆分比如会将曾舒琪董事长早上好拆分为曾、舒琪、董事长、董事、长、早上好、早上、上好 GET /_analyze {analyzer: ik_max_word, // 最细粒度划分text: 曾舒琪董事长早上好 }执行结果如下 {tokens : [{token : 曾,start_offset : 0,end_offset : 1,type : CN_CHAR,position : 0},{token : 舒琪,start_offset : 1,end_offset : 3,type : CN_WORD,position : 1},{token : 董事长,start_offset : 3,end_offset : 6,type : CN_WORD,position : 2},{token : 董事,start_offset : 3,end_offset : 5,type : CN_WORD,position : 3},{token : 长,start_offset : 5,end_offset : 6,type : CN_CHAR,position : 4},{token : 早上好,start_offset : 6,end_offset : 9,type : CN_WORD,position : 5},{token : 早上,start_offset : 6,end_offset : 8,type : CN_WORD,position : 6},{token : 上好,start_offset : 7,end_offset : 9,type : CN_WORD,position : 7}] } 2、ik_smart 会做最粗粒度的拆分比如会将曾舒琪董事长早上好拆分成曾、舒琪、董事长、早上好 GET /_analyze {analyzer: ik_smart, // 最粗粒度划分text: 曾舒琪董事长早上好 }执行结果如下 {tokens : [{token : 曾,start_offset : 0,end_offset : 1,type : CN_CHAR,position : 0},{token : 舒琪,start_offset : 1,end_offset : 3,type : CN_WORD,position : 1},{token : 董事长,start_offset : 3,end_offset : 6,type : CN_WORD,position : 2},{token : 早上好,start_offset : 6,end_offset : 9,type : CN_WORD,position : 3}] } 这就是ik分词器两种简单的使用模式 问题 我们使用这两种模式想让ik分词器把名词进行一个拆开划分但是有一个问题曾舒琪这明显就是一个人名两种模式都并没有把这个词汇拆开到一起 解决方法 其实ik分词器给我们提供了一系列的词典我们只需要添加一个自己的词典。 1、找到config目录下的xml配置文件 2、这里我们需要添加我们自己的词典。其实所谓词典就是创建一个名称后缀以dict结尾的文件。 3、这里我添加了一个shipley_zeng.dict的词典 4、那这个词典哪里来的呢凭空出现吗我们返回上一级目录。可以看见有很多词典、我们随便打开一个看看。 看看这个main.dict 可以看见这边有特别多的词汇、这些词汇在实际的应用开发过程当中肯定是不够用的、我们要创建一个属于我们自己的词典。 5、创建一个自己的词典到config目录下名字跟上面提到的一样叫做shipley_zeng.dict 内容如下这边我们要注意一下编码格式为UTF-8 6、加入这个词典后我们在重新启动es可以看见已经成功的加载了我们创建的词典 7、我们在使用 ik_max_word 最细粒度查询看看效果 GET /_analyze {analyzer: ik_max_word, // 最细粒度划分text: 曾舒琪董事长早上好 }执行结果如下 {tokens : [{token : 曾舒琪,start_offset : 0,end_offset : 3,type : CN_WORD,position : 0},{token : 舒琪,start_offset : 1,end_offset : 3,type : CN_WORD,position : 1},{token : 董事长,start_offset : 3,end_offset : 6,type : CN_WORD,position : 2},{token : 董事,start_offset : 3,end_offset : 5,type : CN_WORD,position : 3},{token : 长,start_offset : 5,end_offset : 6,type : CN_CHAR,position : 4},{token : 早上好,start_offset : 6,end_offset : 9,type : CN_WORD,position : 5},{token : 早上,start_offset : 6,end_offset : 8,type : CN_WORD,position : 6},{token : 上好,start_offset : 7,end_offset : 9,type : CN_WORD,position : 7}] } 8、使用 ik_smart 最粗粒度查询看看效果 GET /_analyze {analyzer: ik_smart, // 最粗粒度划分text: 曾舒琪董事长早上好 }执行结果如下 {tokens : [{token : 曾舒琪,start_offset : 0,end_offset : 3,type : CN_WORD,position : 0},{token : 董事长,start_offset : 3,end_offset : 6,type : CN_WORD,position : 1},{token : 早上好,start_offset : 6,end_offset : 9,type : CN_WORD,position : 2}] } 9、我们可以看见、现在不管使用ik_max_word还是ik_smart他都能将曾舒琪这个词汇拆开组合达到了我们所需要的诉求。 总结 以上就是本地elasticsearch中文分词器 ik分词器及使用希望对刚刚接触es的小伙伴有所帮助谢谢如有疑问请随时联系我。
http://www.w-s-a.com/news/792324/

相关文章:

  • 网站搭建在线支付数码产品网站模板
  • 白云网站建设多少钱WORDPRESS添加前台会员注册
  • 商业网站模板中国字体设计网站
  • 做网站闵行网站建设中英语
  • 写作网站大全如何简单制作生理盐水
  • 云南网站建设维护互联网广告是做什么的
  • 网站 谁建设 谁负责做网站项目
  • 网站建设子栏目怎么弄海口专门做网站
  • 网站建设 温州建设网上银行个人网上银行登
  • 黄页网站推广方案wordpress 压缩插件
  • 网站建设常州网站简介 title
  • 惠州市网站建设个人深圳网站优化价格
  • 营销型网站工程专业网站开发公司
  • 两个路由器做双网站西安关键词优化服务
  • 企业建站系统信息远象建设 网站
  • 移动建站平台物业管理系统app
  • 济南网站建设多少钱郑州公司做网站
  • 在阿里云网站建设wordpress模板如何修改字体
  • 网站推广方案设计购物网站模块例子
  • 潍坊网站定制公司网站图片放大特效怎么做的
  • 淘宝店铺买卖湘潭seo优化价格
  • 最好的网站建设用途合肥企业网站建设
  • 计算机编程与网站建设好玩的网页传奇
  • 商务网站建设找哪家本地推广找哪些网站
  • 手机h5网站企业网站管理系统的运维服务
  • 南京建设网站公司网站游戏怎么制作
  • 成都建站程序苏州市建设局招标网站首页
  • 自助建网站市场公司起名大全2020最新版的
  • dede网站模板北京 网站开发 大兴
  • 网站优化师招聘建设牌安全带官方网站