IK分词器-天翼云

IK分词器

2024-04-23 09:50:36 阅读次数：41

IK分词器

分词：即把一段中文或者别的划分成一个个的关键字，我们在搜索时候会把自己的信息进行分词，会把数据库中或者索引库中的数据进行分词，然后进行一个匹配操作，默认的中文分词是将每个字看成一个词，比如“我爱BNTang”会被分为"我”,"爱","BN","Tang"，这显然是不符合要求的，所以我们需要安装中文分词器ik来解决这个问题，如果要使用中文，建议使用ik分词器!

IK提供了两个分词算法：ik_smart和ik_max_word，其中ik_ smart为最少切分, ik_max_word为最细粒度划分!一会我们测试!

下载地址：https:///medcl/elasticsearch-analysis-ik/releases
下载完毕之后放入到elasticsearch的插件目录中plugins
放入之后最好全部环境都重启一下

验证是否安装成功可以通过elasticsearch-plugin list

IK分词器

进入Kibana控制台

IK分词器

ik_smart

最少切分

GET _analyze
{
  "analyzer": "ik_smart",
  "text": "床前明月光"
}

ik_max_word

最细粒度划分，穷尽词库的可能

GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "床前明月光"
}

这时我们输入小灰说Java

IK分词器

发现小灰给拆开了，这种自己需要的词，需要自己加入到分词器的字典中!

????ik分词器增加自己的配置

进入到es的插件目录找到ik分词器中的config目录

IKAnalyzer.cfg.xml

IK分词器

编写自己的扩展配置文件，注入到配置文件当中即可

IK分词器

配置完毕之后环境重启，再次输入进行分词即可看到效果我这里就不贴图了

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

IK分词器

IK分词器

IK分词器

ik_smart

ik_max_word

相关文章

Linux搭建ES

决策树（Decision Tree）分类算法原理及应用

DSL语言高级查询

ES-聚合操作

Elastic Stack的介绍

ElasticSearch中四种字段类型的详解

ElasticSearch文档的删除和批量操作

ES客户端索引相关操作

ElasticSearch并发的处理方式：锁和版本控制

ElasticSearch文档路由

作者介绍

最新文章

Linux搭建ES

ES-聚合操作

Elastic Stack的介绍

ElasticSearch文档的删除和批量操作

ElasticSearch文档路由

ES-Search搜索

热门文章

Linux搭建ES

Docker搭建ES

ES7-SQL操作

ElasticSearch索引基本操作

ElasticSearch开篇

ES-Search搜索

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

ES7-SQL操作

ElasticSearch文档路由

ES-Search搜索

ES-CRUD提高

ElasticSearch开篇

ElasticSearch文档的删除和批量操作