当前位置：首页 > news >正文

图书网站建设实训心得企业管理信息系统有哪些

news 2026/4/8 15:43:46

图书网站建设实训心得,企业管理信息系统有哪些,内蒙古呼和浩特市邮编,青岛市城市建设投标网站文章目录 1. 数据聚合1.1 聚合介绍1.2 Bucket 聚合1.3 Metrics 聚合1.4 使用 RestClient 进行聚合 2. 自动补全2.1 安装补全包2.2 自定义分词器2.3 自动补全查询2.4 拼音自动补全查询2.5 RestClient 实现自动补全2.5.1 建立索引2.5.2 修改数据定义2.5.3 补全查询2.5.4 解析结果… 文章目录 1. 数据聚合1.1 聚合介绍1.2 Bucket 聚合1.3 Metrics 聚合1.4 使用 RestClient 进行聚合 2. 自动补全2.1 安装补全包2.2 自定义分词器2.3 自动补全查询2.4 拼音自动补全查询2.5 RestClient 实现自动补全2.5.1 建立索引2.5.2 修改数据定义2.5.3 补全查询2.5.4 解析结果 1. 数据聚合 1.1 聚合介绍聚合aggregations可以实现对文档数据的统计、分析、运算。聚合常见的有三类桶Bucket聚合用来对文档做分组 TermAggregation按照文档字段值分组Date Histogram按照日期阶梯分组例如一周为一组或者一月为一组度量Metric聚合用以计算一些值比如最大值、最小值、平均值等 Avg求平均值Max求最大值Min求最小值Stats同时求max、min、avg、sum等管道pipeline聚合其它聚合的结果为基础做聚合参与聚合的字段为以下字段 keyword数值日期布尔注意不能是 text 字段 1.2 Bucket 聚合这里假如我们需要对不同品牌的酒店进行聚合人那么我们就可以使用桶聚合桶聚合的例子如下 GET /hotel/_search {size: 0, // 设置size为0结果中不包含文档只包含聚合结果aggs: { // 定义聚合brandAgg: { //给聚合起个名字terms: { // 聚合的类型按照品牌值聚合所以选择termfield: brand, // 参与聚合的字段order: {_count: asc// 按照聚合数量进行升序排列默认降序},size: 20 // 希望获取的聚合结果数量}}} }聚合结果如下如果我们需要在一些查询的条件下进行聚合比如我们只对200元一下的酒店文档进行聚合那么聚合条件如下 GET /hotel/_search {query: {range: {price: {lte: 200 // 只对200元以下的文档聚合}}}, size: 0, aggs: {brandAgg: {terms: {field: brand,size: 20}}} }1.3 Metrics 聚合如果我们需要按照每个品牌的用户的评分的最大值、最小值、平均值等进行排序那么这就需要用到 Metrics 聚合了我们使用 stats 查看所有的聚合属性该聚合的实现如下 GET /hotel/_search {size: 0, aggs: {brandAgg: { terms: { field: brand, size: 20},aggs: { // 是brands聚合的子聚合也就是分组后对每组分别计算scoreAgg: { // 聚合名称stats: { // 聚合类型这里stats可以计算min、max、avg等field: score // 聚合字段这里是score}}}}} }聚合结果如下如果我们想要对按照聚合的平均值进行排序那么DSL语句如下 GET /hotel/_search {size: 0, aggs: {brandAgg: { terms: { field: brand, size: 20,order: {scoreAgg.avg: asc //按照平均值进行排序}},aggs: { scoreAgg: { stats: {field: score }}}}} }1.4 使用 RestClient 进行聚合我们以各个酒店的品牌聚合为例其中java语句与DSL语句的一一对应关系如下使用RestClient进行聚合的代码如下 Testvoid testAgg() throws IOException {//1.准备Request对象SearchRequest request new SearchRequest(hotel);//2.准备sizerequest.source().size(0);//3.进行聚合request.source().aggregation(AggregationBuilders.terms(brandAgg).field(brand).size(10));//4.发送请求SearchResponse response restHighLevelClient.search(request, RequestOptions.DEFAULT);//解析聚合结果Aggregations aggregations response.getAggregations();//根据名称获取聚合结果Terms brandterms aggregations.get(brandAgg);//获取桶List? extends Terms.Bucket buckets brandterms.getBuckets();// 遍历for (Terms.Bucket bucket: buckets){// 获取key也就是品牌信息String brandName bucket.getKeyAsString();System.out.println(brandName);}}结果如下 2. 自动补全 2.1 安装补全包自动补全我们需要实现的效果是当我们输入拼音的时候就有一些产品的提示这种情况下就需要我们对拼音有一定的处理所以我们在这里下载一个拼音分词器下载的方式与上面下载 IK 分词器相差不大都是首先进入容器内部然后在容器插件目录下进行安装 # 进入容器内部 docker exec -it es /bin/bash# 在线下载并安装 /usr/share/elasticsearch/bin/elasticsearch-plugin install --batch \https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.12.1/elasticsearch-analysis-pinyin-7.12.1.zip#退出 exit#重启容器 docker restart es重启后使用拼音分词器试试效果如下 POST /_analyze {text: [你干嘛哎哟],analyzer: pinyin }2.2 自定义分词器从上面的例子我们可以看出拼音分词器是将一句话的每个字都进行分开并且首字母的拼音全部都在一起的这肯定不是我们想要看到的我们想要的是对句子进行分词后还能根据词语来创建拼音的索引所以这就需要我们自定义分词器了。首先我们需要了解分词器的工作步骤elasticsearch中分词器analyzer的组成包含三部分 character filters在tokenizer之前对文本进行处理。例如删除字符、替换字符tokenizer将文本按照一定的规则切割成词条term。例如keyword就是不分词还有ik_smart tokenizerfilter将tokenizer输出的词条做进一步处理。例如大小写转换、同义词处理、拼音处理等自定义分词器的DSL代码如下 PUT /test //针对的是test索引库 {settings: {analysis: {analyzer: { //自定义分词器my_analyzer: { //分词器名称tokenizer: ik_max_word,filter: py //过滤器名称}},filter: { py: { type: pinyin, //拼音分词器keep_full_pinyin: false,keep_joined_full_pinyin: true,keep_original: true,limit_first_letter_length: 16,remove_duplicated_term: true,none_chinese_pinyin_tokenize: false}}}},mappings: { //创建的索引库的映射properties: {name: {type: text,analyzer: my_analyzer,//创建索引时的search_analyzer: ik_smart}}} }进行测试如下 POST /test/_doc/1 {id: 1,name: 下雪 }POST /test/_doc/2 {id: 2,name: 瞎学 }GET /test/_search {query: {match: {name: 武汉在下雪嘛}} }查询结果如下 2.3 自动补全查询 elasticsearch提供了 Completion Suggester 查询来实现自动补全功能。这个查询会匹配以用户输入内容开头的词条并返回。为了提高补全查询的效率对于文档中字段的类型有一些约束参与补全查询的字段必须是 completion 类型。字段的内容一般是用来补全的多个词条形成的数组。首先我们先建立索引库以及索引库约束 PUT test2 {mappings: {properties: {title:{type: completion}}} }在 test2 索引库中添加数据 // 示例数据 POST test2/_doc {title: [Sony, WH-1000XM3] }POST test2/_doc {title: [SK-II, PITERA] }POST test2/_doc {title: [Nintendo, switch] }进行自动补全查询我们给出一个关键字 s 对其进行补全查询如下 GET /test2/_search {suggest: {title_suggest: {text: s, // 关键字completion: {field: title, // 补全查询的字段skip_duplicates: true, // 跳过重复的size: 10 // 获取前10条结果}}} }查询结果如下 2.4 拼音自动补全查询如果想要使用拼音自动补全进行查询那么就必须自定义分词器了自定义分词器如下 PUT /test3 {settings: {analysis: {analyzer: { my_analyzer: {tokenizer: ik_max_word,filter: py},completion_analyzer: {tokenizer: keyword,filter: py}},filter: { py: { type: pinyin, keep_full_pinyin: false,keep_joined_full_pinyin: true,keep_original: true,limit_first_letter_length: 16,remove_duplicated_term: true,none_chinese_pinyin_tokenize: false}}}},mappings: {properties: {title: {type: completion,analyzer: completion_analyzer}}} }然后创建一个索引库并添加一些文档如下 PUT /test3 {mappings: {properties: {title:{type: completion}}} }POST test3/_doc {title: [上子, 熵字, 下雪] }POST test3/_doc {title: [赏金, 秀色, 猎人] }然后就可以根据首字母缩写或者拼音来进行查询了DSL代码如下 GET /test3/_search {suggest: {suggestions: {text: xx,completion: {field: title,skip_duplicates: true,size: 10}}} }如上我们输入的是下雪的拼音缩写 xx 进行查询时结果如下当然也可以对拼音进行按顺序的补全查询。 2.5 RestClient 实现自动补全 2.5.1 建立索引要实现对索引库的内容进行自动补全我们需要重新创建索引库我们的索引库需要多出一个 completion 字段的类型所以删除原有的索引库后创建新的索引库如下 DELETE /hotelPUT /hotel {settings: {analysis: {analyzer: { my_analyzer: {tokenizer: ik_max_word,filter: py},completion_analyzer: {tokenizer: keyword,filter: py}},filter: { py: { type: pinyin, keep_full_pinyin: false,keep_joined_full_pinyin: true,keep_original: true,limit_first_letter_length: 16,remove_duplicated_term: true,none_chinese_pinyin_tokenize: false}}}},mappings: {properties: {id: {type: keyword},name: {type: text,analyzer: ik_max_word,copy_to: all},address: {type: keyword,index: false},price: {type: integer},score: {type: integer},brand: {type: keyword,copy_to: all},city: {type: keyword},starName: {type: keyword},bussiness: {type: keyword,copy_to: all},location: {type: geo_point},pic: {type: keyword,index: false},all: {type: text,analyzer: ik_max_word},suggestion: {type: completion,analyzer: completion_analyzer}}} }2.5.2 修改数据定义除此之外还需要将 Hotel 的定义进行修改因为自动补全的字段不止一个字段所以我们使用列表类型定义如下 Data NoArgsConstructor ToString public class HotelDoc {private Long id;private String name;private String address;private Integer price;private Integer score;private String brand;private String city;private String starName;private String business;private String location;private String pic;private ListString suggestion;public HotelDoc(Hotel hotel) {this.id hotel.getId();this.name hotel.getName();this.address hotel.getAddress();this.price hotel.getPrice();this.score hotel.getScore();this.brand hotel.getBrand();this.city hotel.getCity();this.starName hotel.getStarName();this.business hotel.getBusiness();this.location hotel.getLatitude() , hotel.getLongitude();this.pic hotel.getPic();this.suggestion Arrays.asList(this.brand, this.business);} }以上定义就是将 brand 和 business 都进行补全的数据结构定义。之后再按照之前的批量添加将数据库中的数据进行批量新增即可。 2.5.3 补全查询以下是RestClient与DSL语句的一一对应关系补全查询的语句如下 Testvoid testSuggest() throws IOException{//1. 准备RequestSearchRequest request new SearchRequest(hotel);//2. 准备DSLrequest.source().suggest(new SuggestBuilder().addSuggestion(suggestions,SuggestBuilders.completionSuggestion(suggestion).prefix(hu).skipDuplicates(true).size(10)));//3. 发起请求SearchResponse response restHighLevelClient.search(request, RequestOptions.DEFAULT);//4. 输出结果System.out.println(response);}2.5.4 解析结果输出的查询结果是一个包含很多形式的信息的Map类型我们需要对其进行解析获取其中想要的结果才行解析的语句与DSL查询的结果对应关系如下解析的结果的语句如下 Testvoid testSuggest() throws IOException{//1. 准备RequestSearchRequest request new SearchRequest(hotel);//2. 准备DSLrequest.source().suggest(new SuggestBuilder().addSuggestion(suggestions,SuggestBuilders.completionSuggestion(suggestion).prefix(hu).skipDuplicates(true).size(10)));//3. 发起请求SearchResponse response restHighLevelClient.search(request, RequestOptions.DEFAULT);//4. 解析结果Suggest suggest response.getSuggest();//4.1 根据补全查询名称获取补全结果CompletionSuggestion suggestions suggest.getSuggestion(suggestions);//4.2 获取optionsListCompletionSuggestion.Entry.Option options suggestions.getOptions();//4.3 遍历for (CompletionSuggestion.Entry.Option option : options) {String text option.getText().toString();System.out.println(text);}}处理后的结果输出如下

查看全文

http://www.w-s-a.com/news/38478/