八度空间


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

Elasticsearch-58-通过ngram分词机制实现index-time搜索联想

发表于 2019-01-03 | 分类于 Elasticsearch
什么是ngram举个例子,现在有一个quick这个单词,在ngram的长度是1的时候,quick这个单词会被拆分为ngram length = 1的情况下被拆分为q u i c kngram length = 2的情况下被拆分为qu ui ic ckngram length = 3的情况下被拆分为q ...
阅读全文 »

Elasticsearch-57-搜索联想

发表于 2019-01-02 | 分类于 Elasticsearch
准备工作删除之前的my_index1DELETE /my_index 然后再添加几条测试用的数据1234567891011121314151617181920212223242526272829POST /my_index/my_type/1{ "title":&qu ...
阅读全文 »

Elasticsearch-56-前缀搜索 通配符搜索 正则搜索

发表于 2019-01-02 | 分类于 Elasticsearch
准备工作首先我们先手动建立一个index,再添加几条数据.创建index123456789101112PUT /my_index{ "mappings": { "my_type": { "propert ...
阅读全文 »

Elasticsearch-55-使用rescoring机制优化近似匹配的性能

发表于 2019-01-02 | 分类于 Elasticsearch
match 和 phrase match(proximity match)的区别match:只要简单的匹配到了一个term,就可以将term对应的doc返回. phrase match:首先扫描到所有term的document list,然后对每个document都计算term position ...
阅读全文 »

Elasticsearch-54-搜索实现召回率和精准度平衡

发表于 2018-12-27 | 分类于 Elasticsearch
首先需要了解两个概念,召回率和精准度 召回率比如搜索一个java spark,总共有100个document,能返回多少个document作为结果,这个就是召回率(recall) 精准度比如搜索一个java spark,能不能尽可能让包含java spark这个短语的,或者是java和sp ...
阅读全文 »

Elasticsearch-53-基于slop参数实现近似匹配

发表于 2018-12-27 | 分类于 Elasticsearch
slop参数比如我们现在有一个搜索请求如下:1234567891011GET forum/article/_search{ "query": { "match_phrase": { "title&quo ...
阅读全文 »

Elasticsearch-52-phrase match搜索及原理

发表于 2018-12-26 | 分类于 Elasticsearch
近似匹配假设现在有两个document,他们的content的值分别是:java is my favourite programming language, and I also think spark is a very good big data system.java spark are ve ...
阅读全文 »

Elasticsearch-51-cross-fields搜索问题解决方案

发表于 2018-12-19 | 分类于 Elasticsearch
解决方案一:使用copy_to用copy_to可以将多个field组合成一个field. 之前说的问题,其实就是出在了有多个field,那么我们只要把这些field合并成一个field即可,比如搜索一个人名,有first_name和last_name,将这两个field合并成一个full_na ...
阅读全文 »

Elasticsearch-50-most_fields策略进行cross-fields搜索的弊端

发表于 2018-12-19 | 分类于 Elasticsearch
cross-field搜索就是我们搜索一个唯一标识的时候跨越了多个field,比如一个人,标识是姓名,一个建筑的标识是地址. 姓名可以散落在多个field中,比如first_name和last_name中,地址可以散落在country,province,city中.跨多个field搜索一个标识,就是 ...
阅读全文 »

Elasticsearch-49-实战案例-most-fields策略

发表于 2018-12-17 | 分类于 Elasticsearch
对比之前我们写了best-fields策略,本文将使用most-fields来搜索,那么两者有什么区别呢?best-fields策略:主要是说,将某一个field匹配尽可能多的关键词document优先返回回来most-fields策略:主要是说将更多filed匹配到某个关键词的document优先 ...
阅读全文 »
1…222324…28

周泽

279 日志
14 分类
19 标签
© 2020 周泽
本站访客数:
博客全站共313.6k字