Elasticsearch-70-搜索 聚合分析结合使用

之前的几个案例都是全部使用的聚合分析,接下来呢,使用搜索和聚合分析结合起来使用

案例

需求: 统计指定品牌下每个颜色的销量 (小米)

请求:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
GET tvs/sales/_search
{
"size": 0,
"query": {
"term": {
"brand": {
"value": "小米"
}
}
},
"aggs": {
"group_by_color": {
"terms": {
"field": "color"
}
}
}
}

返回值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
{
"took": 35,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 0,
"hits": []
},
"aggregations": {
"group_by_color": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "绿色",
"doc_count": 1
},
{
"key": "蓝色",
"doc_count": 1
}
]
}
}
}

es的aggregation scope:任何的聚合,都必须在搜索出来的结果数据中执行,搜索结果,就是聚合分析操作的scope

global bucket

如果我们需要聚合分析两组数据,一组是根据搜索出来的结果集进行聚合分析,一组是根据全部的数据进行聚合分析,这时候就需要用到global bucket了,先看一个案例

需求: 分析单个品牌和所有品牌的销售平均价格

请求:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
GET tvs/sales/_search
{
"size": 0,
"query": {
"term": {
"brand": {
"value": "长虹"
}
}
},
"aggs": {
"single_brand_avg_price": {
"avg": {
"field": "price"
}
},
"all":{
"global": {},
"aggs": {
"all_brand_avg_price": {
"avg": {
"field": "price"
}
}
}
}
}
}

第一个aggs中single_brand_avg_price先计算了搜索返回结果的平均价格,然后在下面用了global,然后又一个aggs,计算全部的平均价格,global就是将所有的数据纳入聚合的scope,而不管之前的query

返回值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
{
"took": 33,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 3,
"max_score": 0,
"hits": []
},
"aggregations": {
"all": {
"doc_count": 8,
"all_brand_avg_price": {
"value": 2650
}
},
"single_brand_avg_price": {
"value": 1666.6666666666667
}
}
}

返回值中single_brand_avg_price.value就是针对query执行的聚合结果, all.all_brand_avg_price是针对所有数据执行的聚合结果