Elasticsearch聚合 之 Terms.docx
《Elasticsearch聚合 之 Terms.docx》由会员分享,可在线阅读,更多相关《Elasticsearch聚合 之 Terms.docx(7页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Terms聚合 raggs : “genders” : j iterms : field : gender )得到的结果如下:,zaggregations : “genders” : ,zdoc_count_error_upper_bound/z: 0, z,sum_other_doc_count/z: 0,“buckets”:11key : male ,doc count” : 101 c1key : female ,doc count” : 10数据的不确定性使用terms聚合,结果可能带有一定的偏差与错误性。举个例子:我们想要获取name字段中出现频率最高的前5个。此时,客户端向ES发送
2、聚合请求,主节点接收到请求后,会向每个独立的分 片发送该请求。分片独立的计算自己分片上的前5个name ,然后返回。当所 有的分片结果都返回后,在主节点进行结果的合并,再求出频率最高的前5 个,返回给客户端。这样就会造成一定的误差,比方最后返回的前5个中,有一个叫A的,有50 个文档;B有49。但是由于每个分片独立的保存信息,信息的分布也是不确定 的。有可能第一个分片中B的信息有2个,但是没有排到前5 ,所以没有在最 后合并的结果中出现。这就导致B的总数少计算了 2 ,本来可能排到第一位, 却排到了 A的后面。size 与 shard_size为了改善上面的问题,就可以使用size和shard
3、_size参数。 size参数规定了最后返回的term个数(默认是10个)shard_size参数规定了每个分片上返回的个数 如果shard_size小于size ,那么分片也会按照size指定的个数计算通过这两个参数,如果我们想要返回前5个,size=5;shard_size可以设置大于5,这样每个分片返回的词条信息就会增多,相应的误差几率也会减小。order排序order指定了最后返回结果的排序方式,默认是按照d。jcount排序。(aggs :(“genders” : “terms” : q i 1 i tield : gender ,order : ( _count : asc )也可
4、以按照字典方式排序: aggs : “genders” : termsfield : gender ,上iorder : t _term : asc )当然也可以通过order指定一个单值的metric聚合,来排序。aggs“genders” : . terms :field : gender”,“order” : avg_height : desc aggsavg height”:avg height”:field : height” 同时也支持多值的Metric聚合,不过要指定使用的多值字段: faggs : “genders” : . terms :1field : gender ,“o
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Elasticsearch聚合 Terms Elasticsearch 聚合
限制150内