最近在做业务监控日志的展示, 公司用的es存储日志 ,所以也顺道学习了一波用java 的 RestHighLevelClient 查询es
成都创新互联公司是专业的金城江网站建设公司,金城江接单;提供网站建设、做网站,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行金城江网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!(1)普通查询
sql : where id = xxx ->es : termQuery("id" , "xxxx")
where id =XXXX and name = xxxx ->es : 这里要用到 BoolQueryBuilder , 也就是要用连接多个查询条件 ,
boolQueryBuilder.must(QueryBuilders.boolQuery().must(QueryBuilders.termsQuery("id ", xxx)).must(QueryBuilders.boolQuery().must(QueryBuilders.termsQuery("name ", xxx)))
(2) 聚合查询 es中用桶的概念去做聚合查询, 首先将一堆数据根据什么条件分成一个一个的桶 , 也就是sql中的 group By 。每个桶中又有什么操作 , 比如 count , sum ,等。
sql : group by id -> es : AggregationBuilders.terms("idCount").field("id") , 先给你的桶起一个叫 idCount 的名字,以便于在后边获取数据的时候根据这个桶id 拿到自己的桶分组结果 ,filed(id") 就是按照id分组了。
分享一个聚合查询最常用的操作: topHits ,比方说 ,我现在 sql 想这样查 , select count(id) , name , age from person group by age , 按照 age 分组之后 , 我还想知道 name等其他字段 , 这个时候你就可以用tophits ,
桶内查询:TermsAggregationBuilder aggregationBuilder = AggregationBuilders.terms("active_user_count").field(field).size(10000) .subAggregation(AggregationBuilders.topHits("time").fetchSource({“age” , "name"}, null).size(1) );
最后的size(1) 就是最后分组里面 ,我就要一条数据, 当然你还可以根据其他条件进行桶内排序, 比方 ,找出 18岁的人中, 最小的前三位 , 这个时候 ,tophits 可以这个样写,
TermsAggregationBuilder aggregationBuilder =
// 桶名字叫 max_age , 按照age 分组 , 每个桶里面又按照出生日期倒序排列, 并且每个桶只取前三个值
AggregationBuilders.terms("max_age").field("age").size(10000)
.subAggregation(AggregationBuilders.topHits("time").fetchSource(new String[]{"age", "name" , "id" }, null).size(3).sort("borb_date", SortOrder.DESC)
);
// 在 桶外, 我又想根据 年龄倒序排列 ,
MaxAggregationBuilder serverTime = AggregationBuilders.max("maxAge111111").field("age");
BucketOrder absTimeOrder = BucketOrder.aggregation("maxAge111111", true);
aggregationBuilder.order(absTimeOrder);
aggregationBuilder.subAggregation(serverTime);
sourceBuilder.aggregation(aggregationBuilder);
注意 maxAge111111 这个名字哦 ,大家在调试代码的时候 , 如果没有出结果 ,一定要把 SearchRequest 对象中的 source 拷贝出来运行一下哦,本质上java 代码还是在构建 查询语句的过程 ,所以你也可以先用kibana写es 查询,成功后再跟根据语句去写java代码。
还有一个需要注意的地方 ,分桶查询结果默认只返回十条, 所以如果你图省事儿, 直接设置10000 ,sourceBuilder.size(10000) , 但是当查询结果超过一万就没办法了 ,安全做法是用es 游标去循环取值。
你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧