elasticsearch和clickhouse的选择

水木社区手机版

主题:elasticsearch和clickhouse的选择
楼主|lichehuo|2022-10-09 09:52:47|展开
目前我们的日志是存在es中的，平时没什么量的情况下，一切都ok。但是当给客户演示2w或者3wtps压测的时候，一秒的日志量达到了几百G，这个时候写入es就遇到瓶颈了。
我简单的测试了一下，es7.6版本极限也就是一次写入10几M，而且响应时间10+s了。升级到7.10+以上，可以写入30M，但是响应时间也是3+s。对于压测的日志量，这个响应时间不可接受。
压缩率也对比了一下，也是ch完胜。
查询耗时，没有拿上百G，上T的日志来比，可能在量大起来的情况下，es应该比ch强。但是考虑到我们的日志查询都是最基本的匹配查询，es有点大材小用了。
考虑换成clickhouse，粗略扫了一眼它的文档，感觉运维起来有点麻烦。es毕竟成熟，社区活跃。
版上有大神用过ch吗？能给一些意见或者建议吗
--
FROM 113.116.198.*
7楼|lichehuo|2022-10-10 10:59:43|展开
【在 SankHeart 的大作中提到: 】
: es参数有问题吧，写入速率太低了
我这是测试，单机容器版的，非生产
--
FROM 113.116.181.*
8楼|lichehuo|2022-10-10 11:00:08|展开
【在 zxkane 的大作中提到: 】
: 中间用queue加buffer
:
: #发自zSMTH@GM1910
老板不给用kafka。。。
--
FROM 113.116.181.*
9楼|lichehuo|2022-10-10 11:00:44|展开
【在 hany2017 的大作中提到: 】
: 一秒日志几百G
: 这个服务至少服务100万人，市值100亿以上
关debug会少很多
--
FROM 113.116.181.*
10楼|lichehuo|2022-10-10 11:03:12|展开
【在 jimmycmh 的大作中提到: 】
: 日志要实时入ES？
: 一般不是ELK套装吗，logstash负责收集，然后指入es
:
打日志的网络区域一般是SF，而写入日志的地方一般是MGMT，两个网络区域只有几台机器互通，所以ELK那套行不通，我们是走的EVENT，日志采集之后打包走EVENT从SF到MGMT，相当于自己实现采集，自己实现入es
--
FROM 113.116.181.*
14楼|lichehuo|2022-10-11 16:14:20|展开
【在 SankHeart 的大作中提到: 】
: 你的3w tps业务也是在单机容器上测试的吗?
肯定不是呀
--
FROM 113.116.181.*
15楼|lichehuo|2022-10-11 16:15:55|展开
【在 jimmycmh 的大作中提到: 】
: 如果瓶颈在写入ES的话，建议看看ES的benchmark，印象中肯定不止几十M/秒
: 另外，看你前面的回复，单机ES，每秒几百G日志
: 不知道机器配置如何，以单块HDD写稿120M/s计算，12块硬盘也才1.4G/s，不知道几百G怎么搞
: ...................
可能我没说清楚，我单机去测ch和es，这个时候最多几十M而已。压测几万tps时候，我们日志是采样了，es集群规模是15台16C32G的机器。
--
FROM 113.116.181.*
18楼|lichehuo|2022-10-12 10:06:42|展开
【在 jimmycmh 的大作中提到: 】
: 写入ES，磁盘很可能比cpu先到瓶颈
: 15台机器，每台机器12块硬盘1.4G/s，15台机器也到不了几百G/s
:
是的，写不了，所以我采样了
--
FROM 113.116.181.*
21楼|lichehuo|2022-10-25 09:21:04|展开
【在 eventvwr 的大作中提到: 】
: 你们这打的啥日志，3wtps一秒钟日志量几百G，先精简下日志吧
精简了，现在降到一秒2G左右了
--
FROM 113.116.196.*