- 主题:clickhouse使用问题
我在使用clickhouse的时候,遇到这样的问题:
1.背景:业务系统每秒30M的日志量
日志格式如下:
time level type traceid parentid spanid service instance ip msg
level只有五个值
type有10个值
traceid/parentid/spanid是调用链要用到的三个值
service大概K级别,instance是service的子项,假如service=svr1的话,instance取值就是svr-0,svr-1,svr-2这种,数量从1-100
建表的时候我按照day分区
order by字段如下:time,type,level,service,instance,traceid
2.现在的问题有几个:
1.第一个问题是集群查询超级慢:
单机clickhouse,写入和查询速度都在能接受范围内,但是上了集群,写入没问题,查询的时候响应特别慢。
单独查这样的条件:where type='t1' and time>=t1 and time <=t2,t1-t2相差1小时
在一个并发的前提下,数据量G级别的时候,耗时大概500ms
但是在5并发的情况下,耗时直接飙升到2s,加大并发到10,20,耗时直接飙升到10+s
不知道是什么原因?
2.第二个问题是:这样的设计表是不是有问题?order by字段是否需要调整,越小的放越前面?
3.第三个问题:按天分区是不是太粗,有必要调整成按小时分区吗?
--
FROM 103.167.135.*
clickhouse并发本来就很弱,默认查询用一半的CPU,你搞10个并发,不久等于十个查询抢这些cpu资源么?
按天分区没有问题,我拿来存了几百亿数据了。但是只是当作冷库备份。
clickhouse是基于跳表,索引越稀疏就可以排前面,实在不行可以考虑用用布隆filter。
clickhouse挺稳定的,就是元数据丢了还能通过磁盘上的数据恢复回去。但是扩容太麻烦了,所以我现在用apache doris,clickhouse很久没关注了,不知道更新了啥。。。
【 在 lichehuo 的大作中提到: 】
: 我在使用clickhouse的时候,遇到这样的问题:
: 1.背景:业务系统每秒30M的日志量
: 日志格式如下:
: ...................
--
FROM 58.42.245.*
没有特殊需求可以首选单机,然后表上面再优化优化。
【 在 lichehuo 的大作中提到: 】
: 我在使用clickhouse的时候,遇到这样的问题:
: 1.背景:业务系统每秒30M的日志量
: 日志格式如下:
: ...................
--
FROM 61.185.187.*
单机容灾怎么办
【 在 Erlang 的大作中提到: 】
: 没有特殊需求可以首选单机,然后表上面再优化优化。
--
FROM 180.158.7.*