- 主题:最近看大数据方面的选型,轮子太多了
实时etl吧,这个组合对于olap很常见,不过对于变更数据不友好
【 在 MyWorkLife (我是谁) 的大作中提到: 】
: 用flink的目的是啥呢,
: clickhouse的查询还不够满足实时性?
--
FROM 221.220.225.*
mongodb做olap还是差太远
【 在 Xjt (Voldemort) 的大作中提到: 】
: 原本我们用的是mongodb,性能感觉可以,但坑爹的mongodb坑也很多……
--
FROM 221.220.225.*
比这复杂,我的理解,分布式应用目前比较正确的形态
只要是分布式应用,理论上都得考虑这些问题
【 在 guestking (无) 的大作中提到: 】
: 我对flink的理解
: flink就是一个有状态的kafka consumer
: 当然数据来源不止kafka这一个
: 相比于你自己写一个consumer
: flink提供了更多企业级的功能支持
: 比如并行,多算子协同,checkpoint,savepoint,故障恢复,窗口等等功能
: 这些东西你要自己写,还是挺麻烦的
--
FROM 221.220.225.*