2M是200w数据还是数据文件只有2M大小?
这点数据随便整吧。就按天吧,更符合使用习惯些
【 在 qianfeng018 的大作中提到: 】
: 标 题: hive分区如何选择
: 发信站: 水木社区 (Mon Jan 8 15:33:37 2024), 站内
:
: 请教大家:
: hive表,有按天、按ID查询的需求, 所以按天,按ID建立了分区。
: 每个分区存储的数据只有2M。这样的话,感觉会有小文件问题。
: 但确实有按天、按ID的查询需求,所以不知道怎么去建立分区,读取效率会更高?
: --
:
: ※ 来源:·水木社区
http://www.mysmth.net·[FROM: 223.104.41.*]
--
FROM 1.202.162.*