Re: hive分区如何选择

水木社区手机版

展开|楼主|同主题展开|溯源|返回

上一篇|下一篇|同主题上篇|同主题下篇

主题:Re: hive分区如何选择
jimmycmh|2024-01-09 17:55:27|
不完全准确，分区key的选择以及分区数决定了查询时扫描的数据数量

楼主这个，按天分区，然后按id检索，是要扫描所有数据的

所以，还是要衡量一下每种检索的频次、响应时间需求等

不过既然数据量不太多，按月和id联合起来分区，应该能平衡吧

【在 eventvwr 的大作中提到: 】
: hive的分区其实就是个目录。查询速度只取决要扫描的数据块个数和大小。和分区数多少没有绝对的关系，你当前的分区方式，查询肯定更快啊，但是快的有限，因为你的数据量太小了。但是写入速度肯定会慢很多
--
FROM 124.126.1.*

上一篇|下一篇|同主题上篇|同主题下篇

BYR-Team©2010. KBS Dev-Team©2011 登录完整版