发起人:WAN ZXY 初入职场

回复 ( 1 )

  1. 梁勇
    理由
    举报 取消

    hive表分区支持10000个是没有问题的,再多的话就要看集群性能配置了。

    分区只是个目录映射

    我们在实际使用时是按照年月日来划分表的分区数据。

    分区内的数据量级没有明显的范围区分,如果你的集群性能不错,例如内存超过128G,节点数多,那么你的分区数据量就可考虑适量增大到千万级别。

    建议hadoop的块大小能适当调大些,分区里面的小文件数适当减少些。

我来回答

Captcha 点击图片更换验证码