用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
hive表分区支持10000个是没有问题的,再多的话就要看集群性能配置了。
分区只是个目录映射
我们在实际使用时是按照年月日来划分表的分区数据。
分区内的数据量级没有明显的范围区分,如果你的集群性能不错,例如内存超过128G,节点数多,那么你的分区数据量就可考虑适量增大到千万级别。
建议hadoop的块大小能适当调大些,分区里面的小文件数适当减少些。
昵称*
E-Mail*
回复内容*
回复 ( 1 )
hive表分区支持10000个是没有问题的,再多的话就要看集群性能配置了。
分区只是个目录映射
我们在实际使用时是按照年月日来划分表的分区数据。
分区内的数据量级没有明显的范围区分,如果你的集群性能不错,例如内存超过128G,节点数多,那么你的分区数据量就可考虑适量增大到千万级别。
建议hadoop的块大小能适当调大些,分区里面的小文件数适当减少些。