回复 ( 1 )

  1. 立峰
    理由
    举报 取消

    谢邀,如果按照你所提供的选择来说,那就mongodb吧。

    hive是离线分析的,当做是数据仓库来使用,采用mp进行分布式操作,比较慢。

    impala是是当做实时查询系统来使用,比hive快一个数量级以上。

    你是抓取网页后的存储那就用mongodb吧,半结构化数据,用hbase也是可以的。

我来回答

Captcha 点击图片更换验证码