回复 ( 1 )

  1. 金柔
    理由
    举报 取消

    我简单来说一下阿里集团的数据模型。

    • 离线

    处理的数据主要来源与业务数据库和日志,通过数据同步中心和日志工具将源数据抽取到数据仓库的ods层,数据仓库主要由ods、dwd、dws和ads几个层级组成,采用odps对离线数据进行处理。将处理的结果采用数据同步中心存到数据库中在做其他数据应用。

    • 实时

    模型差不多,采用TT抽取实时流,用storm+galaxy做流计算。

我来回答

Captcha 点击图片更换验证码