海量数据处理实际操作方法?

理由
举报 取消

有T以上容量的数据表,excel、txt、sql、csv等数据类型的数据表,用什么工具或者数据库或者编程思想可以解决,在这些数据中提取特定字段并保存的工作

2017年8月4日 2 条回复 1032 次浏览

发起人:尔尔 初入职场

回复 ( 2 )

  1. 二少
    理由
    举报 取消

    Python 按行读取文件 取出所需的东西 放入字典

  2. 匿名用户
    理由
    举报 取消

    如果是文本文件可以用grep -e 接 >,但是上T一个文件的没试过… 一般大文件都先分小段然后写个loop抓。这个如果shell不熟,python应该也可以做。

    sql可以考虑先index一下增加抓取速度。

    excel别想了基本不可能。

我来回答

Captcha 点击图片更换验证码