爬虫软件可以从上市公司年报中抓取数据和文本吗?

理由
举报 取消

作为一名苦逼的会计学博士生,手工从报表中摘数据实在是一件让人心力交瘁的事情。可能有人会问:为什么不用CSMAR之类的数据库呢?因为那些数据太大路货了,我们需要一些非标准化的、比较冷门的的数据。还有一些文本,需要人工把它们转化成数字的形式,比如董事会的个人教育背景,本科以下为0,本科为1,硕士为2,博士为3(当然,这个数据库里有,只是举个例子)。那么问题就来了:爬虫软件能不能从年报里抓取这些数据呢?如果是从网站中保存的PDF格式的年报呢?作为一个编程零基础的小白,实现难度大吗?大致需要几个月时间?

2017年11月16日 5 条回复 2285 次浏览

发起人:wcp1989 初入职场

回复 ( 5 )

  1. 黄哥
    理由
    举报 取消

    博士三个月,可以搞定吧。

    请看看

    应该有这样的认识:通过学习Python学会编程,不是纯学习Python。

    如何训练自己的编程思路

    部分免费Python免费视频

  2. wifi
    理由
    举报 取消

    同求,我正在学R,有机会交流下,我在做价值投资

  3. 冯山
    理由
    举报 取消

    应该来说是可以的 不过估计需要费时很多。请问楼主现在进展如何?

  4. 匿名用户
    理由
    举报 取消

    可以,但对于一个编程小白来说,难度还是比较大的,可以找蜘了帮忙,他们专门负责数据综合服务,轻轻松松帮你搞定,帮你节约大把时间

我来回答

Captcha 点击图片更换验证码