爬虫软件可以从上市公司年报中抓取数据和文本吗? 举报 理由 举报 取消 作为一名苦逼的会计学博士生,手工从报表中摘数据实在是一件让人心力交瘁的事情。可能有人会问:为什么不用CSMAR之类的数据库呢?因为那些数据太大路货了,我们需要一些非标准化的、比较冷门的的数据。还有一些文本,需要人工把它们转化成数字的形式,比如董事会的个人教育背景,本科以下为0,本科为1,硕士为2,博士为3(当然,这个数据库里有,只是举个例子)。那么问题就来了:爬虫软件能不能从年报里抓取这些数据呢?如果是从网站中保存的PDF格式的年报呢?作为一个编程零基础的小白,实现难度大吗?大致需要几个月时间? 2017年11月16日 5 条回复 2285 次浏览 分析,抓取,数据,数据挖掘,文本,爬虫,计算机网络
回复 ( 5 )
博士三个月,可以搞定吧。
请看看
应该有这样的认识:通过学习Python学会编程,不是纯学习Python。
如何训练自己的编程思路
部分免费Python免费视频
同求,我正在学R,有机会交流下,我在做价值投资
应该来说是可以的 不过估计需要费时很多。请问楼主现在进展如何?
可以,但对于一个编程小白来说,难度还是比较大的,可以找蜘了帮忙,他们专门负责数据综合服务,轻轻松松帮你搞定,帮你节约大把时间
可以