爬虫软件可以从上市公司年报中抓取数据和文本吗？

理由

举报取消

作为一名苦逼的会计学博士生，手工从报表中摘数据实在是一件让人心力交瘁的事情。可能有人会问：为什么不用CSMAR之类的数据库呢？因为那些数据太大路货了，我们需要一些非标准化的、比较冷门的的数据。还有一些文本，需要人工把它们转化成数字的形式，比如董事会的个人教育背景，本科以下为0，本科为1，硕士为2，博士为3（当然，这个数据库里有，只是举个例子）。那么问题就来了：爬虫软件能不能从年报里抓取这些数据呢？如果是从网站中保存的PDF格式的年报呢？作为一个编程零基础的小白，实现难度大吗？大致需要几个月时间？

2017年11月16日 5 条回复 2610 次浏览

分析,抓取,数据,数据挖掘,文本,爬虫,计算机网络

回复 ( 5 )

黄哥初入职场
0
举报回复
理由

举报取消

博士三个月，可以搞定吧。

请看看

应该有这样的认识：通过学习Python学会编程，不是纯学习Python。

如何训练自己的编程思路

部分免费Python免费视频
wifi 初入职场
0
举报回复
理由

举报取消

同求，我正在学R，有机会交流下，我在做价值投资
冯山初入职场
0
举报回复
理由

举报取消

应该来说是可以的不过估计需要费时很多。请问楼主现在进展如何？
匿名用户管理大师
0
举报回复
理由

举报取消

可以，但对于一个编程小白来说，难度还是比较大的，可以找蜘了帮忙，他们专门负责数据综合服务，轻轻松松帮你搞定，帮你节约大把时间
兔子家的智爷初入职场
0
举报回复
理由

举报取消

可以

找回密码

爬虫软件可以从上市公司年报中抓取数据和文本吗？

发起人：wcp1989 初入职场

回复 ( 5 )

我来回答

帐户注册

登录

找回密码

爬虫软件可以从上市公司年报中抓取数据和文本吗？

发起人：wcp1989 初入职场

回复 ( 5 )

我来回答