如何使用爬虫获取新加坡PSI信息? 举报 理由 举报 取消 想对新加坡的PSI数据进行分析,Historical PSI Readings 中提取从2014年4月至今的PSI数据,就是网页中间的那个表格,应该怎么做呢? 2017年9月3日 4 条回复 798 次浏览 Python,分析,数据,爬虫,计算机网络
回复 ( 4 )
蟹腰
先上代码:
瓶颈主要在硬盘IO上,30线程爬网页 vs 单线程写入.csv文件。
改成并发写入数据库应该会快很多。
有时刚开始就会出现报递归Error,可是我代码中没用递归啊。
@张天
在Firefox里面用F12看了下,有几个js脚本获取失败,可以看到域名指向了谷歌,可能爬虫里面要想办法把这几个js脚本自己补上(至少jquery.min.js是很常见的,其他的可以再搜搜)