帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

是否能够求出我所有粉丝的粉丝数?

比如A有三个粉丝,每个粉丝旗下有三万个粉丝;B有100个粉丝,但多数粉丝都是零粉丝,或者不超过10个。那么A的影响力实际上是要高于B的。(可以得到这个结论吗?可能有点极端)那么我就是想说:如何在知乎找到自己的粉丝一共有多少粉丝这样一个数据?

查看全文

网络爬虫是否侵权?

本人普通学生一名,参与某公司数据抓取任务已有一年半,抓取网站过百,总条数过三千万,也抓取过像百度文库这种大型网站免费资源近千万条,包括文档的下载,所有下载的文件不完全统计超过10TB,毕竟给公司做的,但也考虑过版权问题,这是不是都属于侵权?一般网络爬虫如何才能免于法律问题?

查看全文

Python 3 网络爬虫学习建议?

如题,题主python只是比较熟悉numpy和scipy、matplotlib这三个包,都是做科研的时候在用。最近心血来潮自己写了几个机器学习算法,然后想去网站上去爬一些东西玩玩,因为以后可能会想把它接到自己还没写完的自动交易程序里,但也只是个雏形,还有很长的路要走。但在办公室琢磨了一下午,发现网络爬虫这里又是个大坑,现阶段了解的就是scrapy其实并不适合python3,于是我现在只是在学习requests和beautifulsoup这俩包了。想请教网络爬虫这一块的行家,有没有什么推荐看的教程或者教学、博客什么的,真的想在这块在仔细学习一下。先谢过啦!

查看全文

做毕业论文,想要利用gooseeker等爬虫抓取新浪微博指定用户的相关信息,如何做到?

从指定用户开始,抓取他所有(可以自己设置抓取页数)的微博信息,及每条微博下面评论、转发、点赞用户的相关属性信息(包括id、用户名、所在地、粉丝数、关注数、标签等等),然后进行迭代,抓取刚才抓到用户(即刚才评论、转发、点赞的所用用户)的所发布的所有(可以自己设置抓取页数)微博信息,在抓他每条微博下面评论、转发、点赞用户的相关属性信息,以此类推,不知是否可以实现?如何实现?真心求教各位大神!

查看全文