帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

怎么实现素材自动抓取?

做微信运营工作,发现找图片素材和有关的新闻资讯非常的消耗时间,有什么技术手段可以自己做一个数据收集的工作,自动抓取有关的资讯/图片信息。可以的话请大神给出技术实现的路径

查看全文

零基础如何实现推荐系统?

接到个任务,要三个星期内实现一个推荐系统。具体是基于用户的浏览记录推荐用户可能喜欢的。通过查阅后,想到将浏览数据导入hbase,基于hadoop平台 + spark mllib 来实现(不知道对不对)。现在过了一个星期,遇到问题如下:1. 将mysql数据导入hbase,借助sqoop工具,总是失败,不知道是不是版本不兼容问题。2. 该怎么将已有的数据转化成相应的模型,最后用mllib中的算法生成推荐的数据集。对hadoop和spark都不了解,急求大神指导!最好推荐一些书籍资料,备日后学习!诚心求教,不胜感激!

查看全文

爬虫软件可以从上市公司年报中抓取数据和文本吗?

作为一名苦逼的会计学博士生,手工从报表中摘数据实在是一件让人心力交瘁的事情。可能有人会问:为什么不用CSMAR之类的数据库呢?因为那些数据太大路货了,我们需要一些非标准化的、比较冷门的的数据。还有一些文本,需要人工把它们转化成数字的形式,比如董事会的个人教育背景,本科以下为0,本科为1,硕士为2,博士为3(当然,这个数据库里有,只是举个例子)。那么问题就来了:爬虫软件能不能从年报里抓取这些数据呢?如果是从网站中保存的PDF格式的年报呢?作为一个编程零基础的小白,实现难度大吗?大致需要几个月时间?

查看全文

基本没有任何编程经验的人,想明年从事计算机编程工作,需要具备哪些条件?可以看下描述,有我的详细情况。?

我大学学的是电气工程,偏智能化方向。毕业以后却没有做相关工作。而从事零售业,在良品铺子,7eleven都干过,职位最高的时候做到过区域经理。毕业三年了,但是辗转到现在却在一家做纸杯蛋糕的创业公司当店长。感觉老板不想也没打算把公司做大。而且现在薪水低,业绩差到哭。自己想明年转行到计算机行业做编程当面的工作。想从事数据挖掘和机器学习方面的工作。但是只有一点点编程思想方面的基础。我特别热爱计算机,可以做到为了听公开课而不睡觉的程度。请问我现在开始学习编程,到明年三月有希望进去一家互联网公司从事相关工作吗?需要具备哪些能力才能达到一般程序员被聘用的条件呢?我在成都。

查看全文