大二学生党一枚,希望读云计算与大数据方向的研究生,希望前辈不吝赐教
查看全文大数据方向选择,推荐系统还是mapreduce ?+经典论文推荐
求推荐有没有 “广告推荐” 方向的一些英文经典论文啊,谢谢~另外,我自己对推荐系统比较感兴趣啦,但是朋友都推荐去做mapreducce,说更好就业一点儿,是这样么?有大牛帮我解决一下!
查看全文请问哪里可以找到世界各国近50年的平均平均气温?
设计学学生,正在做一个数据可视化的设计,需要中、美、日本、巴西、德国和澳大利亚从1970年至今的年平均气温数据…新手上路,找了蛮久也没找到比较靠谱的数据。想请大家推荐数据来源,越清晰简单不用算越好。以及,整理数据能力仍然薄弱,请问怎样才能更快入门儿呢。谢谢大家!
查看全文为什么movielens数据集的时间戳每个用户那么密集?不科学啊
关于movielens数据集的时间戳表示的是用户提交评分的时间,为什么同一个用户时间戳如此密集,换算一下基本10天评价了200多部电影?而且同一个用户有些时间戳有重复的,同一时间评价好几部电影?
查看全文如何评价百度机器翻译获国家科技进步二等奖?
http://tech.sina.com.cn/i/2016-01-08/doc-ifxnkkuv4215559.shtml
查看全文LOL玩家究竟有多疯狂?
〔背景〕本人小本大四学生,课程需要,要求制作一个爬虫去抓网页数据。看了几个常用的网站,发现多玩盒子的数据结构比较友好,就用chrome抓了几个包。在研究http请求的时候发现了多玩对游戏场次编号的id。随手尝试了几十个id,并有意去尝试查询ID的极限。最后结果为,游戏编号id从99e到150e,都对应了一场固定区服(电信十)的游戏场次信息(再小的编号显示数据丢失)。这么说来,有记录的场次就有50e场,记得当初看LOL玩家分布统计,电信十的玩家量为300w,这么说平均每个游戏玩家1,2年内游戏500场?〔疑问〕LOL在中国真有这么火么?还是我数据的打开方式不对?
查看全文