帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

spark streaming 适合处理规模不大的流式数据吗?

我有个疑惑,spark网上说法是用于大数据量处理(可以很轻易的做水平拓展),我感觉用 spark 的框架开发其实也有一定的范式上的简易性。 那么如果说业务开始数据量不是很大的流式任务(或者其他业务)用 spark 合适吗?(有没有杀鸡用牛刀这种问题,造成资源浪费?)

查看全文

做数据挖掘前获取数据的途径有哪些?

本人是一个初学个性化推荐的学生,却苦于不知道在哪里可以找到更好的相关数据进行研究。特别是电子商务方面的数据一般是不公开的,除了在天池或者kaggle可以找到一点外,大家平常是怎么获取数据的呢?谢谢

查看全文

有什么网站介绍数据挖掘算法的实现过程的?

有没有什么网站、博客或者书籍是讲数据挖掘的各种算法(像是神经网络啊,回归分析啊,树)是怎么通过手工去计算的过程,或者像是r软件或者python软件里面命令的讲解,可以通过一个例子,一步步讲解每一步计算的方式的。

查看全文