帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何使用python和R高效而优雅地处理大数据?

题主是Python和R的初学者,最近打算帮教授做项目,但是教授说他处理的数据量非常大,R和python都不行。我看知乎上都说R处理大数据不行,他用的SAS。那么有没有高效的方法用python(或者与R结合)能够达到SAS处理大数据的能力呢?还是题主只能从头撸起SAS了?(求好心人分享SAS啊T△T)

查看全文

数据集构造都有哪些节省人力成本的tricks?

最近在做一些机器学习相关的task,但是数据集太难构造了(文本的,主要是人工标注太辛苦,自己标了大概有1000多条文本),因此在数据集构造上有点随意,导致数据集噪声偏大,交叉验证的结果和测试集上的表现完全不一样,但是1w多条都要自己标的话会很辛苦。因此在此想问下大家遇到这个问题都是怎么做的?

查看全文

如何系统地学习Python 中 matplotlib, numpy, scipy, pandas?

最近在学习python绘制图形的相关知识,学习到了这几个库,所以想请教一下各位知友。希望用python来做数据挖掘相关的任务。想问问各位知友,python做数据挖掘是否足够强大?学习数据挖掘需要学习哪些知识呢?我是一个本科生,本科学习的话能从事数据挖掘相关工作吗?

查看全文