帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何评价k

和其他主流的聚类算法有什么区别?为什么数据挖掘和机器学习的书籍中都很少提到?

查看全文

大数据分析、数据挖掘用什么例子来练习?

对于数据分析、数据挖掘,知识相对零散,对照教材上的简单例子训练不够系统。请问入门实战内容(非入门基础知识)大家有什么建议?再强调一下,不必贴知乎已有的关于基础知识的回答,比如建议看《用python做数据分析》、统计学教材、pandas、sklearn文档什么什么的,要实战的,有接近实际的例子的。非常感谢!

查看全文

有哪些比较好的做异常值检测的方法?

数据预处理的好坏,很大程度上决定了模型分析结果的好坏。(Garbage In Garbage Out!)其中,异常值(outliers)检测是整个数据预处理过程中,十分重要的一环。方法也是多种多样。比如有基于经典统计的方法——三倍于标准差之上的数据为异常值等等。由于异常值检验,和去重、缺失值处理不同,它带有一定的主观性。所以,想请问一下各位大牛,平时你们更愿意相信哪种或哪几种异常值检测的方法。谢谢!~

查看全文