帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

adaboost为什么不容易过拟合呢?

刚刚接触机器学习,adaboost对训练数据分类的非常精细,为什么不会过拟合呢?是迭代过程中基函数会自己做权衡,不会为了一些明显的噪声去增加err(损失),从而对噪声有一定的容忍度吗?

查看全文

如何理解马氏距离,多维Mahalanobis距离是否要用到“互相关张量”来进行描述?

如题,现在我知道数据分析界的马氏距离是考虑到两个变量之间的相关性然后求出它的距离的,在我们的数据挖掘导论课上提到马氏距离实际上是这样的:两个互相关变量包含两个维度,它俩之间的“距离”定义为,其中两维度构成的平面上“回归椭圆(不知道这样说对不对)”的距离,请问互相关矩阵和椭圆之间是怎么建立起联系的,也就是不清楚互相关性是怎么拥有“到椭圆的距离”这一几何解释的?还有就是一般讨论的马氏距离是指的两个变量之间的“相关距离”,如果涉及到两个多维变量之间的“距离”计算,则是不是还要发展某种“互相关张量”来进行描述?比如使用王赟回答中提到的那个例子,两个人这是两个变量,两人各自的身高、体重,是两个维度,但如果我们再加一个维度,比如说腰围,这样两个 […]

查看全文

能不能用大数据证明星座的真实性?

很多人说星座不准只是研究的不够深,什么人在不同星守护下星座不一样之类之类。那这个可以通过大量的数据来证明咩?——————补充分割线——————大家都不要吐槽我了啦……我是不信星座的,也不觉得人可以被简单粗暴的分类。只是突然听到身边人说了一堆理论,说有人真的可以用各种正确的学说来证明星座的可信度,所以突发奇想现在数据统计这么发达,是不是可以从根本是证明这个东西,所以才来提问的~平时对一些统计类的东西也没有了解,也不是很了解大数据是什么,所以看到大家说证明真伪什么的真的一头雾水啊……因为把这两个扯到一起不开心的答主都消消气嘛好不好~~~谢谢每一个人的回答~

查看全文