熵在决策树模型中被应用,然而关于熵的含义理解还是非常浅显。神人可否出来给一个自己的更通俗的理解?
查看全文为什么beta分布可以写成二项分布的和,gamma分布可以写成泊松分布的和?
如题。看过关于gamma表示成指数函数和的解释,两个都是连续性分布还比较好理解,但是连续型分布能表示成离散型的和,本质原因是什么呢?泊松分布和二项分布之间的关系,可否类推到gamma和beta之间?
查看全文如何理解马氏距离,多维Mahalanobis距离是否要用到“互相关张量”来进行描述?
如题,现在我知道数据分析界的马氏距离是考虑到两个变量之间的相关性然后求出它的距离的,在我们的数据挖掘导论课上提到马氏距离实际上是这样的:两个互相关变量包含两个维度,它俩之间的“距离”定义为,其中两维度构成的平面上“回归椭圆(不知道这样说对不对)”的距离,请问互相关矩阵和椭圆之间是怎么建立起联系的,也就是不清楚互相关性是怎么拥有“到椭圆的距离”这一几何解释的?还有就是一般讨论的马氏距离是指的两个变量之间的“相关距离”,如果涉及到两个多维变量之间的“距离”计算,则是不是还要发展某种“互相关张量”来进行描述?比如使用王赟回答中提到的那个例子,两个人这是两个变量,两人各自的身高、体重,是两个维度,但如果我们再加一个维度,比如说腰围,这样两个 […]
查看全文