如果在处理的数据中,有的是分布:比如工厂内分贝值的分布,或者电机转速的分布。一般一个分布(一维的)就是一个向量,满足每一个维度都大于0且L^1(V)=1,平时我们也直接当成向量进行处理,求欧氏距离,但是觉得这样做并不科学,因为作为向量就默认了“维度”这一坐标是没有意义的,可是实际上,分布里的横坐标有着很实际的意义,比如分贝或者转速。请问用什么方法可以更好地衡量两个分布之间的相似度(或者距离)?
查看全文为什么分母从n变成n
题主对“有偏估计”和“无偏估计”间的转化,存在一定疑问:为什么分母从n变成n-1,就能把样本的有偏估计转化成无偏估计? 我知道样本方差之所以是有偏估计,是因为它有系统性误差,不管怎么抽样,样本方差值总是小于理论方差值。 之所以存在这样的系统性误差,是因为计算式使用的均值是样本均值Y,不是总体均值u。由于Y是样本中n个X求得的均值,它总是比理论上的u更加靠近这一组样本中心。 同时也知道分母n-1的由来大概是因为自由度。由于Y本身是n个X的均值,并不独立,依赖于每组X抽样。所以均值表达式其实是1个约束式子,方差计算式的自由度就从n变成了n-1。要减去这个约束。 然后呢?为什么减去这个约束,用正确的自由度来描述计算式,它就成了无偏估计?怎 […]
查看全文