样本量少, 方差大,能假设其服从正态分布吗? 举报 理由 举报 取消 实际背景:预测一个用户的购买时间可用数据:历史购买时间准备解法:算出历史购买时间间隔,假设其符合正态分布。计算最近一次购买时间距今天的间隔时间。最后计算置信区间blablabla. P.s 整体的用户购买间隔不符合正态分布,所以单独计算每一个用户。那么问题来了:用户的购买次数不多,也就3 ~ 10次(即样本量只有2~9且方差大)。所以可以用上面解法么? 2017年6月3日 7 条回复 1469 次浏览 分析,学习,数学,数据,数据挖掘,机器,统计
回复 ( 7 )
谢邀!
是这样,我们一般得出的都是这个结论:
我有P%的概率断言这个变量服从正态分布这个假设成立……
既然是假设,当然可以啦!
我还可以假设母猪会上树呢!只不过我们后面要通过各种指标验证假设对不对(接受还是拒绝)
我记得有个东西叫做normality test?
这个。。。应该是服从泊松分布吧?什么出车祸红绿灯下个顾客买东西。。。
或者楼主用非参数检验咯DW….
不是服从泊松分布的呢?
样本量太少,中心极限定理应该不行。而且从问题背景来看,指数分布应该更合适。本身间隔时间是非负变量
10次可以。5次一下不行。
不能假设服从正态分布。
首先,3~10个数据这个样本量,中心极限定理很难起作用。
其次,即使样本量足够大,中心极限定理对特定 Heavy Tail 分布不起作用。
多假设几个模型,对每个模型作参数估计,再找出后验概率最大的模型吧。