样本量少，方差大，能假设其服从正态分布吗？

理由

举报取消

实际背景：预测一个用户的购买时间可用数据：历史购买时间准备解法：算出历史购买时间间隔，假设其符合正态分布。计算最近一次购买时间距今天的间隔时间。最后计算置信区间blablabla. P.s 整体的用户购买间隔不符合正态分布，所以单独计算每一个用户。那么问题来了：用户的购买次数不多，也就3 ~ 10次（即样本量只有2~9且方差大）。所以可以用上面解法么？

2017年6月3日 7 条回复 1732 次浏览

分析,学习,数学,数据,数据挖掘,机器,统计

回复 ( 7 )

清雨影初入职场
0
举报回复
理由

举报取消

谢邀！

是这样，我们一般得出的都是这个结论：

我有P%的概率断言这个变量服从正态分布这个假设成立……

既然是假设，当然可以啦！

我还可以假设母猪会上树呢！只不过我们后面要通过各种指标验证假设对不对（接受还是拒绝）
曾博初入职场
0
举报回复
理由

举报取消

我记得有个东西叫做normality test?
谢同学管理大师
0
举报回复
理由

举报取消

这个。。。应该是服从泊松分布吧？什么出车祸红绿灯下个顾客买东西。。。

或者楼主用非参数检验咯DW….
周周管理大师
0
举报回复
理由

举报取消

不是服从泊松分布的呢？
上大飞猪钱小莲初入职场
0
举报回复
理由

举报取消

样本量太少，中心极限定理应该不行。而且从问题背景来看，指数分布应该更合适。本身间隔时间是非负变量
匿名用户管理大师
0
举报回复
理由

举报取消

10次可以。5次一下不行。
Neicul 管理大师
0
举报回复
理由

举报取消

不能假设服从正态分布。

首先，3~10个数据这个样本量，中心极限定理很难起作用。

其次，即使样本量足够大，中心极限定理对特定 Heavy Tail 分布不起作用。

多假设几个模型，对每个模型作参数估计，再找出后验概率最大的模型吧。

找回密码

样本量少，方差大，能假设其服从正态分布吗？

发起人：Robot 管理大师

回复 ( 7 )

我来回答

帐户注册

登录

找回密码

样本量少， 方差大，能假设其服从正态分布吗？

发起人：Robot 管理大师

回复 ( 7 )

我来回答

样本量少，方差大，能假设其服从正态分布吗？