样本量少, 方差大,能假设其服从正态分布吗?

理由
举报 取消

实际背景:预测一个用户的购买时间可用数据:历史购买时间准备解法:算出历史购买时间间隔,假设其符合正态分布。计算最近一次购买时间距今天的间隔时间。最后计算置信区间blablabla. P.s 整体的用户购买间隔不符合正态分布,所以单独计算每一个用户。那么问题来了:用户的购买次数不多,也就3 ~ 10次(即样本量只有2~9且方差大)。所以可以用上面解法么?

2017年6月3日 7 条回复 1469 次浏览

发起人:Robot 管理大师

回复 ( 7 )

  1. 清雨影
    理由
    举报 取消

    谢邀!

    是这样,我们一般得出的都是这个结论:

    我有P%的概率断言这个变量服从正态分布这个假设成立……

    既然是假设,当然可以啦!

    我还可以假设母猪会上树呢!只不过我们后面要通过各种指标验证假设对不对(接受还是拒绝)

  2. 曾博
    理由
    举报 取消

    我记得有个东西叫做normality test?

  3. 用户头像
    理由
    举报 取消

    这个。。。应该是服从泊松分布吧?什么出车祸红绿灯下个顾客买东西。。。

    或者楼主用非参数检验咯DW….

  4. 周周
    理由
    举报 取消

    不是服从泊松分布的呢?

  5. 上大飞猪钱小莲
    理由
    举报 取消

    样本量太少,中心极限定理应该不行。而且从问题背景来看,指数分布应该更合适。本身间隔时间是非负变量

  6. 匿名用户
    理由
    举报 取消

    10次可以。5次一下不行。

  7. Neicul
    理由
    举报 取消

    不能假设服从正态分布。

    首先,3~10个数据这个样本量,中心极限定理很难起作用。

    其次,即使样本量足够大,中心极限定理对特定 Heavy Tail 分布不起作用。

    多假设几个模型,对每个模型作参数估计,再找出后验概率最大的模型吧。

我来回答

Captcha 点击图片更换验证码