帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

样本量少, 方差大,能假设其服从正态分布吗?

实际背景:预测一个用户的购买时间可用数据:历史购买时间准备解法:算出历史购买时间间隔,假设其符合正态分布。计算最近一次购买时间距今天的间隔时间。最后计算置信区间blablabla. P.s 整体的用户购买间隔不符合正态分布,所以单独计算每一个用户。那么问题来了:用户的购买次数不多,也就3 ~ 10次(即样本量只有2~9且方差大)。所以可以用上面解法么?

查看全文

支付宝集福平分2.15亿现金如何确保被平分?

如果严格按照总金额是2.15亿整来算,由于活动参与人数不确定,不可避免无法整除的情况,从而导致无法平均分配。 如果一定要平均分配,奖池现金总额还会在2.15亿附近吗? 之前活动宣传是说平分超2亿现金,现在改为2.15亿,是否没有之前来得严谨? …………………………更新…………………………… 最终的结果:791405位用户,每人271.66元,总金额是214993082元。还是比较靠近2.15亿的总额的。 如果是每人217.67元,总额会是215000996整体金额更加靠近2.15亿元,而且这也是四舍五入的结果,但末尾数不及271.66好看。……………………………………………………… 另外,这个问题本意并不是让大家预测或者是评价本次集 […]

查看全文

有哪些比较好的做异常值检测的方法?

数据预处理的好坏,很大程度上决定了模型分析结果的好坏。(Garbage In Garbage Out!)其中,异常值(outliers)检测是整个数据预处理过程中,十分重要的一环。方法也是多种多样。比如有基于经典统计的方法——三倍于标准差之上的数据为异常值等等。由于异常值检验,和去重、缺失值处理不同,它带有一定的主观性。所以,想请问一下各位大牛,平时你们更愿意相信哪种或哪几种异常值检测的方法。谢谢!~

查看全文