如题目所述问题二:这种暴雨年的数据在统计学里叫什么?
查看全文如何理解马氏距离,多维Mahalanobis距离是否要用到“互相关张量”来进行描述?
如题,现在我知道数据分析界的马氏距离是考虑到两个变量之间的相关性然后求出它的距离的,在我们的数据挖掘导论课上提到马氏距离实际上是这样的:两个互相关变量包含两个维度,它俩之间的“距离”定义为,其中两维度构成的平面上“回归椭圆(不知道这样说对不对)”的距离,请问互相关矩阵和椭圆之间是怎么建立起联系的,也就是不清楚互相关性是怎么拥有“到椭圆的距离”这一几何解释的?还有就是一般讨论的马氏距离是指的两个变量之间的“相关距离”,如果涉及到两个多维变量之间的“距离”计算,则是不是还要发展某种“互相关张量”来进行描述?比如使用王赟回答中提到的那个例子,两个人这是两个变量,两人各自的身高、体重,是两个维度,但如果我们再加一个维度,比如说腰围,这样两个 […]
查看全文如何看待王汉生教授的这篇《统计学发展方向的选择》?
全文:王汉生: 统计学发展方向的选择文章基本否定了统计学处理大数据的能力,表示统计学在专业学计算机的面前毫无竞争力。预测了未来统计的发展,应该是将统计与其他专业的知识相结合,成为某一领域的工具。节选几段: 第一,毋庸置疑,在大数据时代,统计学工作者需要多学点计算机技术,好解决大数据分析中的生活自理问题。但是,我认为这不应该成为一个统计学发展的重要方向。为什么?基于两个判断。【1】这条路似乎没啥希望。因为,在这条路上,同计算机专家相比,统计学工作者,没有半点优势。我们输在起跑线上,还不是一点半点。【2】随着计算机技术的进步,现在认为很复杂的(例如)分布式存储和计算,将被一些成熟的软件产品极大地简化,甚至傻瓜化。如果是这样,相关的计算机 […]
查看全文回归模型如何处理结果是负数的情况?
因为之前一直是做分类比较多,第一次使用模型做回归,统计学知识不足,还望大家指教。我的模型是用来预测用户价格偏好的,但是在预测测试集的时候会发现有不少用户价格偏好会是负数,验证集平均R^2是0.45。请问:1. 如何解决负数的情况?能否强制规定都是正数?2. 是否是回归方程有着更佳苛刻的前提条件?如果是,请问是哪些条件并且如何保证模型满足这些条件?
查看全文有没有给博彩公司的赔率开赔率的公司?
博彩公司都开赔率,总会发现有不少人表示不服,其中有的是根本不相信,说那欧冠世界杯就别踢了,直接颁奖得了。还有的根据阵容,状态,战术分析,证明博彩公司的赔率不准确(是反的)。那有没有给各大博彩公司为某场比赛开赔率的博彩呢,既赔率的赔率。虽然这是一个递归问题,但是在第一层就return呢
查看全文应届生想应聘bat的数据分析或者数据挖掘岗,该如何准备?
题主是一名普通211学校的统计学研二学生,本科专业是渣二本的信息与计算科学。 什么样的条件才是bat这类公司(最好是在成都)所需要的呢?我数据分析和数据挖掘的都会一点,但不深Excel,spss,R,matlab,SQL,Python等这些工具都只能基本能用,没几个学的好的,不百度谷歌的话,只能写点小程序(我说的小程序是指一百行以内的代码 )理论方面还稍微好点,统计的和统计学习的基础知识都还有点,就像机器学习的模型推导在我看来比实用编程亲切多了。 现在在一家大数据公司实习,当然只是名义上的,根本接触不到项目只是在SQL查查数据,或者做做因子分析,k-means聚类,决策树什么的。Hadoop和spark就别想了,当然我也不会。 那么 […]
查看全文在中介分析中应如何对遮掩效应进行解释?
温忠麟 & 叶宝娟 (2014)在《中介效应分析:方法和模型发展》中提到遮掩效应(suppressing effects)(Kenny, 2003; MacKinnon, 2008; MacKinnon et al., 2000, 2002; Shrout & Bolger, 2002),认为在中介效应中如果ab和c’符号相反则按遮掩效应解释,但对具体如何解释遮掩效应没有更多的说明。而我追溯到原文,发现对遮掩效应也只有简单的介绍,并没有详细的解释。所以我的问题是,如果在中介分析中出现遮掩效应时,应当如何对这一结果进行合理解释?
查看全文Logistic回归的检验方法有哪些?R中有比较完备的处理logit回归的包吗?
小白初入统计大门,问题有点多,求大神指教~——————— Logistic回归除了检验各系数的显著性(p 值),似然比检验外,还有哪些检验模型拟合优度的方法? 如果使用logit建立评级体系(分类)除了ROC曲线及c统计量(AUC)外,还有哪些指标和方法评价模型的质量? 最后R中是否有完备的包处理Logit回归呢?
查看全文