有哪些好的非线性相关分析算法? 举报 理由 举报 取消 想了解除了可视化之外有哪些量化的相关分析算法 >_<1. Pearson, Spearman等方法都是衡量变量线性相关的关系。有什么统计量可以用来分析变量之间的非线性相关关系呢?2. 如果一个结果A受多个原因B,C,D等的影响,那么1)直接做多元分析2)分别做偏相关性分析 各有什么利弊呢?感谢各位大大的指教(o^^o) 2017年8月23日 1 条回复 832 次浏览 分析,数据,相关性
回复 ( 1 )
做过一段主客观一致问题的科研,回答一下。
Spearman秩序相关系数(SROCC)本身就不是衡量线性相关的,而是衡量秩序的相关性的。设有两组序列X和Y,其秩序为R(X)和R(Y),这里R(Xi)=k代表Xi是序列X中的第k大(或第k小),则SROCC(X, Y) = PLCC(R(X), R(Y)),其中PLCC是Pearson线性相关系数。
SROCC被认为是最好的非线性相关指标,这是因为,SROCC只与序列中元素的排序有关。因此即使X或Y被任何单调非线性变换作用(如对数变换、指数变换),都不会对SROCC造成任何影响,因为不会影响元素的排序。
维基百科有一张很直观的图片,很好地体现了SROCC与PLCC的区别。
KROCC = (同序对数-逆序对数) / 总对数
(总对数=n(n – 1)/2)它的性质与SROCC类似,但是比较抖。
对于连续输出的机器学习模型或简单的回归拟合,发Paper的话,一般要放SROCC和PLCC,这两个标准是最重要的,可以很好地衡量模型的非线性相关性和线性相关性。偶尔也会放KROCC和RMSE(方均根误差)。但是SROCC是比PLCC更为根本的指标,因为一个复杂模型总可以用一些附加的非线性变换(对数或者指数,还有某些领域内recommanded复杂的组合= =)来补正,使得PLCC更高一些,而SROCC却不能被这些附加非线性变换来影响。