用scikit 举报 理由 举报 取消 请问各位大牛,用scikit-learn构建逻辑回归时(Logistic Regression),怎么查看模型系数的显著性?考虑到如果系数不显著,即使解释度(score)很高,precision和recall表现良好,也是有潜在问题的! 2017年8月8日 5 条回复 1290 次浏览 Logistic,Python,回归,学习,数据挖掘,机器,统计
回复 ( 5 )
恭喜你意识到了sklearn的本质。答案是无法查看,因为sklearn是一个机器学习库而非统计库。
对于做机器学习的人来说,显著性根本不重要,只要在test score高就行了。真要去掉不怎么相关的feature的话,就加L1 regularization
有啥潜在问题啊
看看训练误差就行了,训练误差还跟选定的参数有关。用cross validation 还可以帮你找到最好的参数。减小参数C,增强正则化,降低overfitting的风险。或者使用集成模型,具有一般性。
用statsmodels吧。统计的用统计的。机器学习用机器学习的。
并不是所有学科建模时都会看显著性,就算是统计系的人也不是每个人都会看显著性。其实你不用看,只要test set的结果好就可以了