回归模型如何处理结果是负数的情况? 举报 理由 举报 取消 因为之前一直是做分类比较多,第一次使用模型做回归,统计学知识不足,还望大家指教。我的模型是用来预测用户价格偏好的,但是在预测测试集的时候会发现有不少用户价格偏好会是负数,验证集平均R^2是0.45。请问:1. 如何解决负数的情况?能否强制规定都是正数?2. 是否是回归方程有着更佳苛刻的前提条件?如果是,请问是哪些条件并且如何保证模型满足这些条件? 2017年7月3日 10 条回复 5687 次浏览 分析,学习,数学,数据,数据挖掘,机器,统计学
回复 ( 10 )
可以用NNLS(非负最小二乘)回归来强制系数非负啊
价格偏好是啥?y是啥?x有啥?
需要把response variable限制成正数。一般来说,通过去对数函数log(),然后针对log(y)建模就可以了。不过这样的话,对系数的解读就发生了细微变化,具体可以参考Wooldridge的introductory econometrics.
1、平均R^2是0.45,表示模型的解释度不够。(可能需要做更好的特征提取)
2、预测值为负,是否可以理解为用户对“价格”不敏感。(可能需要根据业务经验来判断)
—
抛砖引玉,坐等各路大牛!
用logistic regression或者probit regression对 Yvariable 变形
姑且认为你做的是一个classification 结果作为概率
R square 0.45还是可以接受的吧…… 不过还是得看情景
可以试下看test error?
R square 0.45 其实还好了,怎么那么多人不可接受,大家的模型都那么仙?
你给的检验值太少,DW、P值都没给。粗浅判断,系数要是不符合学理,要么是少变量了(残差未被解释),要么多重共线(用主成分回归吧)。
天天使用lr,然后天天和负数权重在做斗争,做好特征工程。
感谢我计量经济学的老师传授我知识让我装逼!(๑•ั็ω•็ั๑)
首先,R2这种东西不是唯一判断模型好坏的指标,回归模型不能唯R2是图(好生硬的词语,话粗理不粗)。一般来说微观计量的东西R2到0.5就非常好了。况且R2这个东西可以不停地通过塞各种自变量来提高,而很可能在这个过程中加入一些根本和因变量没有因果的自变量,这也是为什么会有adjusted R2这种东西,所以不必很迷信R2。
另外建议题主把因变量再具体一点说明白。如果是价格偏好的话,因变量是连续的还是离散的?如果是连续的,取值范围如何?如果是离散的,是binary还是ordered还是multinominal?这对应不同的模型设定。
首先R方0.45在实际数据已经很好了,再有 你的回归模型是什么 y是连续性还是分类器 偏好的话我估计是二分类或ordinal data model 找点这方面的看看吧,R语言的话有直接的函数
最基础的用linear probability model,如果感觉linear的情况不是很实用,再稍微进阶一点用非线性的logistic或者probit model都行。
看楼主需要研究的问题是价格对偏好度的影响,上述模型仅仅适用于因变量取值范围在0-1之间的情况,如果不是的话,那可能还需要再多加一些系数来反应真实情况(也可以用分级的方式来部分解决,不过会牺牲一些精确度)。
不过R^2等于0.45这个条件可能还不够充分说明这个模型可行,题主最好再用linear regression的几个assumption对应的test检查一下有没有问题,比如说最经常出现的multi-collinearity之类。
楼主可以的话最好把几个变量都给说一说,这样更容易让我们判断。