回归模型如何处理结果是负数的情况?

理由
举报 取消

因为之前一直是做分类比较多,第一次使用模型做回归,统计学知识不足,还望大家指教。我的模型是用来预测用户价格偏好的,但是在预测测试集的时候会发现有不少用户价格偏好会是负数,验证集平均R^2是0.45。请问:1. 如何解决负数的情况?能否强制规定都是正数?2. 是否是回归方程有着更佳苛刻的前提条件?如果是,请问是哪些条件并且如何保证模型满足这些条件?

2017年7月3日 10 条回复 5602 次浏览

发起人:卡牌大师 初入职场

不如我们,从头来过?

回复 ( 10 )

  1. 包不同
    理由
    举报 取消

    可以用NNLS(非负最小二乘)回归来强制系数非负啊

  2. 肖凯
    理由
    举报 取消

    价格偏好是啥?y是啥?x有啥?

  3. 曾若辰
    理由
    举报 取消

    需要把response variable限制成正数。一般来说,通过去对数函数log(),然后针对log(y)建模就可以了。不过这样的话,对系数的解读就发生了细微变化,具体可以参考Wooldridge的introductory econometrics.

  4. Ryan Fan
    理由
    举报 取消

    1、平均R^2是0.45,表示模型的解释度不够。(可能需要做更好的特征提取)

    2、预测值为负,是否可以理解为用户对“价格”不敏感。(可能需要根据业务经验来判断)

    抛砖引玉,坐等各路大牛!

  5. 氧气
    理由
    举报 取消

    用logistic regression或者probit regression对 Yvariable 变形

    姑且认为你做的是一个classification 结果作为概率

    R square 0.45还是可以接受的吧…… 不过还是得看情景

    可以试下看test error?

  6. 捷骏
    理由
    举报 取消

    R square 0.45 其实还好了,怎么那么多人不可接受,大家的模型都那么仙?

    你给的检验值太少,DW、P值都没给。粗浅判断,系数要是不符合学理,要么是少变量了(残差未被解释),要么多重共线(用主成分回归吧)。

  7. 张戎
    理由
    举报 取消

    天天使用lr,然后天天和负数权重在做斗争,做好特征工程。

  8. 老撕姬老斯基
    理由
    举报 取消

    感谢我计量经济学的老师传授我知识让我装逼!(๑•ั็ω•็ั๑)

    首先,R2这种东西不是唯一判断模型好坏的指标,回归模型不能唯R2是图(好生硬的词语,话粗理不粗)。一般来说微观计量的东西R2到0.5就非常好了。况且R2这个东西可以不停地通过塞各种自变量来提高,而很可能在这个过程中加入一些根本和因变量没有因果的自变量,这也是为什么会有adjusted R2这种东西,所以不必很迷信R2。

    另外建议题主把因变量再具体一点说明白。如果是价格偏好的话,因变量是连续的还是离散的?如果是连续的,取值范围如何?如果是离散的,是binary还是ordered还是multinominal?这对应不同的模型设定。

  9. 李光头
    理由
    举报 取消

    首先R方0.45在实际数据已经很好了,再有 你的回归模型是什么 y是连续性还是分类器 偏好的话我估计是二分类或ordinal data model 找点这方面的看看吧,R语言的话有直接的函数

  10. 张雁飞
    理由
    举报 取消

    最基础的用linear probability model,如果感觉linear的情况不是很实用,再稍微进阶一点用非线性的logistic或者probit model都行。

    看楼主需要研究的问题是价格对偏好度的影响,上述模型仅仅适用于因变量取值范围在0-1之间的情况,如果不是的话,那可能还需要再多加一些系数来反应真实情况(也可以用分级的方式来部分解决,不过会牺牲一些精确度)。

    不过R^2等于0.45这个条件可能还不够充分说明这个模型可行,题主最好再用linear regression的几个assumption对应的test检查一下有没有问题,比如说最经常出现的multi-collinearity之类。

    楼主可以的话最好把几个变量都给说一说,这样更容易让我们判断。

我来回答

Captcha 点击图片更换验证码