分享
因某组数据存在缺失项,如何用其他几组数据来替代?
C1至C4是反映某现象的4个指标,每个指标有各自的权重,最终的指数C = Ci * 该指标权重。现在由于C2、C3指标在2013年、2014年数据缺失,因此在计算2013年、2014年的指数C时,准备将C2、C3的权重赋予C1、C4,以此得到妥协的、调整后的2013年、2014年的指数C。至少这样还能勉强得到指数C从2008年—2014年的变化情况。现在的问题是:如何用C1、C4的组合分别表示C2、C3,即如何构造两个回归函数?是回归函数么?。。。这块真的不是很懂,请大家帮忙一看~!函数一:C2 = f(C1,C4)函数二:C3 = f(C1,C4)具体数据和在Excel中绘制的散点图如下,准备用SPSS构造回归函数。P.S. C1—C4这4个指标有一定的相关性,都是反应交通拥堵状况的细化指标。 C1:路网工作日平均日交通指数 C2:早高峰常发拥堵路段长度 C3:晚高峰常发拥堵路段长度 C4:全日拥堵持续时间
回复 ( 2 )
谢邀。
暂时不了解题主做C指数的目的,所以暂时不能了解对预测精度的要求,我分成学术倾向(需要完整的模型与统计解释)和工作倾向(要一个数字,且该数字来源解释简单明了)两个方向分别来说。
从学术倾向来说,建议直接使用历史均值代替,不建议用回归,理由与之前的答主一致,数据期数太少,回归效果会比较差。
从工作倾向来说,用历史均值一定会被领导骂不懂业务……为啥?请看图:
C2和C3在11-12年间有个大拐点,明显出现了下降趋势,这一定是业务上有变化,要么是搞了个大活动,要么是统计方式变了……而且C1,C2,C3,C4的趋势也是一样的,11年上到最高点,12年开始下降,13和14年保持平缓,那么我们也可以按此趋势来预测C2和C3,具体下降值是多少呢?可以用C1和C4变化幅度在11-12年的均值,领导要是觉得下降太少不满意就换C4的降幅值……
以上,希望能有帮助。
可以用C1\C4作为自变量分别预测C2\C3,前提是从指标理解上,C2\C3是与C1\C4相关的。
鉴于数据期数较少,在做综合评价的时候也可以直接用C2\C3的历史均值来替代缺失值。