如何用stata,使数据按给定比例增减?

理由
举报 取消

在做一篇论文,希望把个人收入和其他一些变量合在一起研究。已经出了结果,但被argue说个人收入的数据可能不准确,需要调整。被要求按照国家给定的各个收入区间所占的比例,对原始数据进行更改。于是请教知乎大神,这个怎么实现?大概要做的是:1.对数据中的收入变量进行分组,按0-2000,2000-4000……分组,并计算各个阶层所占总人数的比例2.导入一个新的各个收入阶层比例,使原数据通过随机抽样的方式,对原数据进行增减,使其各个阶层收入比例符合给定比例谢谢!

2017年10月13日 1 条回复 1632 次浏览

发起人:胡铭 初入职场

回复 ( 1 )

  1. 夏落
    理由
    举报 取消

    1、分组 这个用if就可以实现,略。

    2、假定已经分成标为1、2、3、4的几类后,bysort g:gen n=_n 每个类别的样本数 再除以总样本数。

    3、根据其中比例增加最多的一个计算出其他样本所需的抽样数。

    4、运用gen x=uniform() 这个函数是求0-1内的随机数,均匀分布。乘以样本数再random一些数即可抽取相应的样本,再keep这些样本即可。

我来回答

Captcha 点击图片更换验证码