帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何用爬虫程序 爬取文本做语料库?

编程小白,只会用Matlab。要写一个基于语料库的毕业论文,我想把这样的网页里的新闻文本都爬取下来,做成语料库,应该要怎么做啊换一个网页,之前是资料库里的。要用学校的账号登陆..担心会出问题http://www.abc.net.au/news/archive/这个是ABC News的新闻档案

查看全文

如何用stata,使数据按给定比例增减?

在做一篇论文,希望把个人收入和其他一些变量合在一起研究。已经出了结果,但被argue说个人收入的数据可能不准确,需要调整。被要求按照国家给定的各个收入区间所占的比例,对原始数据进行更改。于是请教知乎大神,这个怎么实现?大概要做的是:1.对数据中的收入变量进行分组,按0-2000,2000-4000……分组,并计算各个阶层所占总人数的比例2.导入一个新的各个收入阶层比例,使原数据通过随机抽样的方式,对原数据进行增减,使其各个阶层收入比例符合给定比例谢谢!

查看全文