帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何使用python和R高效而优雅地处理大数据?

题主是Python和R的初学者,最近打算帮教授做项目,但是教授说他处理的数据量非常大,R和python都不行。我看知乎上都说R处理大数据不行,他用的SAS。那么有没有高效的方法用python(或者与R结合)能够达到SAS处理大数据的能力呢?还是题主只能从头撸起SAS了?(求好心人分享SAS啊T△T)

查看全文

在R语言中怎么在工作目录下同时对多个文件进行处理?

首先,我有一个文件夹,叫specdata,specdata里面有许多文件,如图,现在我想对这些文件里的一些数据进行同时处理,于是我编了这样一个程序:pollutantmean <- function(directory,pollutant,id=1:332){ x <- dir(directory) z <- c(NA) for(i in id){ y <- read.csv(x[i]) z <- y$”pollutant”+z } mean(z,na.rm=TRUE)} pollutantmean(“specdata”,”solfate […]

查看全文

临床化验数据统计分析软件的选择和使用?

我想请问在统计、数据挖掘、统计分析软件SPSS等领域内有什么软件可以专门统计分析临床化验的数据,类似于SPSS但是又能作图(折线图,相关性图等等)、分析相关性,可能大部分人会推荐SWAT和R语言之类,但是我想问一下:1、有没有更有针对医学研究和临床分析的软件呢?2、如果我没有任何SPSS和R语言的基础,又想快速掌握相关化验数据分析的技能,我应该至少看SPSS或者R的教程的哪几章呢?3、我的这个未导入SWAT的xlsx表格在表格设计上有没有什么大的问题?就这样导入SPSS会不会造成后期数据分析的困难?是不是需要将原本在一列上的具体化验项目变成一行作为变量(同时原本存在于一行的时间变成一列)?

查看全文