比如我想知道这个贴吧每天的关注数发帖数的变化,以及发帖高低峰是什么时间段?每天的访客数和点击数以及高低峰时间段?访问页面平均时长?当天什么话题内容提及最多讨论最多?我的目的是想做一个学校贴吧的数据分析报告,要用的就是上述数据,那么我应该使用什么工具呢?如果要学习的话我该从哪方面下手?请多指教,谢谢!
查看全文用python读取excel,怎样显示要查找的数据?
如图,for i in sh.col_values(4): if i==5: print (‘这一行的所有数据’) #就是怎么实现这一步。。还是说不应该使用for。或者有什么其他能实现的函数?
查看全文大数据领域都有什么发展方向?
我去咨询了一个大数据培训机构 告诉我大数据工作分为两个方向 一个是大数据开发 一个是大数据运维 大数据开发比大数据运维少很多岗位还有的说法是 分为数据挖掘和大数据平台运维开发这两个方向 而且还跟我说我只能选大数据平台运维 谁能详细解释一下大数据开发、大数据运维、数据挖掘、大数据平台运维开发都是什么啊?为什么做不了数据挖掘呢?
查看全文如何将hdfs里某一目录下的所有文件的文件名读取出来?
已知在hdfs某目录下(如hdfs://tmp/englishnovels)有上百部英文小说(txt后缀),想把小说的名字都读取出来,实现遍历。请赐教!
查看全文其他语言有没有像Rmarkdown那么方便的东西?
觉得rmarkdown把代码运行结果附在下面的功能真的是很方便(还是我其实不会用md和tex,其实它们也有这种功能?)
查看全文Excel 如何抓取指定数据? 感谢各位大神!!!! 谢谢知友!!!!
谢谢3位朋友的回答,不过应该是我没表述清楚,我想问的是,如何做到将上图中收入这一条的数据中只有卖花与收入金额,导入到图下的表中。支出这一条中的只有水果测试和付出金额导入到图下的表。谢谢大家,谢谢各位知友,谢谢阿弥陀佛~
查看全文python(x,y)在linux系统怎么安装?
做词向量分析,在本地Windows系统已经实现了,但是本地内存4G,训练词向量时经常出现MemoryError。想在虚拟机上安装python(x,y),然后安装gensim,做词向量分析,但虚拟机是linux系统。所以想请教下,如何在linux系统上安装python(x,y),是不是有专门的linux版本,有的话,提供给我。谢谢啦。
查看全文