做实验经常会用到一些数据集,有没有什么网站会公开的自己的数据集,比如说flickr上的图像标签的数据如何获取?
查看全文大数据处理中数据倾斜,是民间流传出来的?,有没有权威的定义和解释?
经常听别人说在用hadoop、hive的时候会遇到数据倾斜问题,到底什么是数据倾斜,查了各百科都没有查到,好像只有在统计学里有分布的偏度(左偏、不偏,右偏)。难道这个词是民间传出来的?有没有一个确切的定义和解释呢?
查看全文现在最先进的大数据处理平台(软硬件),有哪些,求推荐?
导师让我找最先进的大数据处理的平台,还让我了解一下价格以及实用性如何,他是院长,应该是要购买。导师强调国内外最先进的
查看全文如何保存交易所行情数据科学?
主要是希望可以高效的保存和读取历史数据行情。是否有不错的方法呢?如果放在文件里,数据量是几百万条的规模。
查看全文