看到星环科技的简介,他们可以将开源版本的Hadoop的性能提升10到100倍!好厉害! 那么:1.为什么开源版本的Hadoop不做到最好,而是留有如此之大的性能提升余地? 2.什么方法什么手段可以提升Hadoop的性能? 3.提升性能用到的是书本上的知识吗?还是工程师自创的提升方法?又或者是顶尖论文里面的方法? 谢谢!
查看全文大规模图数据划分方法的资料/书籍怎么找?
发现百度这个只有笼统的,找不到详细介绍的,该搜什么或从哪些书籍可以看到关于这方面知识的?要是有异构图划分的就更好
查看全文为什么在中国搞不出 Spark 和 Hadoop 这种东西?
先问是不是,再问为什么,不要耍流氓!国内hadoop类似产品不止一个吧,估计还胜过现在的hadoop,现在hadoop可不是啥核心科技———————————-我是一名CS学生,我想听听对题目问题的看法。 我很好奇是哪些本质的东西决定了在美国搞出了这些东西,在中国就没有出现。我能想到的原因就是:我觉得国内的互联网环境更关心怎么赚钱怎么快速迭代产品,而对于技术创新投入不够。
查看全文Spark目前的瓶颈在哪里,还有希望解决么?
Spark当前很火哈,有木有行家来回答一下~~抛砖引玉,比如jvm方面的限制内存浪费任务调度方面拓展性等等。
查看全文如何评价kudu存储引擎?
据说Cloudera秘密开发了3年,兼顾数据更新实时性和分析速度的存储引擎,目前和impala配合的比较不错。国内目前小米在用这个东西。http://getkudu.io
查看全文