现在一提起大数据,基本就等同于 Hadoop / Spark / Storm 等一系列 JVM 体系下的开源架构;而如果说要用 C/C++ 的话,基本就是还在造轮子的阶段,差距十分悬殊。是不是有一天也会像 Nginx 的诞生一样,在 Apache 如日中天的时候,有一个神秘的 C 高手团队造就了 Nginx 现在的地位。个人的臆想是,在 Linux 文件系统上再用 C 做一个文件管理层(据我了解阿里云和百度已经是这样干的),分布式通信可以借鉴 Thrift 这样的 RPC 框架,shell 层可以考虑使用 C++ / Python等相对敏捷的语言来实现,还有 MySQL、Redis 这样的亲戚可以一并拉入来实现部分文件索引工作。计算 […]
查看全文有哪些好的非线性相关分析算法?
想了解除了可视化之外有哪些量化的相关分析算法 >_<1. Pearson, Spearman等方法都是衡量变量线性相关的关系。有什么统计量可以用来分析变量之间的非线性相关关系呢?2. 如果一个结果A受多个原因B,C,D等的影响,那么1)直接做多元分析2)分别做偏相关性分析 各有什么利弊呢?感谢各位大大的指教(o^^o)
查看全文有什么适合跨考的专业?
本科应用化学,现在大二,混了一年才开始考虑以后的问题,才发现化学化工前景不是很好,自己也不是很有兴趣,想知道有哪些适合跨考的专业(就是没啥歧视的)!ps:前段时间错过了转专业的机会,觉得很麻烦就没转了,现在也是后悔莫及。对了,有什么数学统计方面前景好的专业吗?稍微有点兴趣。希望能从大二就开始准备,谢谢。
查看全文工业生产值指数和工业生产者购入价格指数是一回事么?
工业生产值指数IPI 找了很久也没找到这个数据。不知道这个数据是不是工业生产者购入价格指数呀
查看全文华为杭州研究院怎么样?
比如跟华为上海研究院相比,两个各有何偏重?上研所的云计算和杭研所的大数据开发哪个更好一些?上研所貌似没有大数据开发这个岗位啊。。
查看全文创业失败,想去农村教书有什么地方可以推荐?
无妻天子,无其他负担,只想为社会做点贡献。不想浪费了自己的学识。不想让喜欢我的人跟着我受苦。选择离开一线城市。本人有三个专业,软件工程,法语,经济学。从事统计大数据创业失败,积蓄花光了。对自己失望无钱再起来了。
查看全文Erasure Code编码大文件的问题?
分布式存储系统使用Erasure Code来容错的时候,对于大文件比如10GB,无法在单个节点上进行EC编码,那么怎么对10GB文件编码?分布式的方式?
查看全文