现在一提起大数据,基本就等同于 Hadoop / Spark / Storm 等一系列 JVM 体系下的开源架构;而如果说要用 C/C++ 的话,基本就是还在造轮子的阶段,差距十分悬殊。是不是有一天也会像 Nginx 的诞生一样,在 Apache 如日中天的时候,有一个神秘的 C 高手团队造就了 Nginx 现在的地位。个人的臆想是,在 Linux 文件系统上再用 C 做一个文件管理层(据我了解阿里云和百度已经是这样干的),分布式通信可以借鉴 Thrift 这样的 RPC 框架,shell 层可以考虑使用 C++ / Python等相对敏捷的语言来实现,还有 MySQL、Redis 这样的亲戚可以一并拉入来实现部分文件索引工作。计算 […]
查看全文机器学习特征选取的boruta算法思路?
是比较某个特征shuffle与否,对结果是否影响较大来确定特征的重要性,但是boruta的具体步骤不明白Z score究竟是怎么算的,求教
查看全文数据什么时候需要做中心化和标准化处理?
对中心化和标准化的目的和结果不是很了解,请问如果拿到一组数据,需要对所有变量做中心话和标准化的处理吗?如果不是,什么时候需要,什么时候不需要,为什么?
查看全文很珍惜的东西借出去了却无法归还,该怎么办?
题主是一名刚刚高中毕业的学生,有大一的同学们来办自习室,找到了我过去帮忙四个早晨,一百块,我同时贡献出了我整理了两年的八本笔记本【手写,其中有五本是全部写满的】以及大约五六本的空白教辅。借出去的时候我向他们明确表示了笔记本对我的重要性(整理了两年之前曾拒绝了另一个同学要借的请求)并且表示,自习室结束的时候要归还。现在自习室结束了,因为有些学生比较自私?(可以这么说吗?)拿走了我的笔记本和教辅材料,还有我同学出钱买的5·3,我的八本笔记只剩下两本,空白教辅只剩下三本,自习室提供的5·3只剩下两本。找我帮忙的那个女同学态度还说得过去,两天前向我表示了歉意,今天自习室的BOSS(他才比较有话语权)因为要归还我的剩余笔记才联系了我,态度不是 […]
查看全文在线课程这么多还有必要出国读个Data Science相关的master吗?
目前coursera等在线教育平台上面有很多大数据相关的课程,还有必要花钱出国读个大数据相关的master吗?各位发表下意见吧
查看全文硕士研究方向为云存储或者机器学习,哪个更容易就业?
实验室既搞云存储 也搞机器学习(侧重于机器学习在多媒体的应用),哪个更好就业呢?感觉搞机器学习的人多,但是岗位也多,云存储搞的人少,会不会相对应的岗位也少呢?谢谢大家
查看全文在当前大数据背景下,基于数据的归纳学习能否使得中医重新获得生命力?
感谢各位的关注和回复,怪我说的不清楚。我是在看到KBANN算法后才想到的因为这个基于知识的神经网络可以以先验知识作为第一层,通过数据集修正来学习出模型,并且可以通过修正先验知识的权重来修正知识的不足,那么这样是不是可以修正中医中一些不能或没有被现代实验证实的理论呢?还是我对KBANN的理解有偏差,烦劳诸位解答了————————————————–以下为原问题描述————— […]
查看全文