想在Hadoop环境下,针对HDFS做一些存储安全的实验,但是毫无头绪,还请大神指点一二谢谢谢
查看全文一家公司如果有上百T数据之后,怎样管理这些数据?
数据上百T之后,我觉得应该会涉及到算法之类了,单纯堆磁盘甚至全固态肯定都不能满足需求。这时候通过什么方法来处理呢。才疏学浅,请多多指教。
查看全文做一个社区网站之后做APP,那么需要的服务器要求是怎么样?
多功能的社区,个人资料和发布的信息都很重要,那么对服务器的需求是什么样?大概硬件成本是多少?
查看全文华为存储软件开发工程师?
请问有人知道华为的存储软件开发主要是做啥的吗?平时接触的语言是什么?(主要是本人会java,不会C、C++)。这个岗位在总公司有吗,还是子公司的?
查看全文目前使用中的最大数据单位是什么?
8 bit = 1 Byte 一字节1024 B = 1 KB (KiloByte) 千字节1024 KB = 1 MB (MegaByte) 兆字节1024 MB = 1 GB (GigaByte) 吉字节1024 GB = 1 TB (TeraByte) 太字节1024 TB = 1 PB (PetaByte) 拍字节1024 PB = 1 EB (ExaByte) 艾字节1024 EB = 1 ZB (ZetaByte) 皆字节1024 ZB = 1 YB (YottaByte) 佑字节1024 YB = 1BB(Brontobyte)珀字节1024 BB = 1 NB (NonaByte) 诺字节1024 NB = 1 DB […]
查看全文高维大数据如何存储?
问题是这样的,假如我有1000万个样本,每个向量有1万维,那么如果这些向量存储在数据库中就是1000万*1万的矩阵,现在的关系型数据库都是按行存储,这意味着我如果按列取每一个特征的时候将会非常麻烦。比如推荐系统中有很多数据都是高维的,不好意思啊,我还没毕业,不太清楚目前大公司是用什么方法来存储这些数据的?
查看全文求一个大数据存储查询的方案?
目前数据有如下特征:1.数据量大,每日达到上亿条记录,至少需要保存两年以上的记录2.写入频繁,每日需要将上亿条记录写入数据库3.读的并发性不高,最多上千个访问同时在线,但有实时性要求,延时不能超过5秒该数据特征与百度统计、CNZZ统计比较相似。求推荐数据库方案比如传统的关系型数据库:MYSQL?还是NOSQL数据库:mongodb?还是:HBASE、HIVE?还是其他?多谢!
查看全文关于数据库的一些疑问,本人小白?
现在公司用的都是什么服务器,用linux多吗,每天数据的增长量为多少,数据是怎么收集的,每天能手机多少数据,数据高峰期是什么时候
查看全文如何评价kudu存储引擎?
据说Cloudera秘密开发了3年,兼顾数据更新实时性和分析速度的存储引擎,目前和impala配合的比较不错。国内目前小米在用这个东西。http://getkudu.io
查看全文