如何评价HPCC平台和ECL语言? 举报 理由 举报 取消 我搜索了一下,发现这两个东西虽然年头并不算太短,但是好像很生僻啊。是不是基本上没有人知道没用人用啊? 2017年7月9日 2 条回复 1042 次浏览 数据,计算,计算机科学
回复 ( 2 )
说HPCC的话不得不先提LexisNexis公司了,LexisNexis 也算一个世界性企业了,业务包括法律和保险等服务,其中LexisNexis 最有代表性的产品就是全美法律数据和个人数据服务。从一九七几年开始尝试做美国的法律数据库服务,也能算最早的几个面临大数据问题的公司之一(据称在google未发表mapreduce的时候,LexisNexis已经开始按这个理念设计解决方案了,当然这里并不是说google未发表论文之前就没有任何maprecude的实现或研究)。
HPCC平台就是LexisNexis自已开发的一套自用处理大数据的解决方案,个人感觉这个解决方案很大的程度上是面向LexisNexis的需求的 : 更注重于查询速度,HPCC是需要时间来写入数据的,这个写入的过程包括数据转换,索引等等。所以你没办法拿HPCC跟Spark,Storm之类注重于实时计算的解决方案比较。HPCC更多的是拿来跟传统数据库比如oracle,或者hadoop比较。就从设计角度来说HPCC是已经索引好的内存驻存数据,查询速度优势是明显的。
再说ECL。HPCC是用C++写的, LexisNexis自己编写了一个C++编译器,用来将ECL编译成为C++。ECL的IDE里面是提供ECL转换成C++的代码的。这个ECL就是面向数据操作的语言,这个语言就已经跟ruby python之类的差不多很方便使用了。因为容错率高,个人觉得这个编译器是HPCC最牛X的产物之一。
HPCC自开源以来还是有不少企业使用。就使用感觉来说还是方便,所有查询可以通过网页解决这个也算亮点之一。
以上个人主观凌驾客观之上,仅供参考讨论。
HPCC是LexicNexis公司开发的计算分析平台