用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
公司将来会使用图数据库,老板让了解一下GraphSQL.
简单聊一下这个问题吧。
首先,说到graph计算平台大家都知道neo4j(实验室级别产品),spark graphx,titan。比较知名,也是性能上有代表性的。
1.graphsql是闭源,上面三家都是免费产品。neo4j也有企业版收费的,titan在停止2年维护后现在被收购做闭源商业产品。
2.数据量:达到上亿节点数据,neo4基本见顶了。图数据大小到T级别基本无法快速返回结果。完整benchmark还是要花大量时间,只能大概评估。
一般公司图计算应用节点数十亿到百亿级别,graphx,titan,graphsql都可以支持。
达到千亿以上只有graphsql,国内几家大公司自己也做过测试,最终选择我们。
2.性能:不同场景对方测试效果都不一样。比如k-subgraph,shortest path。也看了几个竞争对手的报告,综合下吧。
graphsql是graphx几倍到十几倍。相对来说titan比grapx快,graphsql比titan大概会快小几倍。
为啥会快,看架构设计。
3.架构
只说简单,整个图平台大体功能分三部分:
存储,计算,分析。
完整一体由一个平台统一提供的就是graphsql。
存储graphsql使用自己的存储平台GSE,以图结构直接存储。相比较,graphx和titan还是用三方比如hbase,这就意味数据存储要进行转换过程。
我们之前尝试基于odps(阿里的hadoop)带有graph计算引擎有点类似graphx。相同数据量需要500台服务器,在阿里这种情况常见。切换到graphsql大概20台。除了储存结构一个是二维一个图结构之外,graphsql支持字段压缩的。
计算三家都是自己的。titan在计算上是单点,grapgsql支持分布式的,也有多次商用项目。而且未来版本还在优化升级。
分析,graphsql存储计算分析都基于同一平台,所有数据或者主要数据常驻内存。最大限度保证分析性能优势。基于hbase的计算平台结构上达不到实时计算的要求。
希望有点帮助。
这个图数据库,主要的优点是查询的数据快;有自己一套查询语言,学习成本不高,可以自己结合业务场景实现相应的功能。
缺点:纯商业系统,贵;对机器内存要求高(数据都在内存中,也是查询快的原因);gsql语言文档不完善,很多时候需要对方支持;
总之,如果在乎性能,有钱,那可以让对方提供一套完整服务,自己只需要关注业务就可以了;如果,想自己实现(安装,调试,设计图,实现特定场景等)就需要花费一定力气了。
请问GraphSQL了解的怎么样了?能不能说说怎么样?
昵称*
E-Mail*
回复内容*
回复 ( 3 )
简单聊一下这个问题吧。
首先,说到graph计算平台大家都知道neo4j(实验室级别产品),spark graphx,titan。比较知名,也是性能上有代表性的。
1.graphsql是闭源,上面三家都是免费产品。neo4j也有企业版收费的,titan在停止2年维护后现在被收购做闭源商业产品。
2.数据量:达到上亿节点数据,neo4基本见顶了。图数据大小到T级别基本无法快速返回结果。完整benchmark还是要花大量时间,只能大概评估。
一般公司图计算应用节点数十亿到百亿级别,graphx,titan,graphsql都可以支持。
达到千亿以上只有graphsql,国内几家大公司自己也做过测试,最终选择我们。
2.性能:不同场景对方测试效果都不一样。比如k-subgraph,shortest path。也看了几个竞争对手的报告,综合下吧。
graphsql是graphx几倍到十几倍。相对来说titan比grapx快,graphsql比titan大概会快小几倍。
为啥会快,看架构设计。
3.架构
只说简单,整个图平台大体功能分三部分:
存储,计算,分析。
完整一体由一个平台统一提供的就是graphsql。
存储graphsql使用自己的存储平台GSE,以图结构直接存储。相比较,graphx和titan还是用三方比如hbase,这就意味数据存储要进行转换过程。
我们之前尝试基于odps(阿里的hadoop)带有graph计算引擎有点类似graphx。相同数据量需要500台服务器,在阿里这种情况常见。切换到graphsql大概20台。除了储存结构一个是二维一个图结构之外,graphsql支持字段压缩的。
计算三家都是自己的。titan在计算上是单点,grapgsql支持分布式的,也有多次商用项目。而且未来版本还在优化升级。
分析,graphsql存储计算分析都基于同一平台,所有数据或者主要数据常驻内存。最大限度保证分析性能优势。基于hbase的计算平台结构上达不到实时计算的要求。
希望有点帮助。
这个图数据库,主要的优点是查询的数据快;有自己一套查询语言,学习成本不高,可以自己结合业务场景实现相应的功能。
缺点:纯商业系统,贵;对机器内存要求高(数据都在内存中,也是查询快的原因);gsql语言文档不完善,很多时候需要对方支持;
总之,如果在乎性能,有钱,那可以让对方提供一套完整服务,自己只需要关注业务就可以了;如果,想自己实现(安装,调试,设计图,实现特定场景等)就需要花费一定力气了。
请问GraphSQL了解的怎么样了?能不能说说怎么样?