《最前线|图数据库厂商「创邻科技」通过LDBC-SNB官方测试认证吞吐量较原记录提升70%.docx》由会员分享,可在线阅读,更多相关《最前线|图数据库厂商「创邻科技」通过LDBC-SNB官方测试认证吞吐量较原记录提升70%.docx(3页珍藏版)》请在第一文库网上搜索。
1、Gartner发布的2021年十大数据和分析技术趋势报告中指出,数据和分析活动将转变为组织的一项核心业务功能,图技术在数据和分析创新中的占比将会在2025年达到80%。图数据库技术是使用图数据结构进行存储并实现语义杳询的非关系型数据管理系统,在金融、零售、软件、医疗、供应链、航空、电信等行业已有广泛应用。作为数据分析的一项基础技术,图数据库在近年来也在加快影响业务的决策速度。而随着腾讯、阿里、字节等互联网巨头的入局,国内的图数据库应用也逐渐成为蓝海市场。创邻科技是36氟曾报道过的一家企业。该公司自成立以来一直聚焦高性能性能图数据库技术,原生分布式并行图平台产品Galaxybase复杂关联杳询性
2、能较现存同类技术有百倍提升,核心代码100%自研、安全自主可控,目前已在金融、能源、互联网、公安等多个行业应用落地。据了解. 今年年初,创邻科技已联合中山大学团队,依托国家超级计算广州中心环境,完成了 Galaxybase的安装部署,并实现5万亿点边规模交易数据智能挖掘性能测试,打破了美国头部技术厂商与21年创造的图处理世界记录。近日,创邻科技宣布其全自主研发的高性能图数据库Galaxybase已通过国际关联数据基准委员会(LinkedData Benchmark Council, LDBC)的 LDBCSNB (Linked Data Benchmark Council-Social Net
3、workBenchmark)的测试认证,在系统稳定性、可用性、结果正确性、事务支持性和可恢复性上均达到官方标准,并较LDBC之前公布的最高记录吞吐量提升了 70%,查询性能最高提升72倍,平均查询性能提升超6倍。Declaration of Audit SuccessThis report contains an audited LDBC benchiiKirk run. The results have been gatlwred by an independcni andimparlial auditor who ha5 valid31cd (he iniplemcniation of t
4、he queries, successfully run the ACID tests associatedwith the claimed isolation level (seriaiizablch and veritied the overall systems configuration conformance tothe description of the benchmark and its strict requirements.Dr. Marton Bur(Auditor)S/19/2022DateDr. Gabor Szarnyas(Head of LDBC SNB Task
5、 Porte)5/20/2022Date5/19/2022Datecu Z/mDr. Yan Zhou(Test Sponsor Representative)(审计测试成功的声明页截图)此次的测试由LDBC-SNB指定的第三方评估师在其租用的标准云系统上执行完成,测试环境准备、测试数据生成和导入、测试例程序的安装和执行、结果正确性的验证方面均严格遵守LDBC-SNB规范。读者可以通过访问以下网址查看正式公布的测试结果,并下载测试报告、程序、说明文档以及软硬件信息:https:/ldbcouncil.org/benchmarks/snb/关于LDBC和SNB测试LDBC (Linked Dat
6、a Benchmark Council,国际关联数据基准委员会)是图数据库领域权威的基准指南制定者与测试标准发布机构,汇聚了包括Oracle, Intel等软硬件巨头和全球图数据库领域的专家学者,旨在制定一套公平、诚信、可对比的方法和机制来衡量图数据库管理系统,共同推进这项前沿技术的发展。SNB (Social Network Benchmark,社交网络基准测试)是由关联数据基准委员会(LDBC)开发的面向图数据库的基准测试(Benchmark)之一,分为交互式查询(Interactive)和商业智能(BD两个场景。SNB提供了一套模拟真实社交网络场景的测试,衡量图数据在交互式查询和商业智能
7、查询中的性能表现。与基于单项测试的评测方法相比,LDBC-SNB不仅更接近真实的业务查询场景,同时对图数据库系统的并发执行能力和事务处理能力提出了更高的要求。关于测试详情据创邻科技创始人&CEO张晨博士介绍,此次创邻科技采用LDBC-SNB提供的交互式(Interactive)查询任务,就结果正确性、事务、系统可恢复性、以及测试超时情况、吞吐量、响应时间等性能指标进行验证和测试。结果显示,Galaxybase通过正确性测试,所测结果与LDBC提供的第三方图数据库测试结果相同;LDBC审计表示,Galaxybase测试结果达到序列化级别,事务验证超过标准;同时,Galaxybase通过可恢复性验
8、证,在基准测试执行2小时的时候关机重启,LDBC日志中最后插入成功的测试项数据仍然完整保存在图数据库中。性能测试中,Galaxybase采用48个客户端并行请求的方式,超越了 LDBC要求的5%以内超时,实现了零超时。在超时数量符合条件并满足30分钟预热和2小时测试的前提下,Galaxybase在30 G (8千万点,5亿边)、100 G (3亿点,18亿边)、300 G (8亿点,53亿边)三个数据集的吞吐量均打破了 LDBC已经公布的最高记录(由TuGraph保持),性能提升了 70%,查询性能平均快超6倍。同时,在请求发送频率更高的情况下,Galaxybase的平均响应时间、50分位、9
9、0分位、95分位、99分位的响应时间亦均快于前记录保持者。其中,平均响应时间最快超过原纪录41倍,90分位响应时间最快超过原纪录72倍。不管是在同一测试项下不同数据量的杳询上,还是在不同测试项不同复杂度的查询上,Galayxbase均展现了更佳性能,且这种优势随着数据集规模的增加而增加,充分体现了 Galaxybase在大规模数据处理上的优秀支撑能力。下表为Galaxybase在不同数据级下的测试结果,吞吐率(OPS)表示每秒完成的操作次数:数据规模测试时间查询操作数吞吐量查询及时率SF-302h 14m 35.740s749001969285.86 叩osecond100.00%SF-100
10、2h 05m 26.944s639881078501.21。严心受second100.00%SF-3002h 07m 24.645s639896698370.52 MS-second100.00%(SF-30、 SF-100. SF-300对应原始数据集大小分另ij为30G、 100 G、 300 G)创邻科技CTO周研表示,Galaxybase可以同时支持联机事务处理(OLTP)和联机分析处理(OLAP),对比其他图数据库产品,响应时间更短、吞吐量更大、支持分布式水平扩展,能够更好满足企业在对关联数据进行分析中越来越高的实时性需求,是一款面向大规模数据的国产高性能图数据库。Galaxybas
11、e图数据库由Java语言和C+语言混编而成,充分利用了 C+语言的运行性能和内存控制优势,以及Java语言在复杂可靠系统开发中的编码效率和故障排查优势。在存储设计上,Galaxybase使用完全自主研发的原生图数据存储结构,针对图数据的免索引邻接进行了专项优化,使得点边查询能够以极高效的方式完成。核心存储引擎不依赖任何第三方开源组件,确保自主可控的同时也能够让图查询和图计算更好地和底层存储层进行协同优化。在查询执行层,Galaxybase通过自研的内存分配和管理机制,更加紧凑地编排内存数据,并通过使用堆外内存大大降低了 JVM的GC时间。在并行控制上,Galaxybase提供了并行迭代的图遍历
12、方式,使用了多版本控制的方式来减少锁竞争,并且在邻居迭代时可以根据邻居的数量自适应分配并行迭代的线程数,实现系统资源的最佳利用。Galaxybase提供了丰富的开发和查询接口,全面支持描述式的OpenCypher查询语言,可以使用OpenCypher编写完成LDBC-SNB基准测试的全部测试案例。本次审计测试中,Galaxybase通过OpenCypher完成了图数据库的耐用性测试。Galaxybase同时提供了包括Java、Python、Golang等在内的多种编程语言接口,可以通过各自的驱动包来连接图数据库进行开发。在一些对系统资源占用和执行性能要求很高的场景中,Galaxybase还提供
13、了 PAR (ParameterizedAlgorithm Routine) API接口,允许用户通过Java代码实现在服务端运行的自定义过程和函数,以获得对杳询执行过程更好的控制,追求极致的性能。用户在实际使用中,可以根据不同的场景和需求,权衡易用性、开发人力、系统资源、性能要求等多方面因素,选择最合适的方案。据了解.,创邻科技创始人&CEO张晨博士将于6月17日北京时间23:00pm (美国东部夏令时11: 00 am),于 ACM SIGMOD 2022 数据管理国际会议发表 New LDBC SNB benchmark record by Galaxybase: morethan 6 times faster and 70% higher throughput 主题演讲,公开披露测试细节。