Kyligence架构图
在大数据时代之前,是商业智能(BI)时代。它基于许多相同的原则,但更侧重于形式化的数据模型和数据分析。自从大数据诞生以来,一个问题就一直存在着:BI方法能否与大数据的数量和随之而来的极端粒度相兼容?
一家认为答案是肯定的公司是https://kyligence.io/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>Kyligence,其基础是大数据平台上的开源OLAP(在线分析处理),Apache Kylin确实融合了这两种方法。最初,Kylin和Kyligence是基于https://hadoop.apache.org/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>Hadoop和配置单元(类似于大型计算机上OLAP的早期版本数据播放器https://www.atscale.com/“target=”\u blank“rel=”noopener noreferrer nofollow“data component=”externalLink“>AtScale),但是Hadoop的MapReduce基金会在提供能够支持真正交互分析的性能方面带来了挑战。
<强>也读:
为了实现优化的性能,Kyligence将Apache Parquet的柱状存储格式与分布式聚合索引相结合。后者基本上是预先计算的聚合,这是OLAP的标志。Kyligence还利用了该公司所称的“智能查询路由”,即在需要细节级数据时直接查询后端数据源。对于基于大数据的BI来说,这是一种正确的方法:预先计算尽可能减少查询时间的位置,然后转到源存储库获取详细级别的数据和/或在适当的时候将查询工作下推到后端平台。
由于这种方法,Kyligence说它的聚合层“提供了次秒的查询响应时间”与“旧式”OLAP不同,后者要求在设计多维数据集时指定此类聚合,Kyligence使用机器学习辅助方法,观察针对后端数据发出的查询,并动态自动创建聚合,Kyligence的想法是恢复OLAP所能带来的性能提升,而不是强加分析师和用户通常与OLAP方法相关联的建模负担。另一方面,正式的设计和建模也是一种选择,它支持公司所称的统一语义层(BI从业者熟悉的术语)。Kyligence表示,一个客户已经将超过100TB的数据迁移到一个Kyligence多维数据集,而另一个客户只将大约1200个IBM Cognos多维数据集移植到两个Kyligence多维数据集。
可以使用SQL、MDX或RESTful API查询Kyligence,从而允许标准BI工具进行查询。该公司为主要的BI平台提供优化的连接器。这些连接器使用直接连接方法,从而允许查询流到Kyligence,并避免在Kyligence已经提供的基础上构建具体化的工具端BI模型。
Kyligence Cloud 4立即在AWS和Azure上可用,包括通过Azure Marketplace。