Greenplum平台扩展框架
随着数据存储和云服务的爆炸式增长,数据现在驻留在许多不同的系统中,并以各种格式存在。通常,数据会根据其位置和对数据执行的操作以及访问数据的频率进行分类:实时或事务性(热),不频繁(热)或存档(冷)。
下图描述了一个数据源,该数据源跟踪了多年的月度销售额。实时操作数据存储在MySQL中。进行分析和商业智能操作的数据存储在Greenplum数据库中。很少访问的存档数据驻留在AWS S3中。
当外部系统中存在多个相关数据集时,通常更有效的方法是远程连接数据集并仅返回结果,而不是协商执行相当昂贵的完整数据加载操作的时间和存储要求。所述Greenplum的平台扩展框架(PXF),一个Greenplum的扩展,提供平行,高通量数据访问和联邦查询处理,提供了这种能力。
相关文章