HashData助力销售易构建智能分析云平台
背景
面临挑战
200 个并发访问、单表数十亿记录的情况下,实现多表关联查询的毫秒级响应(小 于 1 秒钟);
实现从数据产生(业务数据库)到数据展现(数据仓库)的秒级延迟,包括数据记录的更新、删除和插入;
与AWS集成,大幅降低运维的复杂度;
在选择HashData数据仓库之前,销售易团队尝试了多种开源解决方案以及它们之间的组合,也包括AWS提供的Redshift数据仓库云服务,均未能到达预期的目标。
HashData解决方案
继承于业界领先的企业级开源数据库PostgreSQL和数据仓库Greenplum Database,HashData数据仓库提供了丰富的分析功能和超高的查询性能。除了常规的ANSI SQL 2008标准和2003 OLAP扩展外,完备的索引和分区功能,以及基于代价、能够生成nestloop + index scan的表关联查询计划的优化器,是实现数十毫秒内完成单表数十亿条记录多表关联操作的关键。同时,作为AWS的官方合作伙伴,HashData数据仓库针对AWS的IaaS环境,包括计算、存储和网络,做了大量适配和优化工作,实现高的性价比。
后,通过AWS使用HashData的云服务,销售易技术团队可以在几分钟内创建启动一个数据仓库集群,规模从几个到上百个节点。数据加载后立即开始数据分析任务。随着智能分析云业务负载的变化,还可以动态地对数据仓库集群进行纵向伸缩(scale up and down)和横向伸缩(scale in and out)。同时,由于是完全托管的云服务,HashData数据仓库承担了所有的集群资源配置、数据备份、持续监控、网络迁移、错误恢复、高可用和升级等纷繁复杂、易出错的运维工作,让用户专注于业务分析上。
小结
互联网企业服务是大势所趋,销售易作为企业级新型CRM领域开创者,正在承载着为数以万计的企业提供稳定、高效的CRM服务重任。通过引入HashData在AWS中国的数据仓库服务,销售易不仅满足了高标准的技术参数需求,同时大幅度降低了其对 IaaS 资源的需求,简化了内部开发流程,确保公司的智能分析云产品能够按照规划及时推出,为更多有迫切需求的企业提供了智能分析服务。
相关文章