HashData 和 Snowflake 的“同”与“异”
随着数据量和商业分析需求的急剧增长,传统的企业级数据仓库在应对高并发、高可用、高扩展性、易用性等挑战时,心有余而力不足。自此,企业对和数据仓库的需求进一步发生了变化,推动了第四代数据仓库——以Snowflake为代表的“云原生数据仓库”迅速崛起。提到Snowflake公司,这位顶着“股神”巴菲特的光环,重燃了硅谷神话的“新星”。自9月16日上市以来,它的总市值就一路高歌猛进,到现在已经达到1200亿美元,大大超越成立时间更久的同类厂商,是当今云原生数据仓库市场上火的“香饽饽”。Snowflake的火爆,绝非偶然,凭借的是它对用户需求整体多方面的把握,对数据库技术的根本性颠覆,以及商业模式的突破性创新。当后继者们群涌而起,谁有机会挑战Snowflake的增长轨迹,成为它的“接班人”?北京酷克数据科技有限公司(简称HashData)算一个。▍HashData和Snowflake的“同”与“异”注意Snowflake的云端原生性,和很多数据仓库提供商支持云端服务并非同一概念。传统大厂例如Oracle、Teradata、Netezza,乃至后来穿上马甲的AWS Redshift,都并非诞生在云时代的产品。而云端诞生的HashData,从产品的架构、产品的理念,以及整个技术发展趋势上看,和Snowflake有着非常相似的地方。所谓,英雄所见略同。成立于2016年的HashData,也是一家专注于SQL on Cloud云端数据仓库的初创公司,旨在为用户提供高性能、低成本、高可用的数据仓库解决方案,帮助企业降低大数据分析的门槛,推动数据民主化。简丽荣解释道,“为了更好地利用云的特性,数据仓库和大数据都必须围绕云计算的特点来构建,也是基于这样的契机,以及对技术发展趋势的把握,我们成立了HashData,早进入国内云原生数据仓库赛道。”在技术研发和市场拓展层面,HashData的实力也不容小觑。据悉,HashData的核心团队由来自Pivotal、Teradata、IBM、Yahoo! 等公司的分布式数据库和大数据专家组成。在近期,它获得了A+和A++两轮共1500万美元融资。更为值得一提的是, 与Snowflake的不同点,主要体现在以下几个方面:方面,在美国的创业环境下,Snowflake是从零开始,完全围绕云计算构建的产品,而HashData是基于开源代码库,围绕云计算技术,把整个架构进行重新调整,并保证了以前的功能,包括SQL语法和使用习惯。第二方面,Snowflake以公有云订阅模式作为其主打商业模式,而HashData除公有云完全托管的数据仓库服务,针对本土的IT和商业环境特点,还支持私有云和混合云部署,通过与云厂商、对象存储厂商、集成商以及应用解决方案提供商合作为客户提供服务。对于HashData而言,Snowflake的上市,大的利好在于市场层面。简丽荣表示,“云原生数仓这么大规模的平台跑到云上面去,对很多客户来说是一个非常激进的解决方案,会怀疑采取这个技术方案、技术路线是否能支撑起企业的数据分析业务。通过Snowflake,我们不用再面向市场进行太多的解释。”放眼国内,云原生数据仓库市场百花齐放,竞争激烈。相对而言,HashData进入市场较早一些,在产品理念和技术方面是比较领先的,但在从公司规模、解决方案完整度方面,比不过阿里、腾讯、华为等友商。值得一提的是,它旗下核心产品HashData数据仓库围绕着对象存储和抽象服务构建,通过融合大规模并行处理(MPP)数据库优异的SQL功能和性能、Hadoop/Spark计算存储分离哲学,以及云计算的弹性和扩展性,帮助企业客户轻松应对数据仓库、数据湖以及数据共享实施中面临的各种挑战。很重要的一点,HashData将元数据、计算和存储三者分离,使每一层都可以单独扩容,充分利用云的安全弹性进行付费。简丽荣指出,“我们需要确保利用云的弹性、灵活性的同时,又不会降低本身数据库的性能和功能。在这一点上,我们做了大量的工作,包括RPC访问等。”目前,HashData在金融、电信、能源、交通和互联网等行业已拥有50余家客户,包括国有银行、政策性银行、金融监管机构、股份制商业银行、三大运营商、中国石油、大型港口集团、世界500强中国分支机构以及互联网SaaS企业等。简丽荣补充道,“这其中还包括,高速公路、港口、机场、航空公司等领域。”随着政企用户云化转型步伐的加速,云原生技术已经逐渐成为主流的发展趋势。简丽荣认为,“随着中国人口红利的慢慢消退,精细化经营会变得越来越重要,企业对数据驱动重要性也会越来越高。”关于HashData未来的发展方向,可以总结为三点,“SaaS化、国际化和平台化”。作为一家国内的公司,HashData满足自主可控的需求,下一步将继续做海外扩张,更多地与国产操作系统和国产芯片做适配,不断地加强云和数据湖层面的功能,在公有云上面构建数据云平台