专访沃趣创始人: 如何做到数据库运维无忧?

2021-10-27 00:00:00 用户 数据库 产品 阿里 监控

近日曝出一条新闻,湖北荆州安良百货商场发生了一起电梯安全事故,一女子被卷入商场手扶电梯绞死,后一刻双手举出孩子。如此惨剧背后,唤醒的是大众的觉悟,如何做好公共安全的运维与监控工作?如何防患于未然?



和公共安全类似,2015年IT圈内也发生了一连串的重大事故,尤其是今年这个夏天,有人誉为是互联网企业的黑色季节,先是陌陌、网易、支付宝、携程网、艺龙网、招商证券、同花顺、齐鲁证券接连发生故障,后有爱奇艺宕机、苹果旗下的多项服务遭遇了长达4小时的宕机,影响范围包括App Store、iTunes、Apple Music和Apple TV。一次次宕机事件让我们更加揪心,对背后的软硬件基础设施服务提出了更高的期盼,如何改善网站性能?如何优化数据库?如何做好运维监控?如何消除系统的安全隐患?如何重视容灾备份?这一串串的问题会让DBA或者运维人员感觉到忧心忡忡。有没有办法来解决呢?沃趣科技能够为企业的数据库提供专业有效的服务和解决方案,让运维工作毫无后顾之忧!



本期名人堂我们邀请到了沃趣科技的CEO(社区ID:grassbell)坐镇,从阿里深耕八年技术到自己创业当老板,自主研发了数据库一体机与监控软件平台。他是如何一步步走过来的呢?一起来看看吧!



皮皮(Q1):陈总,您好!很荣幸有机会采访到您,和我们网友介绍下自己吧!

陈总(A1)我叫陈栋,网名grassbell。谈起数据库,我有着深厚的渊源。记得十三年前,我从北京信息工程学院毕业,一年后抱着兴趣爱好,我开始接触了Oracle数据库。为了认识更多的圈内人,在学习Oracle数据库的第二年,我申请成为了ITPub Oracle专题深入讨论区的版主。这两年我成长很快,2004年开始加入了阿里巴巴数据库团队.那时候,我从一名应用DBA转型成为了产品数据库运维的角色,在此期间,我积累了很多技术实践的经历,比如Oracle从PC Server+磁盘阵列 到IBM小型机+高端存储的升级,也参与了从集中式Oracle 到分布式MySQL的变迁。五年以后,也就是到了2009年,我成为了25位DBA团队的leader,负责所有DB相关项目的开发、测试、上线、日常优化工作,同时负责阿里巴巴所有线上Oracle、MySQL、Greenplum数据库的运维。此外,我还负责了数据库主机、存储的规划和日常管理的一些事情。通过这段时间的深耕,我开始慢慢形成了一套成熟的数据库运维理念,打下了坚实的实践基础,开始能为各种应用场景提供合理的数据库架构,并对各种疑难紧急情况进行有效处理。



2012年6月我决定离开阿里,带着原团队的几位核心骨干,一起出来创业,共同组建了沃趣科技,期望能够凭借我们在互联网行业积累多年的运维经验,为传统行业客户提供数据库服务和产品。三年来,沃趣科技汇聚了数据库圈子里的各路大牛,技术领域涉及Oracle、MySQL、PgSQL,同时能够结合Linux和x86平台的新技术,为用户提供全栈式DB解决方案。



皮皮(Q2):创业是一把双刃剑:一方面,李克强总理提出全民创新,万众创业;另一方面,创业是九死一生的事情。您当初选择离开工作8年的老东家阿里巴巴、下决心创业的勇气来自于哪儿?

(A2):一路走来,我在一家公司坚持八年,可以说这是一段非常漫长而又充实的过程,也算得上是我人生中的黄金时间了。我很想说,阿里是一家伟大的企业,在这八年期间,我有幸目睹和经历了整个数据库技术架构的重大变迁过程。阿里成为了去IOE的领头羊,沉淀了十六年的阿里会走得越来越好,我相信现有的基础架构在未来很长一段时间内也足以支撑阿里业务的发展。在这八年期间,在项目的实践中,我也有机会接触到了一些传统行业的技术人员,通过交流,发现他们在工作中遇到了很多痛点。而这些问题恰好我们早就遇到过,甚至都积累了一些成熟的应对方案。所以我萌生了一个念头,与其选择继续在阿里呆下去,不如跳出来,为这些传统行业用户解决他们遇到的数据库问题,这样反而更能体现个人价值。事实证明,我当初的选择是明智的,创业三年来,我们为客户创造了巨大的价值,为他们实实在在地解决了一些问题,我们的付出也得到了相应的收获。



皮皮(Q3):创业除了勇气以外,更重要的是好的产品和商业模式,您能否结合数据库一体机和数据库监控平台这两款明星产品,详细谈谈它们的核心竞争力?

(A3):记得创业初期,我一直在寻找方向,在不断的摸索中学会成长。一开始我们全力打造数据库和系统相关的服务,在自己擅长的领域努力深耕,终于有了落地的产品面世。后来,我们继续探索,业务越做越大,时至今日,我们已经拥有了全栈式的数据库解决方案,让客户在运维工作中再无后顾之忧了。三年来,我们全力打造的两款产品是QData数据库一体机和QMonitor数据库监控平台,它们已经非常成熟了,获得了市场青睐与客户的高度认可。



在阿里顺利完成去IOE的过程后,很多传统行业跃跃欲试。在这样的背景下,我们推出了QData数据库一体机,能够有效满足传统行业客户尝试去IOE的需求。我们结合自身在阿里积累八年的运维经验,通过自主研发的存储管理软件,将Oracle、MySQL数据库、通用服务器、InfiniBand及闪存技术完美整合,形成了一整套高可用、高性能、可扩展的数据库服务平台。



从我们团队的角度来讲,我们积累了多年从事DBA的经验优势,深知用户的痛点在哪里,担心什么;我们这群技术骨干,也亲身经历了从数据库小型机到x86平台迁移的整个实战过程,在实际的演练中,我们知道哪里是雷区,该如何避免踩雷。从多年的经验来看,我们知道x86平台本身确实不够稳定,所以在整个产品设计与研发的过程中,我们投入了大量的精力,期待通过集群的方式来提升系统的高可用性,和整体可靠性。同时,我们也清楚,当很多企业选择将数据库从集中式的IOE架构迁移到分布式的x86架构过程中,无疑会增加用户的运维工作量。从这个角度思考,我们有没有办法实现运维的自动化?功夫不负有心人,我们的产品通过不断优化与完善,实现了深度监控、自动换盘、自动增减节点等等功能。



再说说监控。从目前市场的行情来看,还没有一款简单实用、功能齐全,同时还支持多个异构数据库和操作系统的监控产品,大部分企业还依赖于一些开源产品,但都存在一些问题,比如需要部署Agent、需要二次开发或者这些开源产品本身监控能力有限等,而像Oracle、HP这些公司的商业监控软件,优势与弊端也很明显。比如用户使用繁琐、学习成本高、购买成本高、运维成本高的问题。综合开源与商业监控软件的不足,我们研制了QMonitor数据库监控平台。这款平台从DBA自身需求出发,能够解决用户的实际痛点,比如零客户端,AWR自动收集分析,TOPSQL和执行计划展示,同库多指标的对比,同指标多库的对比,甚至为MySQL定制的AWR报告等等功能,都是非常实用接地气的。同时我们非常注重用户体验,效仿互联网的风格,这款监控软件能够大大提升用户操作的感受。所以我们实现的不仅仅是一个产品,更是凝聚了众多实战经验的佳实践。



皮皮(Q4):我们知道,类似IOE这样的厂商都有自己的数据库一体机,请问沃趣科技是如何与这些大厂商PK?我们采取的策略是选择正面的同质化竞争,还是选择针对不同客户群体的差异化竞争?

(A4):首先我们对自己的产品非常有信心,尽管我们也会面对外界一些大厂商的压力,但从三年时间的战绩来看,我们同样积累了不错的用户量和成功案例。确实如主持人所说,数据库一体机的同质化竞争非常激烈,尤其在性能方面各厂商的差距越来越小。所以,我们的战略格局相对来讲会更大些,除了提供产品外,在满足客户性能和可用性等各种要求的前提下,我们还将为客户重点展现我们全栈式数据库解决方案的能力。


我们沃趣科技团队人才辈出,无论是Oracle、MySQL还是PGSQL数据库,每个领域都有领先的技术人才。我们非常了解这些主流数据库的优缺点以及相应的应用场景,提供根据用户的需求提供合适的定制化架构。


在Linux和x86硬件平台上,我们融入了Oracle、MySQL、PGSQL数据库,同时引入Flash和Infiniband技术,能够彻底解决性能和扩展性等问题。我们可以满足用户对资源池的需求,实现资源隔离和有效利用,我们还可以解决用户非常关心的容灾系统数据库零丢失的问题,甚至具备同城40~80公里的零丢失容灾方案。


未来,我们将推出基于OpenStack的数据库私有云方案,实现用户本地RDS的需求。除了上述各种解决方案外,我们还可以为客户提供贴心的数据库服务,例如数据库优化、巡检、二线支持等等。所以我们为客户提供的不仅仅是一款产品,而是一整套全栈式的DB服务(FullStack DBaas),这就是我们的竞争力。



皮皮(Q5):很多企业在数据库的运维上可能会面临着一系列挑战,比如数据库软硬件成本居高不下、架构太过于封闭、关键业务系统扛不住高并发负载、跨机房的异地容灾难以实现等,有没有一些好的应对方法呢?能否结合一些客户案例给我们分享下您们当时是怎么解决的?

(A5):正如刚才提到的,我们当初推出QData数据库一体机产品的初衷,就是想要帮助用户解决这些问题。今年我们的A股市场一直是个热门话题,所以就拿华泰证券的案例来举个例子。华泰在过去的一年时间里先后采购了两套QData for Oracle一体机产品,用来支撑他们几个至关重要的业务系统。其中全账户系统,是华泰近两年力推的移动理财APP涨乐财富通的后台系统。该App每天的在线用户数接近30万,而且资产页面每隔5秒自动刷新一次,这对后台数据库系统的要求是非常高的。


那目前这套系统就是运行在一套由两个计算节点和三个存储节点构成的QData一体机上,所有节点均采用开放式的x86服务器,存储节点上则配备了高性能的SSD。该系统上线之后,根据用户的反馈,在高峰时期,整套系统的CPU利用率一直低于30%,而IOPS一直稳定在1.5万到2万之间,高峰期达到4.1万,完全可以应对这项新型的移动互联网业务。而根据华泰技术部门的调研和对比发现,使用QData一体机替换原来的IOE架构帮助他们节省了百万元以上的成本。目前华泰正在积极地推进容灾项目的建设,他们准备继续使用QData方案来实现同机房以及异地的灾备需求。



皮皮(Q6):近我也了解到,趣沃科技在重点打造一款高颜值监控软件——QMonitor新版上线了。请谈谈您对这款产品的期望

(A6):初期,我们将QMonitor定义为数据库监控平台,当时只能监控Oracle,到现在还支持MySQL,相信在未来的开发计划中,我们的监控平台会支持更多的数据库,例如Informix,DB2,SQL Server,PostgreSQL等。在自动化方面,我们的监控平台会加入更多的“控”,例如用户可以通过QMonitor 实现对QData 数据库一体机的所有运维管理工作,做到真正的有“监”有“控”;同时在“云”的领域,QMonitor会支持OpenStack 数据库模块,对OpenStack 上托管数据库服务进行无缝监控。未来QMonitor的定位将会提升为我们整个全栈式DB服务体系的可视化管理平台。



皮皮(Q7):后,能否给出关于数据库一体机与数据库监控平台的一些典型案例的客户反馈、性能指标数据,以便给新用户一些参考。

(A7):谈到数据库一体机,我很想说,华泰证券其实就是一个非常好的案例。我们积累了各行各业的客户,比如运营商、证券、国家电网、医疗、企业等等。在这里我举一个运营商的案例,去年我们帮助甘肃电信实现了它们的需求,把他们的ODS系统从原来的一套陈旧且昂贵的Teradata架构迁移到了QData for Oracle一体机上来。这样一来,我们不仅帮助他们节省了上千万的成本,同时还大大提高了系统的性能,比如数据加载速度缩短为原来的1/3,统计报表的生成速度提升了10倍,而实时查询类的业务速度则提升了近50倍。这些就是非常鲜活的案例。


QMonitor数据库监控平台是我们的拳头产品之一,目前我们的客户使用数量已经超过300家。比如耳熟能详的互联网公司蘑菇街,就是我们沃趣QMonitor的重度用户,客户之需要在一台服务器上安装QMonitor的虚拟机,就能够监控百余个数据库与主机实例。那么现如今,蘑菇街在QMonitor监控平台的应用程度如何?在这里我也可以举一个简单的例子。有了这款监控平台以后,他们对于监控平台的运维慢慢形成了一套严格的流程,如果需要对QMonitor监控平台实现启停或者升级操作,它们都需要由上级领导来进行审批,这样可以规避数据库或者系统出现重大事故的风险。

相关文章