集中式架构和分布式架构哪种更好?

2022-09-14 00:00:00 数据 架构 分布式 集中式 企业
小时候看剧,总爱扯着大人问:他是好人还是坏人?评价一个人,一般就会给对方贴上标签。卖肉的摊主,常听到的就是“这肉太肥、这肉太瘦”……似乎这世界向来就非黑即白、非此即彼。然而,砧板上除了肥肉、瘦肉,还有一种肥瘦相间的“五花肉”。

这就好比关于计算架构模式的选择,似乎除了在集中式与分布式“二选一”,就别无他法。但是,凡事也并不总泾渭分明、清晰可辨,对应问题的解决之道更非除了这个就只能是那个。看似对立的途径,其实也可以“彼此融合,博采众长。”

在我看来,架构选型的本质本来就是为了更好的为企业创新服务,推动企业更快的完成数字化转型。因此,未来架构选型一个重要准则,就是必须要以业务为先,或者以应用为先!

  1. 集中式与分布式之争

事实上,关于集中式架构和分布式架构哪种更好的讨论已经在业界延续了很长时间,每次出现类似的话题,似乎都要选出一个对错,那么我们可以从集中式和分布式架构出现的背景谈起,看看这两种不同的架构究竟有什么异同。

众所周知,大型主机的技术堆栈在半个世纪前开启了以服务器为核心的计算时代,随着业务、数据的集中处理发展成熟,其一直立足于关键事务处理的企业级计算,同时也催生出了“经久不衰”的集中式架构。

作为一个发展为成熟和完善的计算架构体系,不难发现集中式架构的技术堆栈一直坚持的原则就是:以成熟、领先的贯穿全堆栈的系统优势,为用户带来在开发交付和运行维护上更大的专注性和稳定性。

这种优势主要体现在三个方面,例如设备数量少,架构设计简单、通用与应用耦合度低,资源可以灵活调度,部署容易;数据集中存储和处理,无需多个几点之间分布式协作所以具有系统响应快,数据可靠性和一致性好;由于架构简单,所以在系统运维,容灾设计,空间用电等方面都具有较大优势。

而分布式架构起源于互联网,终在云计算时代“大行其道”,其爆发的主要原因有两个方面,一方面是互联网公司上亿的用户规模,使得其每天都要产生海量的数据,第三方的数据其实也佐证了这样的发展趋势,IDC预计全球数据将由2018年的33ZB增长至2025年的175ZB,中国将以30%的年平均增长速度领先全球。

另一方面,则是越来越多的互联网公司和云计算公司业务多元化,由原先单一的社交、搜索、媒体、网游等应用,拓展到了现如今的深度学习、线上交易、视频娱乐、网上支付、金融服务等多元化的应用,且呈现出极快的增长。新应用和新产品的迭代,带来了数据中心规模的扩大,更让后台的各种压力也成倍增加。

正是在这样的挑战之下,分布式架构弹性伸缩的能力在支持面向互联网海量客户相关业务时,可以有效预处理瞬时爆发的海量交易,同时可以及时对系统算力进行调整,大程度的支持海量用户以及大规模业务场景;此外,分布式架构可以基于廉价的硬件和开源软件构建,不会受到单一厂商的制约,可以引入多家厂商竞争,成本更为可控;更为关键的是,分布式架构通过多节点、多机房等技术手段更解决了核心架构的风险度集中的问题。

但是,从企业实际业务出发,其实也不难看出,这种“二选一”的评判标准已经过时了,这是因为今天绝大对数企业的架构早已不是单纯的集中式或者分布式,而往往是“二者兼顾”。更重要的是,无论是集中式架构还是分布式架构,都是开放式的技术堆栈,其技术特点也“各有千秋”,都在企业核心系统中扮演着不可替代的角色。

2、应用决定架构是真理

那么,既然要抛弃“二选一”的评判标准来选择不同的架构,那么该如何决定适合企业自身的架构呢?我的观点是,企业未来架构的选型的关键,就在于要秉承一种开放心态,根据自身不同的业务需求,把新兴的和经典的技术与架构做到“为我所用”,并在分与合之间把握好平衡之道,更关键的是要结合自身的应用需求,从以下三个维度来做参考:

一是,全栈化,是指未来企业的架构也好,IT资源也好,其构建的终目的就是能够转化成服务资源,而且是全栈式服务。未来企业的基础设施架构或许不再区分为集中式或者分布式,只要是企业的数据中心基础设施服务,就必须能够提供各个层面、各个维度的服务资源

二是,融合化,是指企业未来的数据中心,无论是基于分布式架构还是分布式架构构建,都不能再重复搞过去的“烟囱式”的架构;在此基础上,还要融合自建数据中心与公有云资源,是指企业在未来无论是采用私有云、混合云、还是公有云,这些不同的云都是企业建设资源、管理资源的一种方式和选择。对企业来说,必须通过融合这些各种异构资源,并在安全可控的基础上实现“为我所用”。

三是,数据化,是指企业构建各种各样的架构,核心其实还是为了解决数据的问题。因此,未来的基础架构同样需要具备能够不断迭代和进化的能力,企业的服务或者应用在什么样的平台和架构之上,也能完成服务和应用的“供给”,由此让数据不断沉淀,让服务越来越丰富,终产生更大的价值,让企业的竞争力越来越强大。

当然,无论是全栈化、融合化、以及数据化,背后的终目标就是要实现“应用定义”或者说“业务定义”,由此才能驱动业务创新的流程和机制,终完成企业的数字化转型。

3、更大舞台是智能化浪潮

客观的说,今天企业工作负载和业务的多样性决定了两者并不是“互斥”关系,更多应是“互补”关系。也正因为如此,目前越来越多的客户今天正在采用集中式与分布式相融合的架构体系,通过集中式架构保证核心业务平稳运行的前提下,分布式架构则可以更好的满足互联网等新的应用场景,由此实现快速的创新。

在此基础上,面对复杂的混合架构,企业势必需要一个更加统一的管理平台,能够对集中式和分布式的架构进行高效的管理,同时能兼顾发布、部署效率和稳定性,同时在运维管理上,也要能够实现整体性、一致性的管理,如果从这个角度出发,做出适合自身的架构选择也就不用再“纠结”了。

首先,从架构性能维度看,未来企业的基础设施架构或许不再区分为集中式或者分布式,只要是企业的数据中心基础设施服务,就必须能够提供各个层面、各个维度的服务资源,同时还必须具备超强的计算性能。

在这方面,英特尔新发布的第三代至强可扩展处理器,就把bfloat16的支持整合到了英特尔独有的深度学习加速技术中,这一创新让英特尔第三代至强可扩展处理器在面向未来关键工作负载时,变得更具优势,这些关键工作负载包括了深度学习、虚拟机(VM)密度、内存数据库、任务关键型应用及分析密集型工作负载等。

数据显示,与上一代产品相比,“加持”了bfloat16的英特尔第三代至强可扩展处理器,其面向图像分类的人工智能推理性能提升高达1.87倍;面向自然语言处理的人工智能训练性能提升高达1.7倍;面向自然语言处理的人工智能推理性能提升高达1.9倍,帮助企业从数据中心到边缘逐步实现人工智能的就绪。

其次,从架构管理维度看,未来企业数据中心的基础架构还必须融合自建数据中心与公有云资源,即企业在未来无论是采用私有云、混合云、还是公有云,这些不同的云都是企业建设资源、管理资源的一种方式和选择,这就需要一个更加统一的方式,管理这种混合架构,提升资源的利用效率。

同样,英特尔也与合作伙伴一起提供了完整的、几乎没有瓶颈的混合架构平台,从硬件到软件,为大数据、AI、多媒体处理,通用计算、高性能计算等工作负载提供全方位支持和加速,结合高度优化的云管理和运维平台,帮助终客户“快捷上云、高效用云、轻松管云”。

后,从架构应用维度看,无论采用何种架构,其目标都是为了企业更好的收集数据、挖掘数据,并让数据发挥出更大的价值,特别是随着5G、大数据、人工智能、区块链等新兴技术开始向各行各业渗透融合,以数据为主要驱动力的数字经济成为主流。

而英特尔傲腾持久内存,将高性价比的大容量内存与数据持久性巧妙地结合在一起,不仅可以支持前所未有的内存容量,同时还能以超快的速度访问持久存储的数据,让企业客户从容驾驭数据爆炸带来的挑战,让数据从负担变为创造力。

值得一提的是,英特尔傲腾持久内存还提供了多种工作模式,以适应不同场景的需求,其中内存模式下,就能够以更低的成本提供更大的内存容量,从而支持更大的数据库。同时,随着内存容量的增加,虚拟机、容器和应用的密度也得到提升,处理器的利用率也随之提高。

而App Direct 模式下,企业则能够实现较大内存容量和数据持久性,这样软件就可以将DRAM 和英特尔傲腾持久内存作为内存的两层进行访问,由此降低堆栈的复杂性并能充分利用持久内存具有缓存一致性的字节可寻址特性,将持久内存的使用扩展到本地节点之外;这种模式还能提供一致的低延迟,从而支持更大的数据集。

综上述所,未来架构的选择上,同样也应该本着一切从业务需求出发,从客户体验出发的原则,不要再陷入集中式架构还是分布式架构选择的“纠结”之中。因此,关于集中式或是分布式架构孰优孰劣之争,或许到时候可以画上一个句号了。未来企业数字化、智能化转型所带来的更大舞台,为客户解决实际业务需求和痛点,才是我们需要关注的重点和努力的方向。

相关文章