《CU访谈录——IT技术人的故事》(第十一期 运维总监"king_819")
大家好非常高兴今天能邀请到CU社区热心网友苏州某企业运维总监king-819来跟大家分享下企业运维中的经验。
擅长领域: 服务器集群(centos、freebsd) 网络架构(跨ISP、跨机房) 网络安全
无风之谷:
Hi king兄,先给CU社区的网友打声招呼,介绍下自己嘛。
king_819:
HI,CU的兄弟们大家好,我是kerry(聆听未来),在坛子里的ID是king_819,目前在一家游戏公司从事运维工作
无风之谷:
king兄,作为IT企业运维总监,在你眼里,企业运维的职责是什么?
king_819:
运维成本的控制:ISP、机房的选择、网络设备及服务器型号的选择、“新”技术的应用
网络架构的设计与搭建:网络设备及服务器的规划和布署
应用系统架构的设计与搭建:高负载、高可用、高伸缩、高容灾并能实时监控
运维自动化:批量的自动化布署
网络安全:防攻击、合理分配权限、日志审查
应急响应:应急预案,快速响应并解决问题
团队建设:打造一支团结有创新意识的团队
无风之谷:
我记得某IT网站把运维工程师这么形容,“战地工程兵”“机房清洁工”“洪水救灾员”等等,您是如何看待这个问题的?
king_819:
哈哈。。这样看来我们的运维工程师是无所不能啊,为了公司的网络系统能安全稳定的运行,可谓是跋山涉水,不怕脏、不怕苦、不怕累了,不过做为一个运维工程师,这些基本的条件也是必须具备的,但不意味着我们的运维工程师就只是拉拉网线、杀杀病毒、装装系统、把服务器弄上线能正常访问了,有问题了再这修修、那补补就完事了,我觉得应该从更高的角度来看待运维工程师这个工作岗位,如何在保证业务稳定、有效的对外提供服务的情况下降低运维成本?如何在大批量布署系统、应用程序的情况下提高效率,在短时间内让业务快速上线,并安全稳定的运行?如何防止大量的网络攻击?如何保证网络系统构架、应用系统架构的高扩展性、高容灾性?如何更好的跟其他部门配合,合理的分配资源,共享信息,让业务系统更安全稳定的运行?运维成本系统架构的整体规划、运维成本的控制、批量的自动布署、各部门之间的相互配合、网络系统的实时监控、网络系统的扩展、数据分析、网络安全、安全审计、各种事故的应急响应,这些都是我们要考虑的,要努力去做好的
无风之谷:
说起运维,我们不得不说IDC运营商选择的问题,服务器多了,自然要找好的IDC运营商,否则会出现机房网络被攻击,电源跳闸之类的,带宽流量无法实时监控等等各种悲剧!您是如何选择IDC运营商的?
king_819:
说起IDC运营商的选择,这个确实是比较关键的一步,不光要考虑成本,还要考虑稳定性和带宽质量,电源和空调系统的不稳定确实比较麻烦,可恨的就是频繁的被攻击,再就是应急响应的速度和能力,所以我们在选择IDC运营商合作的时候是比较慎重的,一是根据自己的经验,二是根椐朋友的介绍和在业界的口碑,三是前期的线路测试,会放一些不是核心业务的应用上去进行一段时间的压力测试,以检验IDC运营商的性能,达到要求了则与之合作
无风之谷:
核心业务和IT系统息息相关,一旦网络出现了故障,影响和损失非常巨大。所以,传统的管理模式只能导致"出现问题后被动响应",而这种解决问题的效率和质量相当低,对于这种问题,您是如何解决的?
king_819:
当今的互联网行业竞争激烈,不光要稳定,还要快速的对外提供服务,一但出现故障对企业的影响和损失是很大的,所以在网络和应用系统架构设计的时候就要求充分的考虑高可用、高负载、高容灾这些东西,避免任何一个单点故障,这里应用多的就是负载均衡、故障转移技术了
无风之谷:
流量大了,或者业务重要性高,就要求大可能提供服务器的高可用性和数据容灾,自然要部署负载均衡和故障转移;是采用硬件F5,cisco还是软件lvs,keepalvie,heartbeat,nginx方式实现,效果如何?king兄是怎么选择的?
king_819:
为了避免单点故障,就不得不考虑负载均衡、故障转移技术了,F5、NetScaler这些硬件负载均衡器不光成熟稳定而且还有专业的团队为你保驾护航,但花销也是高高的,对于开源项目的负载均衡器现在用的多的应该就属LVS+keeplived了,LVS成熟、稳定,生产环境中的真实案例也是比较的多,抗负载能力强,我所经历的项目基本上都是用的LVS/DR+keeplived 做负载均衡,近的nginx做为后起之秀可谓是无所不能,负载均衡模块对网络的依赖较小,理论上只要能ping就可以实现负载均衡,相对来说LVS对网络环境的要求就比较的高了,如果网络环境比较复杂的,可以选择nginx+keeplived作为负载均衡器,nginx负载均衡类似于LVS服务的nat模式,如果后端的web服务器大于10,可能会出现性能瓶颈,具体用什么?怎么用?还得看大家具体的需求,根椐需求来选择负载均衡器
无风之谷:
千金易得,一将难求。对于企业来讲,运维人才的流失是比较可惜的,作为运维总监,king兄是如何去留住一批的运维人才又是如何招聘新人的呢?
king_819:
随着年轻人的生活压力增大,再加上互联网行业的浮躁,大量的热钱进入这个行业,造成行业内跳槽频繁,团队的稳定和完善是做为一个管理者不得不认真对待的一个问题;
关于如何去留住一批的运维人,当然是要给他一个有竞争力的薪资待遇,这是一个比较现实的问题;第二就是要有一个很好的发挥、成长空间,争取人人可以做项目经理,人人可以带团队,学以致用,互相学习,不断提高;第三就是合理的考评、晋升制度;第四就是富有激情的团队氛围;第五就是更多的学习培训机会;
关于如何招聘新人,就是要找一个合适的人,必须要符合岗位要求的基本技能;第二能力为先,不需要花架子;第三要富有团队意识;第四知识面要广;第五学习能力、领悟能力、创新意识要强
无风之谷:
很多人都说运维是个年轻人行业,做运维的需要梦想和激情,随着岁月的增长和学习能力,熬夜能力的衰退;运维人员要面临转型的问题,king兄是如何看待运维人员职业发展这个问题的?
king_819:
运维这个岗位本身技术含盖了很多方面,系统、网络、应用、存储、安全、监控、数据库、虚拟化、云计算等,相对来说运维人员要转型方向还是挺多的,这就要看个人擅长哪一方面,再加上兴趣和爱好了,不管哪一个方向,做深了,前途都是无可限量的。
相关文章