服务与支持
关于数据中心运维工作的提升技巧
日期:2019-02-14 浏览次数:

关于数据中心运维工作的提升技巧

 数据中心的稳定运行离不开数据中心的运维人员,而数据中心运维的工作涉及到方方面面,它不同于其它的运维,处理的问题都是比较专业的问题。在很多的公司都是将服务器和设备托管到专门的数据中心机房让专业的人士进行维护,只有一些技术实力比较强的大公司才建设有自己的数据中心。如今的信息技术更新得很快,什么大数据、云计算、虚拟化、绿色数据 中心等等新技术层出不穷,各种设备的CPU、内存、转发芯片等也都在不断地发展。

 

  从单核CPU到多核、四核、八核、十六核、三十二核,网络单端口带宽从 10M、100M、1G、10G、100G,这些技术的进步给数据中心带来了高速的信息处理能力,但是也让这个数据中心的系统变得异常复杂,传统的数据中心运维技能已经难以适应信息高速发展的需要了,需要我们去不断学习,提升自己,才能在未来的数据中心里,将运维的工作开展好。下面将结合一些实际工作经验 讲述提升运维技能的一些方法。

 

       数据中心是一个复杂的信息处理系统,包括系统、网络、存储、协议、需求、开发、测试、安全、空调、供电、监控等多个环节,运维的工作就 是要包含到所有这些方面,可见 运维的工作是一个集多IT工种技能于一身的岗位。然而这里说的每一个部分都需要多种技术学科的支撑,比如系统可能有Linux、Windows的,应用有 LVS、HA、WebServer、DB、中间件,网络就更复杂了,各种二三层协议,虚拟化,环路协议,路由协议等等
这么多的技术不可能每个人都精通,不可否认可能有这种全面精通的人存在,但人的精力毕竟是有限的,要有所得也要有所失。

首先、是沟通能力、团队协作

运维的工作涉及跨部门、跨工种特别多,这样运维的人员需要善于沟通,团队协议能力要强,这样在处理问题时,可以充分调用各种资源和技术力量,迅速解决问题。

       对于数据中心时间就是利润,流量就是金钱,一年365天要保持数据中心的稳定运行,不出故障或者少出故障才行。当业务部门反馈有故障时,根据反馈的故障现象迅速锁定故障点,然后集中资源解决,这其中需要大量的沟通,有效的沟通将为排除故障节省下来大量时间。其次是运维工作要胆大心细。

然后、胆大才能创新,不走寻常路

       即使数据中心再小,它也有自己的特点,充分利用它的优势,才能发挥出数据中心最大的效能。数据中心本来就是一个技术更新很快的领域,愿意接受新事物,大胆引入先进运维的 技术将可以大大提升数据中心的工作效率。

其次、做好日常监控工作

       一个健壮的身体离不开每天的观察,我们需要时时刻刻观察我们的数据中心,看看数据中心发生的细小问题。每天都要对数据中心的所有方面运行参数进行全面检查和记录,慢慢地就会对数据中心运行状态有了掌握,当某些参数变化时及时做应对之策。比如设备运行的CPU占用率,平时监控所有设备CPU占用率都在30%左右,突然有一天几台设备的CPU占用率无缘无故升到了60%,这就需要进一步检查升高的原因,直到消除掉为止。如果没有这些平日里的统计记录,这样的参数变化就不会引起人们的注意,故障迟早会到来。

再次、做好统计工作

       一般的数据中心都拥有上千台的服务器设备,还有其它不少的电子设备,要做好统计工作。比如服务器多少台,都处于什么位置,都和网络设备如何互连的,每台设备的配置,应用的特性等等,这些统计工作马虎不得,都关系着数十万设备的物理安全。在平日接触到的运维人员让我们感受到不同的人员对自己数据中心的了解差异是非常大的,有的人可以对询问的某个网段IP给什么应用使用脱口而出,而有的人却对询问的服务器放在哪个机架上都一无所知,当遇到问题或者进行数据中心变更时,后者的表现是显而易见会出问题的。

下一条
最后一页
Copyright © 2018,成都网快科技有限公司 版权所有 备案号:蜀ICP备2021011828号