如何更好的应对数据中心的突发状况
发布时间:2019-05-12

数据中心中,经常会出现一些不可预测的紧急状况。当然很多企业都会针对这些情况采取一些措施,来避免造成更大的损失。在通常的情况下,很多突发情况发生后,相关的工作人员还是没有准备。本来只需要停机几分钟就可以解决的问题,可能最后会因为没有准备而关闭几天。甚至有些突发的状况会临时找不到解决的方案。以下是一些可以在情急情况下仍然保持数据中心持续工作的有效解决方法。

 

  电力和冷却设施备份

 

  首先,服务器的后备电源系统要尽量的可靠,这样在一些紧急的情况下可以保证电源的供应不会中断,从而不会有过长的停机时间。

 

  其次,冷却机组的电力供应也很重要,如果在突发状况下,冷却系统不能正常的工作,即使服务器恢复了供电,也会因为散热问题而不能正常的工作。

 

  此外,确保冷却机组有足够的冷却水也至关重要。如果发生了故障导致冷却水供应不足,例如当地的供水公司管道除了问题,那么冷却系统就会瘫痪。所以无论在什么情况下,都必须要保证有足够多的储备冷却水,来应对可能存在的突发状况。一个很好的选择在靠近水源的地址来建设自己的数据中心,如湖畔,河流或者地下水源,而不是只依赖于自来水公司。

 

  总的来说,必须要使自己的冷却系统有备份冷却能力,这样可以是数据中心遇到突发状况的时候,拥有持续的冷却能力而不至于停机。

 

  定期维护和检测

 

  冷却和电力系统是需要不断进行维护的,每年都应该进行例行的检测。

 

  例如,如果数据中心中采用的UPS是蓄电池式的,一个很关键的地方就是要保证电池的可使用状态。如果在事故发生前没能够及时发现电池的故障或者电池充电不足,这就大大削弱了UPS作为备用电源的作用。一旦电力系统发生了紧急情况,需要半个小时来恢复正常供电,可UPS只坚持了15分钟就不能正常工作了,这是一件很杯具的事情。另外,发电机的启动电池这样的设施也需要额外的维护,来保证它的正常使用。

 

  定期的检测和升级也是必要的。这可以确定数据中心的电力和冷却系统是否能够满足数据中心现有的需求,如果数据中心内为了业务的需求,新添加了许多服务器,而电力和冷却设施却没有做出相应的调整,一旦在服务器满负荷运作的条件下,很可能会发生电力供应不足甚至冷却能力不够的情况,严重的话甚至会引起停机。

 

  而为了避免这些情况,定期的检测和升级是每个数据中心的经理都要关注的事情。一旦发现电力和冷却系统不足以支持现在的数据中心,就必须升级现有的系统或者实施新的解决方案来加强电力和冷却的能力。

 

  不论是UPS电池,发电机启动电池,还是空调过滤器等关键性设施检测的最好时机是在夏季进行。因为夏季不论是温度还是湿度都达到了高水平,这对数据中心各项能力来说都是一项严峻的考验。如果能够适应夏天的环境,在其他的季节也就能够更好的应对紧急的状况。

 

  工作人员的认识

 

  备份冷却和电力基础设施,简单的来讲就是在紧急状况下的另一种可靠性。而正因为,它仅仅是作为一个临时的系统,所以数据中心不可能去拿出比主要设施还要多的资源来配置备份系统。

 

  但是在IT人员的认识上,应该摆在同样重要的位置上,尤其是紧急状况下的解决方案,更是每个相关人员都必须要了解的。在出现紧急状况后,一个轻微的延迟都可能带来严重的后果。

 

  对于这个备份设施的布局,每个相关工作人员更应该熟悉。大部分的数据中心主要系统和备份系统会采用一样的设施和系统,这对于工作人员来说大大降低了操作的要求,但是工作人员也必须要了解每个备份系统各个主要设施的位置,以便能够尽快的启动备用设施,使数据中心恢复正常工作。

公司名称:六安市金狮网络技术有限公司
公司地址:安徽省六安市金安区皖西大道红叶大厦802A
联系电话:0564-3214800 手机:13956148092 邮箱:120907442@qq.com QQ:120907442 / 1099497647
手机访问