数据中心容量危机应吸取的教训
发布时间:2019-05-12

2005年,美国能源部西北太平洋实验室(PNNL)的数据中心存在的问题到了紧要关头。

 

  美国能源部管理的政府实验室的数据中心服务经理Ralph Wescott说,意外的中断几乎每个月都会发生,每一次中断都会使数据中心关闭几个小时。机构正在购买越来越多的机架式服务器增加计算资源。机架式服务器最近变得越来越便宜。在2005年7月,数据中心曾达到其容量的极限。Wescott说,机构会购买一台服务器,然后扔给我说,“嗨,安装这台机器。”但是,我没有空间、电源或者冷却容量来安装这台机器。如果我再安装一台机器,整个房间就会停电。

 

  Wescott和PNNL(美国能源部西北太平洋实验室)参加了一个广泛的项目以便在不突破预算的情况下升级自己的数据中心。在最近三年的每一个季度里,这个数据中心组都有用一个周末的时间关闭服务器房间,用效率更高的设备更换一些老式的服务器和地板下面缠绕的网络电缆线,从而用较少的在天花板上布线的电缆线连接更强大的服务器。这种新的配置允许在这个房间里进行效率更高的冷却。

 

  这个结果是什么?PNNL把在500台服务器上运行的500个应用程序转变为在150台服务器上运行的800个应用程序。

 

  CIO.com的姊妹分析公司IDC的技术、金融和执行战略计划经理Joseph Pucciarelli说,在经济紧缩时期,实施这种信息技术项目需要严格控制钱袋的带子。他说,这种情况是很常见的。企业正在进行及时的投资。企业遇到一个问题,他们正在以克制的方式看待这个问题。

 

  下面是PNNL把数据中心从容量极限恢复到正常状态的过程中学到的一些教训。

 

  1.规划,不要做出反应

 

  Wescott要解决的第一个问题是数据中心组对发生的每一个小问题立即做出反应,而不是观察这个系统性的问题和创建一个计划以建立一个可持续的服务。除了这500台服务器之外,这个数据中心还有3.3万条电缆线连接这些服务以便进行供电、连接网络和安全系统。他说,我们确定这个数据中心应该是什么样子,应该是什么容量。

 

  这个小组的结论是,按照当前的轨道发展,这个数据中心在10年内将达到3000个应用程序,每个应用程序都在自己的服务器上运行。现在,这个数据中心的应用程序有81%都进行了虚拟化,每台服务器平均运行17个应用程序。Wescott计划把虚拟化的比例提高到90%.

 

  IDC的Pucciarelli说,企业应该把重点放在三个方面来提高容量。减少物理服务器的数量和在虚拟机上运行应用程序有助于减少电源需求,就像更有效的冷却系统和配电系统的改善所做的那样。这一般是更新数据中心的时候要做的三件事。

 

  Pucciarelli曾遇到许多企业用两台或者三台大容量系统替换50台服务器并且使用虚拟化允许自己的应用程序。

 

  2.管理措施

 

  PNNL的Wescott说,管理数据中心经理需要监视数据中心状态的方法,但是,他们经常没有合适的工具。在改变之前,PNNL没有办法衡量自己的数据中心的效率。当房间黑了时候,发现了电源问题或者通过更直觉的方式发现问题。他说,如果我们的电源线通过太多的电流,我发现的一个方法就是把手放在断路开关上,如果感觉发热,我就知道遇到问题了。这表明你现在需要工具。现在,PNNL在每一排的第四台服务器的底部、中部和顶部都配置了一个传感器以创建一个服务器机房的3D热量图。这个数据能够让Wescott改变他冷却数据中心的方式,提高整个温度和把冷却应用到你需要冷却的地方。

 

  Wescott说,我认为那将为我节省许多钱,减少空调的磨损。他现在预计数据中心的冷却效率提高了40%以上。

 

  3.采取小的步骤

 

  Wescott说,在不中断运营的情况下彻底重新设置数据中心是一个大问题。数据中心经理主张采取小步骤以最大限度减少中断,但是,把这个决定留给他的经理。

公司名称:六安市金狮网络技术有限公司
公司地址:安徽省六安市金安区皖西大道红叶大厦802A
联系电话:0564-3214800 手机:13956148092 邮箱:120907442@qq.com QQ:120907442 / 1099497647
手机访问