看这些数据中心错误有多蠢!

51CTO 发表于:10年08月18日 11:35 [转载] 51CTO

  • 分享:
[导读]在导致数据中心故障的所有罪魁祸首中,技术问题所占比例很小,而人为错误却占据了大约70%的份额。
存在两年之久的"洞"

有时候数据中心中的某些事故注定早晚会发生,但每天在那儿工作的人却又对它熟视无睹,而新来的人却往往能立刻发现它们。

艾德·古尔德(EdGould)是一名退休的IT从业人员,在20世纪80年代曾就职于芝加哥一家安全公司担任系统程序员。他入职一个月后,发现了公司数据中心存在的一个明显的威胁。

在该公司,程序员一般会把磁带交给数据中心运营人员,然后由后者安装到机房中。有一天运营人员工作比较繁忙,无法安装古尔德交给他们的磁带,因此古尔德决定自己去安装。他刚进入数据中心没走几步,就掉到一个约两英寸半深、比萨饼大小的坑中,随后运营人员把他拉起来。他问运营人员为什么会在地板上有这样一个洞。运营人员表示,这个洞两年前就有了,他们自己已经习惯了它的存在,因为熟知它的位置所以不会掉下去。

后来古尔德把此事汇报给一位副总,然后到医院检查了一下身体。这位副总也是第一次知道该"洞"的存在,并在几天内对其进行了修复。

令古尔德感到惊讶的是,数据中心内的这个威胁竟然一直存在了如此长时间,而在这儿工作的人员却对其熟视无睹,只是选择绕着它走。

类似人祸行为

数据中心中由人为错误引发的事故举不胜举,在国外知名IT网站《ComputerWorld》的SharkTank专栏中,IT管理者们已经发表了数百个此类案例。

美国阿瑞桑那州一家空军基地的工程师约翰·艾尔(JohnEyre)表示,20世界80年代中期,该基地需要为新添置的王安电脑安装新线缆,每台计算机需要通过同轴电缆连接到终端,厂商推荐使用两英寸管道来传输线缆。

艾尔认为该管道不足以容纳所使用线缆,但由于它是王安电脑公司所推荐的,艾尔的领导还是决定按厂商建议来做。

当所有线缆被铺设好后管理者发现,在每处使用该管道传输线缆的地方,线缆都已经裸露出铜芯,无法继续使用。整个线路安装工作不得不重新进行,导致整个工期延迟了9个月之久。

艾尔表示,由此事件得到一个教训是,欲速则不达,一味求快反而引发重重问题。

另外一个例子是,在某数据中心,由于有人将温控器的温度单位由华氏温标改成了摄氏温标,因此在64摄氏温度下,服务器机房简直就变成了一个蒸笼。

[责任编辑:査彬]
Doserv原创 Vicky Z
纵观IT发展的历程,我们发现IT技术从最早的分布式结构走向了大集中的架构,而今,云计算的出现又将IT重新引向了分布式的老路。
官方微信
weixin
精彩专题更多
联想发布“腾云计划”正式进入云市场,同时推出ThinkServer Gen5,在众说纷“云”的云时代里联想推出云战略正当其时,服务器产品线的更新便是联想云时代里前行的新生力量。
2014年11月6号,HPC China 2014大会在广州长隆酒店正式召开。本次会议由中国计算机学会主板,中国计算机学会高性能计算专业委员会、中山大学和广东工业大学承办。
思科UCS:突破性能极限 重新定义平台
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.