当前位置: 首页 > 业界动态 > 技术评论 > 本文


宕机之殇:2012年数据中心事故总览




发布时间: 2012-11-22 8:53:00  
    尽管投入各种高新复杂技术,尽管投入海量巨资,云计算还是显得有些脆弱,在过去的几年里不乏动辄就宕机数小时的事件,甚至有的长达一天或数天,并导致数据丢失。

  以下是本年度云服务宕机事件一览:

 

  微软Azure
  2012年,云服务的中断屡屡让提供商们尴尬不已,Thinkstrategies创始人Jeff Kaplan给了一些关于云计算的永不过时的简单建议。

  2月28日,由于“闰年bug”导致微软Azure在全球范围内大面积服务中断,中断时间超过24小时。

  微软表示该软件BUG是由于闰年时间计算不正确导致。

  这一事件激起了许多用户的强烈反应,许多人要求微软为此做出更合理详细的解释。

 

  亚马逊AWS
  6月15日,亚马逊北维吉尼亚的数据中心遭遇停电,由此导致亚马逊网络服务AWS中断约6个小时,影响波及亚马逊弹性计算EC2、亚马逊关系数据库服务以及亚马逊弹性魔豆AWS Elastic Beanstalk。

  北维吉尼亚数据中心是亚马逊使用最久的数据中心,在2011年以及今年10月都曾发生过宕机事故,导致用户信心流失不少。

  对于亚马逊的有些合作伙伴来说,这种状况往往会拖后腿。

  “我很喜欢亚马逊,但是宕机的时候也真是无能为力,尽管我也知道传统IT数据中心也会遇到这种情况”,Stratalux公司CEO Jeremy说。中断事故导致了他的一位客户服务中断了1个小时。

 

  微软Windows Azure再次宕机
  7月26日,Azure故障,导致西欧用户受影响。微软对故障的解释是“由于错误配置了网络设备导致了西欧区域的服务网络中断”。

  此次中断持续2.5小时。微软表示此次事故中并无用户数据丢失。

 

  Google Talk
  在微软Azure宕机的同一天,Google Gmail用户使用的Gtalk中断了近5小时。

  Gtalk服务的控制面板页为用户提供了因服务中断所导致的升级。Google对此也做出了道歉“请相信google是极度重视系统可靠性的,我们会更加注意提升我们系统的性能”。

 

  GoDaddy
  9月11日,网络托管和电子邮件服务提供商GoDaddy遭遇6小时服务中断,原因是网络故障,起先怀疑是著名黑客组织Anonymous所为,但该组织予以了否认。

  该公司称中断的原因是由于内部网络故障导致路由表错误。

  在10月上旬,GoDaddy宣布他们计划关闭其云服务业务,其SMB将会整合到其他服务里。

 

  又是亚马逊AWS
  10月22日,位于北维吉尼亚的亚马逊网络服务AWS又挂了,影响了包括Reddit、Pinterest等知名大网站。

  中断影响了弹性魔豆服务,其后是弹性魔豆服务的控制台,关系数据库服务,弹性缓存,弹性计算云EC2,以及云搜索。

  这次事故让很多人认为,亚马逊是应该升级其北维尼吉亚数据中心的基础设施了。

 

  Google App Engine
  GAE是用于开发和托管WEB应用程序的平台,数据中心由google管理,中断时间是10月26日,持续4小时,因为突然变得反应缓慢,而且出错。受此影响,50%的GAE请求均失败。

  google表示没有数据丢失,应用程序行为也有备份可以还原。为表歉意,google宣布11月份用户可以

  google表示他们正在加强其网络服务以应对网络延迟问题,“我们已经增强了流量路由能力,并调整了配置,这些将会有效防止此类问题再次发生”。

  在google服务故障的当天,Dropbox和Tumblr也发生了服务中断。不过并未找到三者之间存在的关系。

 

  Tumblr
  GAE中断的当天,著名微博客平台和社交网站Tumblr也发生故障。几小时后修复,该公司也称将会发布详细的事故报告。

  但此后他们尚未做出进一步的解释。

 

  Dropbox
  10月26日,在线存储公司Dropbox也发生服务中断。

  当时网站显示错误信息“抱歉,网站出问题了,不过请勿担心,数据都很安全,我们也在尽快修复。”

  此后他们也并未做出进一步的解释。

    本文来源:硅谷动力

 

    相关文章推荐:宕机弱爆了!安全可靠成云服务迫切需求

分享到:
阅读:1157次
推荐阅读:

版权所有 © 2011-2016 南京云创大数据科技股份有限公司(股票代码:835305), 保留一切权利。(苏ICP备11060547号-1)  
云创大数据-领先的云存储、大数据、云计算产品供应商