亚马逊云服务再次遭雷击中断
燕麦云   2012-07-05

因雷击等恶劣天气引起断电而导致Amazon亚马逊云服务在6月份出现第二次服务中断事故。

亚马逊云服务遭雷击中断

6月29日,由于肆虐美国东部的暴风雨天气,亚马逊位于佛吉尼亚北部的数据中心被雷击第二次出现故障,导致亚马逊云服务瘫痪,停摆的云服务有:弹性云计算、弹性缓存服务、弹性MapReduce服务、关系数据库服务。受此影响,包括Instagram、Foursquare、Netflix、Pinterest等多个移动社交应用长时间中断服务,很多人体会到了一种有话说不出、有劲使不上的憋屈感。(AWS上次的服务中断发生在6月14日)

我就住在一个更大云计算数据中心几公里之外,这场暴风雨影响确实很严重。该地区的很多人都在等待供电恢复,而我决定打开门,坐上车,出去兜风,呼吸新鲜空气,度过了一个愉快的周末。

尽管断网主要归咎于恶劣天气,亚马逊对于服务中断却没有很站得住脚的理由。毕竟该地区大部分其他的云服务提供商就能提供持续的服务。在大西洋中部地区出现有威力的风暴还是比较常见的,所以部署数据中心时就应该考虑到这一点而提供持续性的服务。

相关人员应该好好研究问题出现的原因,制定出应对断电故障和其他常见天气问题的有效机制。断电绝不能成为造成服务中断的原因。

我常常是为出现服务事故的云服务提供商辩护的,大部分情况下他们出现宕机的事故是比其他的数据中心少的。但是最近AWS 的几次事故都有些出入意料。通过适当的规划和恰当的科技投资,我们还是有技术和能力避免损失的。

这里,我不得不总结一个悲剧性的结论,或许客户应该选择有竞争对手的云计算平台来降低风险。

本文来源InfoWorldFollow @DavidLinthicum,由OATOS企业云应用编译。