
Google周二断线几乎两小时,Google周二晚间表示,问题主要出在系统容量计算出错。
Gmail断线时间约从北京时间今天(2日)凌晨3:30一直持续至凌晨5:30,影响了好几百万Gmail用户。而问题是出在典型的骨牌效应,亦即服务器因无法负荷流导致一一过载。
根据Google的说法,问题发生时,刚好有好几台Gmail服务器进行离线维护,这部分是例行工作,对用户原本不应该会产生影响的。只是阴错阳差,Google针对导引Gmail流量至服务器的路由器做了一些变更,希望能改善稳定性,不料就在这些变更上出了差错。
「依照目前的了解,我们低估了部分近期针对请求路由器(request routers)所做的改变(意在改善稳定性),这些路由器的功能是要把来自Web网路的检索导引至适当的Gmail服务器做反应。」Google在博客中表示。
「在今日凌晨三点半左右,部分请求服务器负载过重,因此向其他系统发出求救,要求"不要再继续把流量送过来,我们已经太慢了"。于是接下来的流量就自动转至其它的请求路由器,这些后来也跟着过载,」Google工程副总裁Ben Treynor表示。
Google后来把流量导引至其他网路,总算解决问题。但接下来呢?
Google表示,公司会确保未来请求路由器有足够的空间来处理尖峰需求,并找出方法让出问题的能被隔绝起来,不会拖累整个服务。
「我们未来几周会把这些事情通通修正,改善Gmail稳定性,让所有用户都能享受超过99.9%的稳定性,并确保今天这类事件能在未来降至最低。」Treynor表示。
Google今年花了不少时间和金钱,大力鼓吹Gmail可取代微软等公司的邮件客户端比如outlook等软件产品,这类「掉链」事件大概会让潜在客户有所犹豫。
via Techcrunch
本文链接: http://googlelabs.us/2009/09/02/gmail-went-down-because-of-capacity-calculation-mistakes/
订阅
当前没有评论!
第一个在本文留言。