亚马逊网络服务(AWS)在接下来的工作周前的周日晚上没有放松,其主要的美国东部1区的EC2实例陷入困境。而且,截至周一早上的PDT,一些用户仍在报告问题,尽管AWS状态页面现在报告“问题已完全解决,服务正常运行。”
这一切都是在PDT 20:11开始的,当时AWS状态页面宣布平台在其主可用性区域的性能降级。“受影响的可用性区域内使用EBS卷的现有EC2实例也可能因附加的EBS卷的IO卡滞而受到损害,”30分钟后的一则通知说。
“受影响的可用性区域内新启动的EC2实例可能因卷性能降级而无法启动。“
太平洋夏令时21时47分,美国焊接学会表示,故障是亚马逊弹性区块存储超载,客户应该“故障”到另一个可用区域
“我们继续在确定导致单个可用性区域(USE1-AZ2)中某些EBS卷性能下降的问题的根本原因方面取得进展。”在US-EAST-1地区。我们已经做了一些更改,以解决负责将存储主机与EBS服务协调的子系统中不断增加的资源争用问题,”PDT 22:16的通知说
“虽然这些变化带来了一些改善,但我们还没有看到受影响的EBS卷完全恢复。”
在接下来的25分钟后,AWS表示其缓解措施已经奏效,正在完全部署,EBS卷应该在接下来的一个小时内恢复正常。
在最终报告中,美国焊接学会报道,时间是凌晨4:21“该问题是由负责协调EBS存储主机的EBS子系统内资源争用加剧引起的。工程部致力于确定根本原因并解决受影响子系统内的问题。PDT晚上11:20,在将更新部署到受影响的子系统后,受影响EBS卷的IO性能开始恢复到正常水平。截至9月27日上午12时05分,USE1-AZ2可用性区域中绝大多数受影响的EBS卷的IO性能正常运行。但是,从太平洋夏令时12:12开始,我们看到受影响的一组较小的EBS卷的恢复速度变慢,并且USE1-AZ2可用性区域中的少量附加卷的性能下降。”
AWS继续,“工程部调查了根本原因,并采取了相应的缓解措施,以恢复剩余受影响EBS卷的性能。这些缓解措施慢慢提高了其余较小受影响EBS卷集的性能,在PDT凌晨3:45恢复了完整操作。虽然几乎所有的EBS卷都已完全恢复,但我们仍在继续恢复剩余的一小部分EBS卷。我们将通过Personal Health Dashboard传达这些卷的恢复状态。虽然大多数受影响的服务已完全恢复,但我们仍在继续恢复一些服务,包括RDS数据库和Elasticache群集。我们还将通过个人健康仪表板传达这些服务的恢复状态。”
当AWS遇到问题时,其他网站也受到性能问题的影响。
“各位,抓紧!由于主机中断影响了我们的部分服务,信号当前处于关闭状态。我们正在努力让它恢复,”消息服务推特说。
Nest说它的用户登录有问题,但问题已经解决。
在撰写本文时,Xero说它的速度很慢。
总而言之,正如Thaddeus E.Grugq在推特上咆哮的那样,“互联网是为在核战争中生存而设计的,不要往下掉。“
美国东部夏令时9月27日上午10点更新:增加了进一步的状态更新。
澳大利亚人每月因密码诈骗损失超过660万澳元
恼怒的安全研究员找到了让苹果说话的方法,删除三个iOS漏洞
电信公司首席执行官呼吁NBN的社会责任感来解除CVC锁定
RCE回来了:vCenter Server中的VMware详细信息文件上载漏洞