首页 云计算 正文
  • 本文约854字,阅读需4分钟
  • 2511
  • 0

微软云服务 三天发生了两次严重全球性宕机事故

摘要

日前,微软一些云产品三天内发生两次严重全球性的宕机事故,涉及产品有微软Office365和Microsoft Exchange等。

日前,微软一些云产品三天内发生两次严重全球性的宕机事故,涉及产品有微软Office365和Microsoft Exchange等。

据悉,2020年09月29日,微软 Office365 办公软件和Azure云产品出现宕机故障,导致部分用户服务中断五个小时。

故障涉及Outlook电邮服务和Teams办公协作工具部分用户,导致部分用户无法登录这些服务,已登录用户不受影响。

这一故障导致多个服务在全球地区范围内不可用,从微软Teams到Azure,大部分的 Microsoft 365服务都存在问题。

Power Platform和PowerApps 属性也受到该故障的影响,而有Azure云计算用户反馈称当日也遭遇了类似故障问题。

微软最初表示,导致该故障的原因和近一次软件调整有关并已恢复至旧版本,但后来却称该修复未让服务恢复正常。

微软云服务 三天发生了两次严重全球性宕机事故

三天后,有用户报告称无法访问Microsoft Exchange服务,三天发生两次事故导致人们猜测微软存在DevOps 问题。

根据微软官方公布的相关事故数据来看,美国和澳大利亚是此次事故的重灾区,美国只有17%的用户能够成功登录。

事故发生于2020年09月28日约21:25UTC至2020年09月29日00:23UTC期间,第二天02:25所有问题得以完全缓解。

期间,所有依赖Azure活动目录(Azure AD)进行身份验证的微软和第三方应用和服务执行身份验证操作时遇到错误。

一些人士猜测这些持续的宕机事故是推送软件更新导致的,微软却在官方声明中辩解称,没有云供应商能免于停机。

目前,微软公布了相关事故调查进展,是由于服务更新造成的,简单来说由于SDP潜在代码缺陷导致服务错误部署。

该更新原针对内部验证测试通道,但Azure AD后端服务安全部署过程系统潜在代码缺陷导致更新部署到了生产环境。

由于微软在SDP系统中的潜伏缺陷破坏了部署元数据,导致更新无法回滚且必须手动回滚,这让问题变得非常复杂。

因此微软向受影响的用户道歉,表示他们会采取措施改进相关流程、增加保护措施,保证未来不会再发生类似事件。

评论
更换验证码
友情链接