環(huán)球最資訊丨Microsoft 365 全球宕機(jī)5小時(shí),竟是路由器的鍋

發(fā)布時(shí)間:2023-01-31 05:39:55  |  來源:騰訊網(wǎng)  

據(jù)披露,長(zhǎng)達(dá)五小時(shí)的 Microsoft 365 全球中斷是一個(gè)路由器 IP 地址變化,致其廣域網(wǎng)(WAN)中所有其它路由器之間的數(shù)據(jù)包轉(zhuǎn)發(fā)問題引起。

2023 年 1 月 25日,Microsoft Teams、Outlook、Xbox 和其它 Microsoft365 服務(wù)均出現(xiàn)不同程度中斷、延遲的現(xiàn)象,主要影響亞洲和歐洲用戶,引起業(yè)內(nèi)廣泛關(guān)注。微軟接到客戶報(bào)告后立刻展開調(diào)查,并組織技術(shù)專家修復(fù)程序,排除故障以使服務(wù)恢復(fù)在線。


(相關(guān)資料圖)

隨著事故發(fā)展,微軟 365 團(tuán)隊(duì)在社交媒體上表示其發(fā)現(xiàn)一個(gè)潛在網(wǎng)絡(luò)問題,并正在審查遙測(cè)技術(shù)以確定下一步的故障排除步驟。目前,微軟已將服務(wù)中斷問題與網(wǎng)絡(luò)配置問題隔離開來,正在分析解決這些問題的最佳緩解策略,力爭(zhēng)不會(huì)造成額外影響。

微軟多個(gè)服務(wù)受到中斷影響

根據(jù) Redmond 的說法,受影響用戶可能無法訪問有問題的 Microsoft 365 服務(wù)。此次中斷影響的服務(wù)清單主要包括:

Microsoft Teams、Exchange Online、Outlook、SharePoint Online、OneDrive for Business、PowerBi、Microsoft 365 Admin Center、Microsoft Graph、Microsoft Intune、Microsoft Defender for Cloud Apps和Microsoft Defender for Identity。

Azure 團(tuán)隊(duì)在 Microsoft Azure 服務(wù)狀態(tài)頁上強(qiáng)調(diào),技術(shù)團(tuán)隊(duì)已經(jīng)確定網(wǎng)絡(luò)連接問題發(fā)生在微軟廣域網(wǎng)(WAN)設(shè)備上,這主要影響到互聯(lián)網(wǎng)客戶與 Azure 之間的連接、ExpressRoute 連接以及數(shù)據(jù)中心服務(wù)之間的連接。

服務(wù)器中斷問題正在造成一波波影響,大約每 30 分鐘達(dá)到峰值。此外,一些客戶在加載 Microsoft Azure 狀態(tài)頁面時(shí)同樣會(huì)遇到問題,該頁面間歇性顯示“504網(wǎng)關(guān)超時(shí)”錯(cuò)誤。目前微軟內(nèi)部技術(shù)團(tuán)隊(duì)正在展開積極調(diào)查,一旦有更多消息,會(huì)立刻分享給大眾。

隨著調(diào)查深入,Azure 團(tuán)隊(duì)發(fā)現(xiàn)此次故障背后的根本原因是微軟廣域網(wǎng)(WAN)的近期更新,目前微軟已采取措施回滾這一更新。值得一提的是,微軟強(qiáng)調(diào)最新遙測(cè)顯示多個(gè)地區(qū)和服務(wù)都有恢復(fù)的跡象,正在繼續(xù)積極監(jiān)測(cè),可以確認(rèn)受影響的服務(wù)已經(jīng)開始慢慢恢復(fù)并保持穩(wěn)定。

Microsoft 365 全球中斷由某個(gè)路由器 IP 變化引起

經(jīng)調(diào)查分析,微軟最后確認(rèn)長(zhǎng)達(dá)五小時(shí)的 Microsoft 365 全球中斷是路由器 IP 地址更改所致,該更改引起了其廣域網(wǎng)(WAN)中所有其它路由器之間的數(shù)據(jù)包轉(zhuǎn)發(fā)問題。

Redmond 對(duì)事件調(diào)查后表示全球性中斷是由 WAN 更新導(dǎo)致的 DNS 和 WAN 網(wǎng)絡(luò)配置問題造成的,許多用戶在訪問受影響的 Microsoft 365 服務(wù)時(shí)都遇到了問題。微軟透露,服務(wù)器中斷問題是在使用未經(jīng)徹底審查的命令更改 WAN 路由器的 IP 地址時(shí)引發(fā)的,該命令在不同網(wǎng)絡(luò)設(shè)備上具有不同的行為。作為更新 WAN 路由器上 IP 地址的計(jì)劃更改的一部分,向路由器發(fā)出的命令使其向 WAN 中的所有其它由器發(fā)送消息,這導(dǎo)致所有路由器重新計(jì)算其鄰接表和轉(zhuǎn)發(fā)表。

在重新計(jì)算過程中,路由器無法正確轉(zhuǎn)發(fā)通過它們的數(shù)據(jù)包 當(dāng)網(wǎng)絡(luò)從 UTC 08:10 開始自行恢復(fù)時(shí),負(fù)責(zé)維護(hù)廣域網(wǎng)(WAN)運(yùn)行狀況的自動(dòng)化系統(tǒng)由于網(wǎng)絡(luò)受到影響而暫停。這些系統(tǒng)包括識(shí)別和消除不健康設(shè)備的系統(tǒng),以及優(yōu)化網(wǎng)絡(luò)數(shù)據(jù)流的流量工程系統(tǒng)。

由于暫停,一些網(wǎng)絡(luò)路徑從 UTC 9 時(shí) 35 分開始繼續(xù)“歷經(jīng)”數(shù)據(jù)包丟失增加,直到手動(dòng)重新啟動(dòng)系統(tǒng),使WAN 恢復(fù)到最佳運(yùn)行狀態(tài),并在 UTC 12 時(shí) 43 分完成恢復(fù)過程。

特別強(qiáng)調(diào)的是,從 UTC 上午 7:05 開始調(diào)查,到 UTC 下午 12:43 恢復(fù)服務(wù),Redmond 僅花費(fèi)五個(gè)多小時(shí)就解決了服務(wù)中斷問題。

服務(wù)器中斷事件后,微軟表示正在阻止執(zhí)行具有高度影響力的命令,并且還將要求所有命令執(zhí)行都遵循安全配置更改的指導(dǎo)原則。

關(guān)鍵詞: Microsoft 全球宕機(jī)5小時(shí) 竟是路由器的鍋

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com