勵志

勵志人生知識庫

什麼是事件管理

事件管理是一個多層次、跨領域的管理活動,它涉及多個行業和領域,包括但不限於政府和非政府機構的政治經濟活動、體育賽事、主題旅遊、會議會展、娛樂狂歡等。在ITDevOps領域,事件管理是回響和解決可能影響服務質量或服務運營的計劃外事件的過程,旨在識別和糾正問題,同時保持正常服務並最大限度地減少對業務的影響。

事件管理包括以下幾個關鍵要素:

監控:作為事件管理過程的第一部分,監控可以協助管理人員發現系統中的問題,並從最終用戶處驗證該問題。

值守計劃:值守是指既定的團隊成員能夠在既定的時間內回響各種警報,確保在發生事件時,有人能夠及時回響,隨時介入和處理各種緊急情況。

警報:在發現了事件後,監控器該如何傳遞給處於值守狀態的回響團隊呢?在此,事件警報流程便可確保在正確的時間、系統以正確的方式、向正確的人員發出警報。

事件管理的目標是檢測並記錄這些事務狀態的變更,以便獲得對業務風險和商業機會的完全可見性。例如:用戶登錄,轉賬失敗,業務系統版本升級,數據備份,伺服器維護完成,這些都是團隊需要跟蹤的變更。隨著商業模式和IT支撐環境複雜性的增加,團隊需要管理的事件規模也呈指數級增長,但管理事件的人員數量卻沒有得到增加。現在,許多團隊每天都在和成千上萬甚至數百萬事件打交道,受限於資源投入,幾乎不可能有效地將高價值信息與噪音從海量事件中分離出來,以洞察風險和機會。而這正是事件管理解決方案的核心能力所在。