使用 Prometheus、Grafana 和機器學習實現 AIOps培訓

Prometheus 和 Grafana 是現代基礎設施可觀測性領域廣泛採用的工具。機器學習則透過預測性和智能洞察增強這些工具，從而自動化操作決策。

本課程為講師主導的現場培訓（線上或線下），旨在幫助具備中級技能的可觀測性專業人員，通過整合 AIOps 實踐以及使用 Prometheus、Grafana 和機器學習技術，現代化其監控基礎設施。

完成本培訓後，參與者將能夠：

配置 Prometheus 和 Grafana 以實現系統和服務的可觀測性。
收集、存儲並可視化高質量的時間序列數據。
應用機器學習模型進行異常檢測和預測。
基於預測洞察構建智能警報規則。

課程形式

互動式講座與討論。
大量的練習與實操。
在實驗環境中進行動手實施。

課程定制選項

如需請求本課程的定制培訓，請聯繫我們以安排。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

AIOps 與開源工具簡介

AIOps 概念及優勢概述
Prometheus 和 Grafana 在可觀測性堆棧中的角色
機器學習如何融入 AIOps：預測性分析 vs. 響應式分析

設置 Prometheus 和 Grafana

安裝並配置 Prometheus 以收集時間序列數據
使用實時指標在 Grafana 中創建儀表板
探索 Exporters、重新標記和服務發現

機器學習的數據預處理

提取和轉換 Prometheus 指標
準備用於異常檢測和預測的數據集
使用 Grafana 的轉換功能或 Python 管道

應用機器學習進行異常檢測

用於離群點檢測的基本機器學習模型（例如，孤立森林、單類 SVM）
在時間序列數據上訓練和評估模型
在 Grafana 儀表板中可視化異常

使用機器學習進行指標預測

構建簡單的預測模型（ARIMA, Prophet, LSTM 入門）
預測系統負載或資源使用情况
利用預測結果進行早期警報和擴展決策

將機器學習與警報和自動化整合

基於機器學習輸出或閾值定義警報規則
使用 Alertmanager 和通知路由
在檢測到異常時觸發腳本或自動化工作流

擴展和操作化 AIOps

整合外部可觀測性工具（例如，ELK 堆棧, Moogsoft, Dynatrace）
在可觀測性管道中操作化機器學習模型
大規模應用 AIOps 的最佳實踐

總結與後續步驟

最低要求

理解系統監控和可觀測性概念
具有使用 Grafana 或 Prometheus 的經驗
熟悉 Python 及基本機器學習原理

目標受眾

可觀測性工程師
基礎設施和 DevOps 團隊
監控平台架構師和站點可靠性工程師 (SRE)

14 小時

需要幫助選擇合適的課程嗎？
macao@nobleprog.com 或 +852 81990613

AIOps 實戰：事件預測與根本原因自動化

14 小時

AIOps基礎知識：監控、關聯與智能告警

14 小時

使用開源工具構建 AIOps 數據處理流程

14 小時

企業級 AIOps 解決方案：結合 Splunk、Moogsoft 與 Dynatrace

14 小時

使用 Prometheus、Grafana 和機器學習實現 AIOps培訓

課程簡介

最低要求

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

使用 Prometheus、Grafana 和機器學習實現 AIOps培訓

課程簡介

最低要求

相關課程

AIOps 實戰：事件預測與根本原因自動化

AIOps基礎知識：監控、關聯與智能告警

使用開源工具構建 AIOps 數據處理流程

企業級 AIOps 解決方案：結合 Splunk、Moogsoft 與 Dynatrace

課程分類

AIOps

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites