NEIL's_學而時習之x不學無術~私藏IT技術經驗分享部落

關於部落格
NEIL. Cheng....寫作只是為了日後工作之備忘操作參考

本部落格文章撰寫前進邁向第五年(since 2009 ~至今)仍繼續推進分享IT學習!!About Windows/Linux Server,Virtualization


分享網誌: 由於,本人預先完成LAB後,才補上撰寫文章與截圖,若發現文圖對照說明有誤..本人將盡快校正,也請不吝指教! Thanks!

  • 153344

    累積人氣

  • 44

    今日人氣

    0

    訂閱人氣

網管人工作日誌: 監控機海利器 : Ganglia x Zabbix by Kazmir

 
主機預警偵測發送系統 Zabbix: 

個人認為Zabbix 安裝過程與配置比時下較夯的主機預警系統"Nagios" 配置上容易簡單,

偵測服務項次也不比Nagios 差(可Check 應用程式服務Windows IIS,MS SQL 資料庫健康狀態..等)


Web UI 介面設計個人認為 Zabbix  優於 Nagios , 當然搭建主機預警系統目的主要為了讓系統管理員

第一時間偵測主機服務掛點(EX:IIS Web),可提醒系統管理員做修復處理(Zabbix可設置SMS 或E-Mail 

發故障訊息告知 系統管理員)
<= 這也是本人測試Zabbix預警主要目的




安裝過程將略過(主要Show 展示成果): 請參考官方網站手冊佈建即可,不難,架構在LAMP平台上)

CentOS 6.4 (mail201) :

延續前幾篇環境架構(目前這台機器另搭載MailScanner+Postfix+Spamssassign) #測發Alert 訊息

zabbix version 2.2.0   #截至目前官網最新

被監控端(需要另安裝zabbix agents) : 本Lab 將監控Windows Base  平台

Windows Server 2012 (win2012:Active Directory): IP 192.168.11.210 

Windows  7  (Near-HP): IP 192.168.11.200 

-----


目前本人Zabbix Server 端已佈建好了: 現必須至官網下在 zabbix agents 

依序將其安裝/配置到 Windows  Server 2012 / Windows 7 平台上


 Zabbix 2.2.0 (stable) agents For Windows 版本下載請點我


<安裝Zabbix Agents :  以 Windows Server 2012 為例>

 Login: 登入網域


 
zabbix_agents_2.2.0.win.zip  

 #解壓縮ZIP 內部 bin/win64 檔案到"C:zabbix" 資料夾

 #本Lab 使用64 bit 系統,若你是選擇32 bit 系統請複製 bin/win32 內 檔案到"C:zabbix" 資料夾

 #請連conf 底下設定檔也複製到 "C:zabbix" 資料夾內"


  記事本編輯組態設定檔 C:zabbixzabbix_agentd.win.conf 

找到 "Server= ..." 這行 我們須將 zabbix server ip 修改為

"Server=192.168.11.201"  
#zabbix server

 => 儲存=> 離開    

PS: Zabbix Agent Default ListenPort=10050  需防火牆對外開放給zabbix server 存取



  
  開啟"命令提示字元" 我們將其服務(Zabbix Agents) 註冊/並將配置其啟動/開機自動Boot運作

  依序參考如下設定步驟


   我們日後也可以在  控制台/系統管理工具/服務  找到zabbix agent 服務

[回到Zabbix Server(mail201) 我們新增監控主機Windows Server 2012(win2012)]測試

 登入Zabbix Web UI :  http://192.168.11.201/zabbix/index.php  

 預設安裝完成後系統管理員 預設帳密 admin/admin 請登入後自行修改  




  Zabbix 界面總攬檢視:  



畫面往下拉,我們可以看到Neil 之前監測主機Windwos 7(Near-HP) 主機 出現警告訊息

的確本目前該台主機Space Disk 空間太少了些(因為都被本人拿去灌VM) ==|||


Free disk space is less than 20% on volume E:
Free disk space is less than 20% on volume D:




點選 工具列 "組態" / "主機"  => 創建主機  

#接下來我們要開始創建剛剛配置agnet端Win Server  2K12伺服器之監控


 主機的組態:   

主機名稱: Win2012
 
可見的名稱: Windows Server 2012

群組:   本人將其將入"Windows Server" 群組  
#可自訂新增群組名 

端點代理程式介面: 填入監控IP: 192.168.11.210 # 預設Port:10050

PS: Zabbix 另支援SNMP,JMX,IPMX 其他蒐集資料方式

狀態: 受監測中 

 


模板: 預設系統已存在 template for windows 模板

    但仍可支援外部擴充監測: template-IIS7 即是額外擴充匯入模板 

主機資產紀錄: Zabbix 亦支援主機資產紀錄管理/非常棒  => 接者我們"存檔" 離開


檢視偵測基礎訊息: 觸發器: 可以偵測到Windows Server 2012 目前存在問題資訊




  現在測試 模擬 Windows Server 2012  IIS 服務或掛點 沒啟動測試可否偵測到Web掛點?

  在我們關閉 IIS  服務後 , Zabbix 告知我們出現一條"嚴重"主機訊息 如下

  Zabbix可以觸發當此 IIS 服務故障後,發信給"系統管理員"做告知(被On Call 惡夢在此)

 
  Zabbix 亦提供一些About IIS 統計數據: 你可以在最新數據: 查得統計資訊(七項)

 IIS Current Anonymous Users

 IIS Current Connections

 IIS Current NonAnonymous Users

 IIS Get Requests/s

 IIS Head Requests/s

 IIS Post Requests/s

 Microsoft IIS: Service State

 

  ASP.NET 相關統計訊息   #五個監測指標

  ASP.Net Application Restarts

  ASP.Net Number of Current Requests

  ASP.Net Requests/Sec
 
  ASP.Net Total Errors

 ASP.Net Worker Process Restarts



 
圖形: 提供一些系統計數器數據統計圖形化檢視

切換 "監測/圖形" 頁面來看: 我們可以選擇Windows Server 群組 檢視需要觀看統計數據




以下圖為例: 我想要檢測: 特定磁區C:剩餘使用量 (使間點可切換)
 


以下圖為例: 檢視IIS Counter view & ASP.NET Request 




以下圖為例: 看CPU 平均負載值  




以下圖為例: 看記憶體使用率%

以下圖為例: 可各別看每張網卡 In / Out 統計數據,這很棒設計



[配置預警訊息告知] : 

切換"管理/用戶群組"=> "創建用戶群組 " 我們將配置系統 "用戶/群組" 


    用戶群組: 群組名稱: C1_Neil   
  許可權:  讀寫: windows server   =>  存檔(離開)
  


Then 接下來我們需要創建新用戶加入方才創建好的"C1_neil group"

一樣  
切換"管理/用戶"=> "創建用戶 "

用戶群組: 選擇 "C1_Neil"



   用戶:  填寫用戶端登入Zabbix 訊息 帳戶/密碼/群組 , 登入後語系介面..等等


  示警媒介: 這裡我們要填寫 寄發警訊給該使用者接收E-MAIL帳戶
                 
                 當作用中時: 預設7x24 監控

                 我要收發"警訊" 訊息=> 如果標示"嚴重" 請發信給我告知

                 狀態: 啟用  

  

   許可權:  主機群組: Windows Servers  (讀寫) 因我們稍早已將其用戶加入

               C1_neil 群組: " Windows Servers " 故權限將繼承在此可檢視 => "存檔離開"



以上用戶端帳戶與發Mail配置已完成: 我們將配置Zabbix 預設SMTP 發信主機配置(透過此主機發信)

切換 "管理/示警媒介類型" => 選擇"創建示警媒介類型"

 填寫您企業發信SMTP 主機訊息參考如下


  #延續前幾篇LAB我們依舊使用mail201.neil0918u.com  當SMTP Host => 存檔(離開)



動作:  最後配置階段及時觸發時"動作"行為設定

切換"組態/動作" 頁面  => 創建動作


   動作: 

   名稱: Send Alart to Admin  , 預設主旨&預設訊息 (可客製化修改)

    若需要知道服務被修復後再次發送"恢復通知" 可勾選"恢戶訊息"



條件:  多個條件可選擇 且/或 計算方式: 以下範例為例(選且表示兩個條件都要符合)

          觸發器=問題

          觸發器名稱=嚴重



操作: 配置警訊發送間隔時間(秒) 發警訊給那些人(群組/用戶) 

預設操作停留時間: 60 秒 (可設定發送次數及尖閣)

操作類型: 發送訊息 ; 支援發送到用戶群組(加入C1_Neil) 

僅送到: Send Mail to Neil
 
條件: 非知悉  => 更新=>存檔=>離開

測試IIS 8 故障 驗證警訊發送: 

關閉II8 服務如下圖:


  儀表版上偵測IIS 異常 狀態出現

客戶端偵測收發警告信: 告知IIS 訊息掛點

Trigger: Microsoft IIS W3SVC Not Running
Trigger status: PROBLEM
Trigger severity: High
Trigger URL:

Item values:

1. Microsoft IIS: Service State (Windows Server 2012:service_state[W3SVC]): 6
2. *UNKNOWN* (*UNKNOWN*:*UNKNOWN*): *UNKNOWN*
3. *UNKNOWN* (*UNKNOWN*:*UNKNOWN*): *UNKNOWN*

Original event ID: 278



然而在Zabbix動作窗格:   到目前為止警訊系統演示警報發送目的以達陣

我們可以看到"發警訊動作已生效: 每隔六十秒來擾亂MIS 人員來警急修復處理(On Call 人的惡夢)

相簿設定
標籤設定
相簿狀態