Monitoring linux – 1. SNMP

Když už dojde k tomu neštěstí, že někde máte Linux server, tak je dobrý ho nějak monitorovat (btw docela je sranda koukat na fóra obhájců tohoto OS, jak jsou sami nešťastní, že i ten hrozný Windows je přes WMI schopen jednoduše napráskat na sebe celkem všechno, tak u Linux je to boj, kdy každá distrubuce a dokonce i jednotlivé verze distribuce nemají stejná OID)

První, co člověka napadne je SNMP (rovnou řeknu že je slepá větev a nedoporučuji). Popíši zde nějáké poznámky z boje na distribuci Centos 7.

Instalace:

yum install net-snmp net-snmp-libs net-snmp-utils
systemctl start snmpd.service
systemctl enable snmpd.service
iptables -I INPUT -p udp --dport 161 -j ACCEPT
iptables-save

Konfigurace snmpd.conf:

//tohle byla celkem bolest, popis jak co nastavit opravdu borci od linuxů nevychytali

# cat /etc/snmp/snmpd.conf | grep -v "#"
com2sec notConfigUser  default       NastavCommunityString
group   notConfigGroup v2c           notConfigUser
access  notConfigGroup ""      any       noauth    exact  all  none none
view all    included  .1                               80
syslocation Unknown (edit /etc/snmp/snmpd.conf)
syscontact Root  (configure /etc/snmp/snmp.local.conf)

Example 1. (performance):

// opět zřejmě borci od linux nemají problém s časem a nepříjde jim úchylný, aby se každý prokousal MIB fajlama sám, ale zase jsem našel nějaká vodítka na forech , oni různé monitoravací SW (PRTG, Grafana,..) ví asi moc dobře, proč si instalují do linuxu vlastní fíčuru na monitoring via SNMP…

Já jsem zvolil tyto:

CPU 1min
.1.3.6.1.4.1.2021.10.1.3.1
Network bond0
in
1.3.6.1.2.1.31.1.1.1.6.8
out
1.3.6.1.2.1.31.1.1.1.10.8
ssIORawSent – Number of blocks sent to a block device
.1.3.6.1.4.1.2021.11.57.0
ssIORawReceived – Number of blocks received from a block device
.1.3.6.1.4.1.2021.11.58.0
RAM used
.1.3.6.1.4.1.2021.4.6.0

//z toho se ukázalo, že jak network, tak počty bloků jsou přírustkové, takže nepoužitelné a RAM used ukazovala divný hodnoty, které určitě nebyly rozdílem Total a FREE?!

EXAMPLE 2. (free space/used na disku):

Chtěl jsem ještě pomocí SNMP zjišťovat kolik mi zbývá volného místa na disku, tak jsem to vychytal, ale nakonec nepoužil a každopádné když už jsem se s tím pachtil, tak to přidávám (jen je to v blocích, takže hodnota je potřeba násobit 4x, jak je vidět z druhého obrázku:

Závěrem

Ne, nejde to, to fakt nedávám, některý hodnoty (latency do disků) to vůbec neumí, jiné bych musel stále přepočítávat, některé hodnoty při stejném popisu, ale s jiným OID dávají různé hodnoty,… Zbaběle jsem SNMP možnost zcela zavrhl a zvolil jinou variantu (sar)

About Author:

Error! Keyboard not detected. Press any key to continue.