Monitoring
Z VirtlabWiki
(Rozdíly mezi verzemi)
Verze z 14:45, 3. 10. 2008 Gry72 (Diskuse | příspěvky) ← Předchozí porovnání |
Verze z 14:46, 3. 10. 2008 Gry72 (Diskuse | příspěvky) (→e-mailový hlídač Syslogu) Následující porovnání → |
||
Řádka 9: | Řádka 9: | ||
PHPMyAdmin: [https://virtlab.cs.vsb.cz/phpmyadmin Ostrava], [https://virtlab.opf.slu.cz/phpmyadmin Karviná] | PHPMyAdmin: [https://virtlab.cs.vsb.cz/phpmyadmin Ostrava], [https://virtlab.opf.slu.cz/phpmyadmin Karviná] | ||
- | == e-mailový hlídač Syslogu == | + | == e-mailový hlídač/agregátor Syslogu == |
* CRON v Ostravě i Karviné | * CRON v Ostravě i Karviné | ||
* 3.minutu v kazde hodine se spousti testsrv.php | * 3.minutu v kazde hodine se spousti testsrv.php | ||
- | * Posila se to kazdou hodinu a to v 6.minute | + | * Agregaovane info za posledni hodinu ze Syslogu se posila kazdou hodinu v 6.minute |
=== Zabbix === | === Zabbix === |
Verze z 14:46, 3. 10. 2008
monitor.dvirtlab.net
https://monitor.dvirtlab.net/ (heslo do SVN)
Postaru:
Stav serverů: Ostrava, Karviná
e-mailový hlídač/agregátor Syslogu
- CRON v Ostravě i Karviné
- 3.minutu v kazde hodine se spousti testsrv.php
- Agregaovane info za posledni hodinu ze Syslogu se posila kazdou hodinu v 6.minute
Zabbix
Po přihlášení viz
- Events (all)
- Availability (Virtlab sites events)
- Daily availability graph (Virtlab sites)
- Virtlab Karvina - availaility graph
Jsou tri druhy pingu ktere se delaji: ping co umi jen 0 a 1, odezva v sec a packetloss. Ping 0/1 se dela co 30 sec, zbytek co 300 sec. Jsou maximalne 3 dny historie. Zpetne se pak zachovavaji 351 dni pouze alerty, tedy stavy, kdy ty cislicka vyboci z povolenych mezi. Coz vicemene staci (na vypocet SLA, apod).
Private:Zabbix - správce a účty
Na mape propojeni Virtlabu vsb-opf jsou veskere spoje jsou brany ze smeru z VSB. Spoj hlasi chybu, pokud je nasledujici prvek neaktivni (napr. pokud nejede hned hlavni prvek na opf, tak spoj mezi virtlab.cs.vsb.cz a timto prvkem zcervena a tim oznami problem).
Co by se hodilo monitorovat
- Historie konektivity mezi Ova a Ka (rekneme 2x za minutu zkusit ping na virtlab.opf.slu.cz a virtlab.cs.vsb.cz, mezi nimi primo to asi nezkusime. Idealni by bylo, kdyby se nekde vynasel nejaky trendovy graf, na kterem bychom napr. zjistili, ze napr. konektivita v nejakem casovem intervalu 10 minut upadla (takze my za nic nemuzeme, kdyz po nas nekdo rve, ze se na Virtlab v te dobe nedostal). V idealnim pripade pri vypadcich konektivity vetsich nez rekneme 1h + po obnoveni poslat email na dvirtlab-admin@dvirtlab.net.
- Dostupnost jednotlivych softwarovych serveru (asi 5 komponent v Ove a v )Karvine. Vzdy jde o to napojit se na ne jejich CLI pres TCP a zkusit poslat prikaz exit - spojeni by se melo navazat a po exist zase ukoncit. Tohle by se dalo udelat treba 4x za hodinu. My bychom si pak jen do logu pridali podminku, ze pokud se takto pta vas zabbix z nejake (jake?) IP adresy, ani bychom to nelogovali, at si ty logy zbytecne nezacpavame.