Skip links

Colavincenzo, da Kelyon al Garr 2010 di Torino

Complimenti al nostro Antonio Colavicenzo, che ha tenuto alto il nome di Kelyon alla Conferenza "GARR 2010", tenutasi a Torino lo scorso 27 ottobre.

 

Antonio, collaboratore di KELYON, ha presentato il paper "Utilizzo di Zabbix per il monitoring di risorse di calcolo e sistemi di storage su WAN in ambito GRID-Computing". Lo studio illustra il funzionamento della piattaforma di monitoraggio del sistema "Hpc Cresco" installato presso il centro ricerche Enea di Portici, in provincia di Napoli.

 

Cresco è un "supercalcolatore" che dal 2008 supporta l'infrastruttura di calcolo Enea presente sul territorio nazionale (Enea Grid): aiuta quindi centri di ricerca, università ed aziende che necessitano di elevata potenza di calcolo per svolgere le proprie attività. Il sistema è realizzato mediante l'interconnessione di un elevato numero di elaboratori (oltre 400) collegati fra di loro al fine di ottenere un unico ipotetico “supercomputer” con tanti core (circa 3500), elevata memoria centrale (circa 8TB) ed una memoria di massa veloce in lettura e scrittura (circa 500MB/s). Attualmente, Hpc Cresco è la maggiore risorsa di calcolo a disposizione di Enea.

 

Per monitorare gli elaboratori di una rete, soprattutto quando il sistema è così complesso, serve un software molto potente ma di facile utilizzo. enea utiliza un programma libero, open source, che si chiama Zabbix. 

 

Estremamente flessibile e potente, Zabbix consente di supportare i vari protocolli di monitoraggio e gestione, illustrando i risultati con grafici e mappe interattive; inoltre permette all'operatore di tenere sotto controllo svariati centri di monitoraggio da un unico punto di accesso, ovvero da un unica pagina web.

 

Attualmente, Zabbix tiene sotto controllo circa 1200 host di cui 600 solo nella sede ENEA di Portici, divisi tra server di calcolo, server di griglia, apparati di rete, sonde ambientali (temperatura, umidità), condizionatori e gruppi di continuità. Ha circa 8000 informazioni univoche ottenute con una frequenza di 120 nuovi dati al secondo, innesca circa 6500 allarmi visivi ed è controllato da 23 utenti.