“Il 2023 è stato anno che ha cambiato la percezione dell’utilità delle tecniche di intelligenza artificiale in tutti i campi. Prima di ChatGPT c’era interesse, ma le tipiche richieste delle aziende erano quasi sempre legate alla previsione, ai sistemi di raccomandazione o classificazione. Tutte cose interessanti ma che implicavano l’azione di una grande azienda, sia per pensare i casi d’uso, sia per gestire le problematiche di integrazione, aggiornamento, riqualificazione eccetera. L’esplosione della IA generativa ha ampliato molto la percezione positiva e ampliato il campo di applicazione e aumentato l’interesse da parte di un più vasto range di aziende, anche se molte ancora non sanno bene come inserirla nei propri processi”.

Commenta così il “momento IA” che stiamo vivendo Mario Rosati, CEO di E4 Analytics, sister company di E4 Computer Engineering, azienda che opera nel campo del calcolo ad alte prestazioni e ha tra i propri clienti il Cern, Leonardo Company, Enea, Ingv e altri.

E4 Analytics nasce quindi per soddisfare le crescenti esigenze delle aziende in discipline che, come la IA, richiedono infrastrutture di high performance computing che fino a ora erano state appannaggio dei centri di ricerca, cercando di fornire soluzioni infrastrutturali che possono essere gestite anche da data analyst e sviluppatori abituati a lavorare con tecnologie diverse da quelle tradizionali, come i container, che hanno però bisogno di essere adattate per lavorare su sistemi di high performance computing.

A questo scopo, E4 Analytics aveva già sviluppato Gaia, una soluzione pronta all’uso per sfruttare un server multi-GPU attraverso uno stack software containerizzato con strumenti per la gestione dei dati, ambienti di calcolo interattivo basati su Notebook, servizi per data model addestrati e strumenti per automatizzare i workflow della data science.

Urania: piattaforma scale-out per la IA ad alte prestazioni

Foto di Mario Rosati, CEO di E4 Analytics

Mario Rosati, CEO di E4 Analytics

Gaia permette di gestire una infrastruttura per container in modalità scale-up su un singolo nodo, ma di recente è stata introdotta Urania, soluzione analoga ma in grado di gestire ambienti cloud multi-nodo in modalità scale-out, con un sistema di scheduling per venire incontro ai picchi di richieste dei momenti di training o analisi batch, in modalità elastica ma organizzata.

“Solitamente, quando si fa un cluster Spark, si dedica un’infrastruttura allo scopo, che viene usata in modo intermittente.  Dentro Urania, queste piattaforme si possono avviare on-demand. L’utente fa una richiesta, il sistema crea la piattaforma e interroga il batch scheduler per avere disponibilità di risorse. Convivono così le tre modalità di elaborazione in parallelo, cosa che rappresenta un grande valore per chi fa big-data analytics in maniera significativa”, commenta Rosati.

Gaia e Urania sono basate su una particolare distribuzione di Kubernetes, ottimizzata per le caratteristiche di storage, GPU computing e networking impiegate nel calcolo ad alte prestazioni. Su questa piattaforma sono stati montati e configurati gli strumenti tipici della data science: object storage compatibile con S3 per la creazione del data lake, Jupyter Notebook, TensorFlow, Pytorch, Hugging Face eccetera, offrendo al cliente la possibilità di creare immagini container personalizzate alle quali possono essere assegnate le risorse di calcolo.

Sotto all’interfaccia grafica che permette agli analisti di gestire la complessità di un’infrastruttura HPC, Urania è costituita a partire da componenti open source scelte tra quelle che possano garantire aggiornamenti regolari e longevità. E4 Analytics offre un servizio di aggiornamenti semestrale che non si limita a installare le nuove versioni dei software, ma integra anche le nuove proposte del mondo open source.

Le esigenze dei diversi clienti

“Abbiamo scelto di progettare Urania in questo modo per garantire ai nostri clienti, che magari hanno sperimentato il public cloud, di lavorare su un ambiente simile ma su propria infrastruttura. Magari con meno componenti, ma accuratamente selezionati per definire una metodologia di lavoro sottostante”, commenta Rosati, identificando due categorie di possibili aziende interessate: “quelle autonome rispetto alla tecnologia e che hanno solo bisogno della piattaforma abilitante per mettere al lavoro quanto hanno sviluppato, e quelle che stanno iniziando il viaggio verso la IA e per le quali gli aspetti tecnologici dell’infrastruttura rappresentano un ostacolo e un freno allo sviluppo”.

A entrambe le tipologie di cliente, E4 Analytics offre la possibilità di fare un “test drive” accedendo via VPN a un’installazione di Urania nel data center di proprietà, par familiarizzare con il sistema e testare le soluzioni.