Mistral AI pubblica il primo report ambientale sul suo LLM: acqua, CO₂ e materiali sotto esame

In un panorama in cui l’IA generativa è sempre più diffusa ma spesso opaca nei suoi reali costi ambientali, Mistral AI compie un passo decisivo verso la trasparenza. La startup IA francese ha pubblicato un report redatto in collaborazione con Carbone 4 e l’ADEME (l’agenzia per la transizione ecologica francese), che analizza in modo dettagliato l’impatto ambientale del suo LLM Mistral Large 2.
Il documento prende in esame tre parametri fondamentali (emissioni di gas serra, consumo idrico e uso dei materiali), fornendo dati concreti che aprono la strada a una maggiore consapevolezza sull'”impronta” delle IA di nuova generazione.
Addestramento e inferenza: dove nascono le emissioni
Il periodo di osservazione copre 18 mesi, durante i quali Mistral ha progettato, addestrato e messo in funzione il suo LLM da 123 miliardi di parametri. Secondo il report, l’addestramento e l’inferenza hanno generato l’85,5% delle emissioni totali di CO₂ e il 91% del consumo idrico, sottolineando il peso della fase computazionale rispetto alle altre attività correlate.
In termini assoluti, l’addestramento del modello ha comportato l’emissione di circa 20 chilotoni di CO₂ equivalente e ha richiesto 281.000 metri cubi d’acqua (l’equivalente di 112 piscine olimpioniche). Una cifra che, secondo Mistral, riflette la portata delle operazioni necessarie per costruire un LLM di queste dimensioni, che richiede migliaia di GPU e spesso viene ospitato in data center localizzati in regioni ad alta intensità carbonica o con scarsità idrica.
Un aspetto particolarmente interessante riguarda l’uso dei materiali. Solo il 61% del consumo totale di materiali è riconducibile alla produzione, trasporto e smaltimento delle infrastrutture hardware. Il restante 29% è stato consumato durante le fasi di addestramento e inferenza, un dato che suggerisce un tasso elevato di guasti hardware. Mistral non ha chiarito le cause precise di questa incidenza, ma ha promesso ulteriori approfondimenti. Questo dato apre tra l’altro un interrogativo importante: quanta parte delle risorse impiegate nell’IA viene persa per usura o inefficienze strutturali?
Quanto consuma una singola risposta?
Una volta addestrato, il modello consuma molto meno per ogni singola operazione. Secondo Mistral, per generare una risposta di 400 token (equivalente a circa una pagina di testo), Mistral Large 2 consuma 45 ml d’acqua e produce 1,14 grammi di CO₂e. Sembra poco? Lo è, ma se viene moltiplicato per milioni di richieste giornaliere, l’impatto si somma rapidamente.
Secondo il report, la localizzazione geografica dei data center ha un impatto determinante sull’impronta ambientale dell’IA. Utilizzare fonti rinnovabili e ambienti climaticamente più freschi consente infatti di ridurre sia le emissioni, sia il consumo idrico. I data center consumano grandi quantità di energia e, per mantenere le GPU a temperatura ottimale, impiegano torri evaporative che utilizzano l’acqua per raffreddare l’aria. Come spiegano gli esperti, queste torri sono più efficienti dal punto di vista energetico rispetto agli impianti di climatizzazione tradizionali, ma risultano problematiche in zone colpite da siccità o dove l’acqua è scarsa.
Il modello conta (e la sua taglia anche)
Un’altra conclusione chiave del report riguarda la dimensione del modello IA rispetto al suo uso. Mistral sottolinea come modelli più piccoli e specializzati consumino meno risorse, siano più efficienti e in molti casi forniscano risultati migliori se scelti per il giusto contesto d’uso. “Un modello dieci volte più grande genererà un impatto ambientale di un ordine di grandezza maggiore rispetto a uno più piccolo, a parità di token generati”, si legge nel report. “Questo dimostra quanto sia importante scegliere il modello giusto per il compito richiesto”.
Tra le tecniche suggerite per ridurre l’impatto ci sono il batching continuo delle richieste, già adottato da Mistral, e strategie come il decoding speculativo o le architetture sparse come Mixture of Experts (MoE), tecnologia su cui Mistral è particolarmente attiva, anche se Mistral Large 2 resta un modello “denso”.
Il report ha ricevuto un’accoglienza positiva dalla comunità scientifica. Shaolei Ren, docente all’Università di Riverside e autore di studi sull’impatto ambientale dell’IA, ha elogiato il lavoro: “Non hanno incluso ogni dettaglio, ma è un passo importante verso una maggiore trasparenza. Serve uno standard internazionale per misurare e confrontare l’impatto reale dell’IA”.
Mistral stessa ammette che l’assenza di standard condivisi obbliga a fare ipotesi che potrebbero alterare parzialmente i dati. Tuttavia, l’obiettivo è spingere altri attori del settore a pubblicare analisi ambientali usando metodologie condivise, così da creare un sistema di scoring ambientale che aiuti utenti e clienti a scegliere modelli meno impattanti.