All’AI Seoul Summit le big tech si accordano per la sicurezza dei modelli IA
Nella cornice dell’AI Seoul Summit 2024 in Corea del Sud, 16 leader mondiali dell’IA (tra cui Google, Amazon, Anthropic, Microsoft, IBM e OpenAI, Meta e Mistral AI) si sono impegnati in modo non vincolante a disattivare i propri modelli IA nel caso questi mostrassero segni preoccupanti per dare vita a uno scenario distopico. L’evento coreano segue di un anno l’AI Safety Summit 2023 in cui 28 nazioni e l’UE hanno sottoscritto la Dichiarazione di Bletchley, una visione condivisa per affrontare i rischi legati all’IA, seppur (anche in quella occasione) senza impegni concreti o pratici.
Il vertice di Seul ha prodotto una serie di impegni per la sicurezza dell’IA, tra cui dei framework su come misurare i rischi dei modelli di IA come la definizione del punto in cui i rischi diventano intollerabili e le azioni che i firmatari intraprenderanno a quel punto. Nel caso in cui queste misure di mitigazione non dovessero riuscire a mantenere i rischi al di sotto di una certa soglia, i firmatari si sono impegnati a non sviluppare o distribuire un modello o un sistema.
I firmatari del documento di Seoul si sono inoltre impegnati a:
- Fare red-teaming dei loro modelli e sistemi di AI di frontiera, ovvero piattaforme di machine learning nascenti e su larga scala che portano l’intelligenza artificiale a nuovi livelli di sofisticazione e hanno anche capacità che potrebbero essere pericolose
- Condividere le informazioni, investire nella sicurezza informatica e nelle salvaguardie contro le minacce interne
- Incentivare la scoperta e la segnalazione di vulnerabilità da parte di terzi
- Etichettare i contenuti dell’IA, dare priorità alla ricerca sui rischi sociali posti dall’IA e utilizzare l’intelligenza artificiale a fin di bene
Al vertice hanno partecipato anche numerose delegazioni governative (G7 più Singapore, l’Australia, le Nazioni Unite, il PECD e l’UE) e, sebbene si tratti di propositi assolutamente condivisibili, molti dettagli non sono stati ancora definiti e non lo saranno fino all’AI Action Summit che si terrà a inizio 2025.