Il ban di Claude Fable 5 potrebbe essere un autogol per gli USA?

Indice dell'articolo

Nelle puntate precedenti…
1. Un atto di arbitrio
2. L’aspetto sovranista
3. La ricerca internazionale
4. Un assist all’Europa (e alla Cina)?

A seguito di una direttiva del governo americano che cita motivi di sicurezza nazionale, Anthropic ha appena disabilitato i modelli Fable 5 e Mythos a tutti i suoi utenti. L’evento è inaspettato, per molti versi sorprendente, perché la posizione degli Stati Uniti è sempre stata quella di non voler limitare lo sviluppo tecnologico dell’AI.

Ci sono alcuni aspetti della vicenda che vale la pena mettere in fila prima di valutare le possibili conseguenze, soprattutto quelle inattese e anche a lungo termine. Facciamo prima un piccolo riassunto della vicenda (i più informati possono saltare direttamente alle considerazioni sul provvedimento).

Nelle puntate precedenti…

A inizio aprile, sono cominciate a circolare indiscrezioni su Mythos, una nuova classe di modelli di frontiera che Antropic stava sviluppando ma che riteneva troppo pericolosi per rilasciarli al pubblico. Mythos era infatti particolarmente efficace nell’individuare falle di sicurezza nei software e creare strumenti di attacco per sfruttarle.

Successivamente, Anthropic ha quindi creato il progetto Glasswing, un programma che rende disponibile Mythos in modo riservato solo a sviluppatori software, banche e istituzioni accreditate, in modo da mettere in sicurezza i propri software e sistemi prima di un rilascio al pubblico.

Già qui è interessante notare che, mentre in Glasswing sono state accreditate fin da subito banche e istituzioni americane, l’inclusione delle controparti europee è andata molto più a rilento e ancora oggi non è altrettanto ampia.

Tre giorni fa, Anthropic ha rilasciato al pubblico Fable 5, versione “sterilizzata” di Mythos, con nuovi guardrail di sicurezza per impedire utilizzi malevoli del modello. Se già i sistemi di sicurezza dei software tradizionali non sono invulnerabili, si sa per certo che i guardrail di un modello AI, basati sull’interpretazione del testo della richiesta o della risposta, si prestano a essere aggirati con tecniche retoriche, l’utilizzo di lingue alternative o altre tecniche. A meno di 48 ore dal rilascio, già circolavano prompt in grado di scavalcare la recinzione sanitaria eretta da Anthropic attorno a Fable.

Di seguito quindi alcune valutazioni veloci sui dettagli del divieto e le possibili conseguenze.

1. Un atto di arbitrio

Nella dichiarazione con cui annuncia la sospensione del servizio, Anthropic dice che il governo non ha specificato chiaramente i motivi delle preoccupazioni, ma ritiene che abbiano a che fare proprio con le tecniche di jailbrake recentemente circolate. L’azienda afferma anche che si tratterebbe di violazioni di sicurezza minori, e che altri modelli – incluso GPT 5.5 – rilasciano informazioni potenzialmente pericolose senza nemmeno richiedere tecniche particolari di prompt.

Senza un chiaro processo di valutazione, né poter conoscere il reale motivo che ha dato origine alla direttiva, l’atto del governo appare quanto meno arbitrario. È un aspetto messo in luce anche da Paolo Benanti, consulente della Santa Sede per l’etica dell’AI, in un post su Facebook.

Padre Benanti sottolinea che “I modelli di frontiera diventano risorse nazionali americane. Non infrastruttura della conoscenza condivisa, ma strumento strategico di un solo Stato. Cambia forse per sempre la comprensione dell’AI: da conoscenza tecnoscientifica di tutti a risorsa segreta”.

A essere maliziosi, si può pensare che quella del governo è una ripicca per il rifiuto di Anthropic di rimuovere dai modelli forniti all’esercito americano le protezioni contro l’utilizzo a fini di sorveglianza o per guidare armi letali autonome.

Mettere un limite all’evoluzione dei modelli che possono essere resi disponibili all’estero può compromettere il successo della quotazione in borsa a cui l’azienda si sta preparando, contemporaneamente ai due concorrenti OpenAI e xAI (dentro a SpaceX), considerati molto più allineati agli interessi dell’amministrazione, che ne risulterebbero quindi avvantaggiati.

2. L’aspetto sovranista

L’atto americano è una limitazione all’esportazione. Non chiede la messa al bando di Mythos e Fable 5, ma “solo” di renderli inaccessibili ai cittadini stranieri. Non potendo garantire con certezza che nessuno straniero abbia accesso ai modelli, dall’interno del territorio USA o con una VPN, Anthropic ha deciso di sospendere l’accesso per tutti gli utenti, stranieri e non.

Se le cose fossero andate come nelle intenzioni del governo, però, la conseguenza sarebbe stata che aziende e istituzioni straniere non avrebbero potuto usare quei modelli per individuare e risolvere i problemi di sicurezza, che avrebbero quindi potuto essere sfruttati dalle agenzie americane, ma potenzialmente anche da criminali a stelle e strisce. Visto dall’Europa, questo atteggiamento è davvero preoccupante, anche se non del tutto sorprendente.

3. La ricerca internazionale

Il divieto di accesso riguarda anche i dipendenti stranieri di Anthropic. Paradossalmente, alcuni ricercatori che hanno contribuito a creare quei modelli, si trovano ora a non poterli utilizzare. Potranno (e vorranno) questi ricercatori continuare a lavorare negli USA, o cercheranno altri contesti e territori in cui essere liberi di continuare le proprie ricerche?

4. Un assist all’Europa (e alla Cina)?

È interessante notare che l’AI Act europeo, tanto criticato dal vicepresidente JD Vance durante le sue visite nel Vecchio continente, stabilisce criteri chiari e impone ai produttori stessi dei modelli di fare un’analisi di valutazione del rischio. Non si limita a emettere un divieto in modo arbitrario e imprevedibile.

Da oggi in poi, quanti clienti stranieri saranno propensi a costruire i propri processi digitali attorno ai servizi AI americani, se questi possono essere spenti da un giorno all’altro per decreto? O se comunque gli USA hanno messo in chiaro che i loro modelli più potenti da ora in poi potrebbero non essere più rilasciati all’estero?

Così come la limitazione all’esportazione delle GPU americane ha spinto la Cina a sviluppare la propria tecnologia autoctona (con risultati non ancora soddisfacenti, ma indubbiamente in tempi record), il divieto all’esportazione del modelli AI potrebbe fornire all’Europa la motivazione per investire nello sviluppo di modelli che saranno sì regolamentati, ma almeno in modo chiaro e prevedibile.

O, in alternativa, le aziende europee potrebbero decidere di utilizzare i modelli open weight cinesi come DeepSeek, Qwen o Kimi, che aprono il campo a tutta una serie di altri rischi (bias, censure di stato, possibili backdoor sematiche…), ma non quello di avere un kill switch che potrebbe essere attivato da un momento all’altro.

L’impossibilità di lavorare negli USA, potrebbe anche attirare in Europa quei ricercatori indiani, cinesi – ma anche europei – che avevano “trovato l’America” là dove era sempre stata. Fino a oggi.