Anthropic lancia Sonnet 5: l’AI più “agentica” di Claude punta su coding, automazione e sicurezza

Anthropic continua a spingere sull’evoluzione degli agenti AI e, con il debutto di Claude Sonnet 5, propone un modello IA di fascia intermedia che viene descritto dalla società statunitense come il suo più “agentico” di sempre, con un focus preciso su coding, ragionamento, orchestrazione di strumenti esterni e gestione di attività multi-step.
I benchmark interni e i test effettuati con partner esterni mostrano progressi significativi proprio nelle attività di coding avanzato, nella ricerca agentica, nel ragionamento multimodale e nell’esecuzione di task professionali articolati. La società sostiene inoltre che il modello sia meno incline a errori di interpretazione, allucinazioni e comportamenti eccessivamente compiacenti verso l’utente, un fenomeno noto come “sycophancy” che negli ultimi anni ha iniziato a creare parecchi problemi ai produttori di AI generativa.
In pratica, il nuovo Sonnet tende meno a dare ragione all’utente quando quest’ultimo formula richieste errate o fuorvianti ed è un dettaglio che in ambito enterprise assume un peso enorme. Un modello troppo accomodante rischia infatti di confermare dati inesatti, prendere decisioni sbagliate o seguire istruzioni potenzialmente pericolose pur di mantenere un’interazione apparentemente fluida.
Anthropic sostiene anche di aver rafforzato la resistenza agli attacchi di prompt injection, una delle tecniche più utilizzate per manipolare i modelli AI inducendoli a ignorare regole di sicurezza o divulgare informazioni che non dovrebbero essere accessibili. Nei documenti tecnici pubblicati insieme al rilascio, la società evidenzia infatti un miglioramento generale nella capacità di individuare abusi, tentativi di manipolazione e richieste malevole.
La questione della sicurezza non è secondaria. Negli ultimi mesi il settore è finito sotto crescente pressione normativa, soprattutto negli Stati Uniti, dove il governo sta monitorando con attenzione le capacità offensive dei modelli più avanzati. Anthropic sembra aver imparato la lezione dopo le polemiche nate attorno ai modelli Mythos 5 e Fable 5, temporaneamente colpiti da restrizioni all’export da parte del Dipartimento del Commercio americano per motivi legati alla sicurezza nazionale.
Per evitare nuove controversie politiche, l’azienda sottolinea esplicitamente di non aver addestrato Sonnet 5 su attività offensive di cybersecurity. Il modello può assistere in operazioni difensive e analisi di sicurezza standard, ma mostra limiti deliberati nella generazione di exploit o codice destinato ad attacchi informatici. Durante i test interni, per esempio, Sonnet 5 non è riuscito a completare la creazione di un exploit funzionante per Firefox, pur mostrando capacità leggermente superiori rispetto alla versione precedente.
Dal punto di vista commerciale, Sonnet 5 occupa una posizione strategica nell’ecosistema Claude. È il modello predefinito per gli utenti Free e Pro, ma viene offerto anche nei piani Max, Team ed Enterprise. Anthropic punta chiaramente a trasformarlo nell’opzione più equilibrata tra costi e prestazioni, soprattutto per le aziende che vogliono implementare agenti AI senza sostenere i costi elevati del modello flagship Opus 4.8.
Ed è qui che emerge uno degli aspetti più interessanti dell’annuncio. Secondo i benchmark condivisi dalla società, Sonnet 5 riesce ad avvicinarsi alle performance di Opus in diversi scenari professionali, pur mantenendo un costo operativo sensibilmente inferiore. A partire da settembre, il prezzo di Sonnet 5 sarà infatti di 3 dollari per milione di token in input e 15 dollari per milione di token in output, mentre fino alla fine di agosto resterà attiva una tariffa promozionale ancora più aggressiva.
Anthropic introduce anche un nuovo parametro configurabile chiamato “effort”, pensato per regolare il livello di impegno computazionale del modello durante l’esecuzione di un task. Le operazioni più semplici possono essere completate con impostazioni leggere che consumano meno token e riducono i costi, mentre i workflow complessi basati su agenti possono utilizzare modalità ad alte prestazioni come “xhigh” o “max”.
È un approccio che fotografa bene l’evoluzione attuale del mercato AI, in cui non basta più avere un modello potente ma serve poter modulare dinamicamente prestazioni, consumo computazionale e costi operativi in base al contesto applicativo, in modo che le aziende riescano a mantenere economicamente sostenibile l’automazione su larga scala.


