Con Dreaming, gli agenti AI di Claude possono consolidare la memoria sognando (pecore elettriche?)

Anthropic prova a spostare in avanti il confine operativo degli agenti AI con un aggiornamento che riguarda soprattutto la funzione di Dreaming, un meccanismo che consente ai Claude Managed Agents di rivedere attività e interazioni passate, individuare schemi ricorrenti e trasformare quelle informazioni in memorie utili per i lavori successivi. In altre parole, Anthropic sta cercando di dare continuità all’esperienza degli agenti, superando la logica della sessione isolata e avvicinando questi sistemi a un comportamento più stabile, più coerente e progressivamente più efficace.

Per capire la portata dell’annuncio, bisogna partire dalla natura dei Managed Agents. Anthropic li propone come un’infrastruttura preconfigurata e gestita direttamente dal vendor, pensata per chi non vuole costruire ogni volta da zero un agente sulla propria API di messaggistica. Il valore, in questo caso, sta nel fornire a sviluppatori e aziende un contenitore operativo già pronto per scenari in cui più agenti collaborano sullo stesso compito per periodi prolungati, magari nell’arco di decine di minuti o di alcune ore. È esattamente il tipo di impostazione che interessa il mercato aziendale, dove l’agente non viene usato come chatbot da demo, ma come componente di un processo.

La funzione di Dreaming si inserisce qui. Anthropic non parla di una memoria passiva, cioè di un semplice archivio che accumula dati, ma di un processo schedulato che consente agli agenti di riesaminare sessioni precedenti e memoria già disponibile per estrarre pattern, ripulire il rumore e conservare ciò che può avere davvero valore in futuro.

L’aspetto interessante è che questo lavoro di rielaborazione non avviene in tempo reale durante la conversazione, ma in una fase separata, governabile dall’utente. Chi sviluppa, può decidere con quale frequenza attivare il Dreaming e può scegliere se lasciare all’agente la facoltà di aggiornare la memoria in autonomia, oppure mantenere un controllo umano sulle modifiche prima che vengano applicate.

Anthropic accompagna Dreaming con altre due funzioni che meritano attenzione. La prima si chiama outcomes e affronta un problema concreto dell’agentic AI: spesso gli agenti falliscono perché non hanno un’idea sufficientemente definita di che cosa significhi svolgerlo bene. Con outcomes, lo sviluppatore può fornire un esempio di risultato ideale associato a una determinata attività. A quel punto entra in scena un grader agent separato, incaricato di valutare l’output prodotto rispetto al riferimento fissato. È una mossa interessante, perché introduce una forma di controllo qualità nativo dentro il workflow agente-centrico, senza costringere il team a costruire sempre da zero pipeline esterne di validazione.

L’impatto è rilevante soprattutto in due categorie di lavoro. La prima riguarda le attività che richiedono accuratezza, copertura esaustiva e attenzione ai dettagli, dove un semplice prompt generico tende a produrre risultati discontinui. La seconda coinvolge i compiti in cui la qualità ha una componente più soggettiva, come la riproduzione del tone of voice di un brand nei contenuti editoriali o social. Anthropic sostiene che i propri test interni e i primi casi d’uso mostrano un miglioramento fino a dieci punti nel tasso di successo dei task rispetto all’uso di prompt standard privi di esempi.

L’altra novità, ora resa più ampiamente disponibile, è la multi-agent orchestration. Qui Anthropic formalizza un modello ormai sempre più discusso nel settore per il quale, invece di affidare un incarico complesso a un solo agente, il sistema lo scompone in sottotask e affida la regia a un agente principale che distribuisce il lavoro a sub-agenti specializzati. La differenza, rispetto a molte architetture sperimentali viste finora, è nell’enfasi sulla tracciabilità. Attraverso la Claude Console, l’utente può verificare che cosa ha fatto ciascun sub-agente, osservandone processi e output con un livello di trasparenza che in ambito enterprise conta quasi quanto la performance.

Questa impostazione rafforza la credibilità della proposta di Anthropic nel mercato professionale. Oggi le aziende chiedono agli agenti tre cose contemporaneamente: autonomia, verificabilità e continuità. L’autonomia da sola non basta più, perché un sistema che agisce senza controllo genera rapidamente diffidenza nei team IT, nei responsabili della sicurezza e in chi deve firmare un progetto di adozione. Inserire memoria rielaborata, outcome-based evaluation e orchestrazione osservabile dentro un framework gestito significa provare a costruire una piattaforma meno spettacolare sul piano della narrazione e più aderente alle esigenze reali di delivery.

Con Dreaming, gli agenti AI di Claude possono consolidare la memoria sognando (pecore elettriche?)

Francesco Destri