Redis Iris vuole rendere più economica la gestione del contesto negli agenti AI

L’evoluzione degli agenti AI in ambito enterprise sta rapidamente evidenziando un limite strutturale che fino a pochi mesi fa era rimasto in secondo piano rispetto alle prestazioni dei modelli e che riguarda la memoria. Più precisamente, si sta parlando della possibilità di costruire un contesto operativo coerente, aggiornato e utilizzabile in tempo reale ed è su questo punto che si inserisce Redis Iris, che con il “Context Engine” prova a posizionarsi come layer infrastrutturale centrale per la prossima generazione di agenti autonomi.
L’idea di fondo è che se gli agenti AI devono evolvere da strumenti conversazionali a veri e propri operatori digitali in grado di eseguire compiti aziendali complessi, devono poter accedere a una memoria affidabile e strutturata. Senza questo elemento, i sistemi tendono infatti a frammentare le informazioni, generare allucinazioni o interrompere i flussi operativi quando le richieste richiedono accesso a dati distribuiti su sistemi eterogenei.
Redis interpreta questo problema come un “context gap”, una mancanza di continuità informativa tra modelli linguistici e sistemi enterprise. Il Context Engine nasce quindi come strato intermedio tra agenti AI e infrastrutture dati per fornire una rappresentazione coerente dell’ambiente operativo in cui gli agenti agiscono.
L’architettura di Iris si articola su tre componenti principali. Il primo è il Redis Context Retriever, attualmente in preview, che consente di costruire modelli semantici dei dati aziendali. In pratica, invece di affidarsi a query testuali fragili o a tradizionali approcci text-to-SQL, il sistema genera strumenti dinamici che permettono agli agenti di interrogare i dati in modo più strutturato. L’integrazione con il Model Context Protocol open source introduce un livello di standardizzazione che punta a ridurre la complessità nello sviluppo delle applicazioni AI.
Il secondo elemento è l’Agent Memory, anch’esso in fase di preview, che introduce una gestione a doppio livello della memoria degli agenti. Da un lato viene mantenuta una memoria a breve termine legata alla singola interazione, mentre dall’altro viene costruito un archivio persistente capace di conservare preferenze, stati e contesto storico tra sessioni diverse. Ciò consente agli agenti di comportarsi in modo più coerente nel tempo, evitando di “ripartire da zero” a ogni nuova richiesta.
Il terzo componente è il Data Integration layer, già disponibile in generale, che rappresenta la base di sincronizzazione continua tra i sistemi aziendali e il Context Engine. Il suo ruolo è garantire che i dati utilizzati dagli agenti siano sempre aggiornati, eliminando il problema classico dei dataset obsoleti o delle informazioni parziali. Questo livello diventa cruciale in scenari enterprise dove CRM, database logistici e repository documentali devono essere interrogati in tempo reale per fornire risposte operative affidabili.
La visione più ampia è quella di trasformare Redis da semplice database in-memory ad alta velocità in una piattaforma di contesto per agenti AI. Dopotutto, la tecnologia Redis è già utilizzata in una quota significativa di stack enterprise dedicati all’intelligenza artificiale, con una presenza stimata in circa il 43% degli ambienti AI agent secondo i dati aziendali.
Questo dato spiega anche la direzione strategica dell’azienda. Se gli agenti AI diventano componenti centrali nei processi aziendali, il livello di memoria e contesto diventa tanto importante quanto il modello stesso. Redis tenta così di occupare una posizione simile a quella che i database relazionali hanno avuto per l’era applicativa tradizionale, ovvero un’infrastruttura invisibile ma indispensabile.
Un elemento chiave della proposta è la capacità del Context Engine di costruire una rappresentazione semantica delle relazioni tra entità aziendali. Clienti, ticket di supporto, ordini e documenti vengono trattati come nodi di una rete informativa che l’agente può navigare in modo dinamico. Un approccio che riduce la dipendenza da query manuali e aumenta la capacità del sistema di rispondere a richieste multi-step complesse.

