Google ha presentato File Search Tool, una soluzione completamente gestita che integra direttamente nel Gemini API un sistema RAG (Retrieval-Augmented Generation), semplificando l’intero flusso di lavoro di ricerca e contestualizzazione dei dati. In questo modo gli sviluppatori possono concentrarsi sulla costruzione di applicazioni intelligenti senza doversi preoccupare delle complessità legate a storage, gestione dei file e pipeline di recupero.

Uno degli aspetti più innovativi del File Search Tool è il modello di pricing semplificato. Lo storage e la generazione delle embedding al momento della query sono infatti gratuiti e si paga solo per la creazione iniziale delle embedding dei file indicizzati, a un costo fisso di $0,15 per milione di token. Questa modalità consente di ridurre i costi operativi e favorisce la scalabilità delle applicazioni basate su RAG.

Il funzionamento fi File Search Tool si basa su un’integrazione completa con Gemini API e offre:

Google File Search

  • Esperienza sviluppatore integrata: File Search Tool gestisce automaticamente archiviazione dei file, segmentazione ottimale, generazione delle embedding e inserimento dinamico del contesto recuperato nei prompt. Il tutto è accessibile tramite l’API generateContent, riducendo significativamente la complessità tecnica
  • Ricerca vettoriale avanzata: Grazie al modello Gemini Embedding, il sistema interpreta il significato e il contesto delle query, consentendo di recuperare informazioni rilevanti anche se le parole esatte non sono presenti nel testo dei documenti
  • Citazioni integrate: Ogni risposta include riferimenti ai file da cui sono stati estratti i dati, facilitando la verifica e la tracciabilità delle informazioni
  • Supporto multi-formato: Il tool gestisce PDF, DOCX, TXT, JSON e molti file tipici di linguaggi di programmazione

Questa struttura rende il File Search Tool un’alternativa potente ai sistemi self-managed, eliminando la necessità di sviluppare pipeline di RAG interne e garantendo scalabilità e affidabilità anche per applicazioni complesse.

Gli sviluppatori in early access stanno già sfruttando File Search per creare assistenti intelligenti, piattaforme di content discovery e sistemi di supporto avanzati. Un esempio significativo arriva da Beam, piattaforma AI-driven per la generazione di giochi sviluppata da Phaser Studio.

Beam integra File Search nelle sue pipeline, eseguendo migliaia di query giornaliere su una libreria in crescita di oltre 3.000 file distribuiti su sei corpora attivi. Il tool combina i risultati in meno di due secondi, sostituendo un processo manuale che richiedeva ore. Secondo il team, ciò ha trasformato il workflow creativo e idee che prima richiedevano giorni per diventare prototipi sono ora implementabili in pochi minuti.

Questa efficienza deriva dall’integrazione tra ricerca vettoriale, gestione automatizzata dei dati e contestualizzazione tramite Gemini, creando un ambiente in cui gli sviluppatori possono concentrarsi sulla creazione di valore e innovazione, piuttosto che sulla gestione dei dati o sull’ottimizzazione della pipeline AI.