Hugging Face ha presentato Open Computer Agent, un nuovo agente AI gratuito basato su cloud che promette di utilizzare un PC virtuale come farebbe un essere umano. Accessibile direttamente via web, Open Computer Agent funziona su una macchina virtuale Linux preconfigurata con applicazioni come Firefox e può essere istruito per eseguire compiti semplici tramite comandi in linguaggio naturale, sebbene al momento l’esperienza d’uso non sia ancora fluida e ci siano altri limiti.

Il funzionamento ricorda da vicino Operator di OpenAI: si digita una richiesta e l’agente avvia automaticamente il browser, apre i siti necessari e procede passo dopo passo. Tutto avviene su uno schermo virtuale visibile all’utente, che può osservare in tempo reale le azioni dell’agente.

Open Computer Agent riesce a cavarsela con attività semplici, ma fatica molto di più con operazioni complesse. In alcuni test condotti da TechCrunch, ad esempio, l’agente non è riuscito a completare una ricerca di voli e ha mostrato gravi difficoltà a superare i CAPTCHA (un problema ben noto per le AI che cercano di interagire con il web come un essere umano). A peggiorare l’esperienza, c’è anche una coda virtuale che può durare da pochi secondi a qualche minuto, in base alla quantità di utenti connessi.

Tuttavia, l’obiettivo dichiarato del team Hugging Face non era creare un agente perfetto e performante, bensì dimostrare il potenziale delle AI open source nell’ambito dell’uso computerizzato automatizzato. E da questo punto di vista, Open Computer Agent è un segnale importante.

“Con il progresso dei modelli di visione, gli agenti diventano capaci di gestire flussi di lavoro complessi” ha spiegato Aymeric Roucher, uno dei ricercatori del team agenti di Hugging Face. “Alcuni modelli includono il grounding integrato, ossia la capacità di individuare qualsiasi elemento all’interno di un’immagine in base alle coordinate, permettendo così all’agente di cliccare su qualsiasi elemento della macchina virtuale”.

Nonostante le sue imperfezioni, la tecnologia degli AI agent è sempre più sotto i riflettori. Secondo un recente sondaggio di KPMG, ben il 65% delle aziende sta già testando agenti AI per aumentare l’efficienza e, secondo Markets and Markets, il settore degli agenti intelligenti passerà da un valore stimato di 7,84 miliardi di dollari nel 2025 a oltre 52,6 miliardi entro il 2030.

Lentamente ma inesorabilmente, l’era degli agenti AI capaci di utilizzare computer e software come farebbe un essere umano sta diventando realtà. E anche se Open Computer Agent non è ancora pronto per compiti complessi o uso professionale, rappresenta un primo passo importante verso un futuro in cui non saremo più soli davanti allo schermo.