TurboQuant è un algoritmo di quantizzazione vettoriale che comprime la KV cache dei modelli linguistici a soli 3 bit, ma non è la soluzione magica per far girare LLM enormi su hardware consumer. »
Gartner prevede che entro il 2030 il costo di inferenza degli LLM da un trilione di parametri scenderà di oltre il 90%, ma per le aziende la spesa complessiva potrebbe addirittura aumentare. »
Un leak ha esposto i piani di Anthropic per Claude Mythos, un modello AI di nuova generazione che la stessa azienda definisce un "salto generazionale" con capacità senza precedenti nel campo della cybersecurity offensiva. »
Tra domenica e lunedì, il chatbot di DeepSeek è rimasto offline per circa sette ore. Un episodio che solleva domande serie sull'affidabilità dell'AI come infrastruttura lavorativa. »
Microsoft lancia Copilot Cowork, il nuovo agente AI per Microsoft 365 capace di gestire flussi di lavoro complessi in autonomia. Ecco come funziona e cosa cambia per le aziende. »
Mentre Databricks entra nel mercato della sicurezza con Lakewatch e due acquisizioni strategiche, AWS e CrowdStrike lanciano agenti autonomi che puntano a ridisegnare i parametri attuali della sicurezza IA. »
Mentre AWS, Microsoft Azure e Google Cloud accelerano gli investimenti in AI, la spesa globale in infrastruttura cloud ha toccato 110,9 miliardi di dollari nel Q4 2025, con una crescita anno su anno del 29%. »
Check Point annuncia AI Factory Security Blueprint, un'architettura di riferimento multi-livello per proteggere i data center AI privati dalle minacce più sofisticate. »
L'Auto Mode in Claude Code è un classificatore intelligente che decide in autonomia quando agire e quando fermarsi, riducendo il rischio di operazioni distruttive. »
Due versioni della libreria LiteLLM sono state rimosse da PyPI dopo un attacco sofisticato alla supply chain che ha sfruttato una vulnerabilità nel tool di sicurezza Trivy. »
HPE ha presentato un portfolio rinnovato con NVIDIA Vera Rubin NVL72, CPU Vera, InfiniBand Quantum-X800 e nuove soluzioni software per accelerare l'adozione dell'IA in ambienti enterprise, sovereign e di ricerca. »
Google integra Gemini nella threat intelligence con analisi del dark web in tempo reale, meno falsi positivi e automazione avanzata nella sicurezza informatica. »
GitHub aggiorna le policy su Copilot introducendo l’uso dei dati degli utenti per addestrare l’AI: ecco le implicazioni tecniche, legali e culturali per sviluppatori e aziende. »
OpenAI prepara la chiusura di Sora, l'avanzato generatore video AI lanciato nel 2024. Le cause? Concorrenza sempre più serrata, ma soprattutto un nuovo focus strategico su aziende e agenti AI. »
Agent Val di Qualys è un agente AI che sfrutta, mitiga e riesamina continuamente le vulnerabilità in relazione ai controlli compensativi, riducendo la finestra media di esposizione. »
Accio Work è un nuovo agente AI di Alibaba che permette agli imprenditori di gestire business online o negozi fisici con un nuovo livello di automazione, pensato per ridurre il carico operativo tipico delle PMI. »