Secondo un recente report di IDC, il mercato globale dei Big Data è in continua crescita. La società di ricerca prevede che il fatturato proveniente da servizi relativi a Big Data e business analytics aumenterà con un tasso annuo dell’11,7% fino al 2020, passando dai 130,1 miliardi di dollari del 2016 ai 203 miliardi nel 2020.

Questi dati dimostrano l’interesse delle aziende verso i Big Data, che rappresentano un concetto in continua evoluzione. Il panorama dei vendor che offrono soluzioni dedicate è molto ampio e variegato: comprende big del calibro di HP, IBM, Microsoft, Oracle e SAP, e piccole società che offrono soluzioni o servizi specifici per mercati verticali.

L’ampiezza e la varietà dell’offerta può rendere difficile la scelta del prodotto o del vendor che meglio risponde alle proprie esigenze, soprattutto nel panorama italiano. Secondo l’indagine del Gruppo Adecco, infatti, nel nostro Paese solo il 12% imprese riesce a sfruttare i Big Data e le loro potenzialità,.

Per orientarsi in questo panorama, qui troverete un elenco di aziende che offrono soluzioni e servizi per i Big Data. L’elenco è in ordine alfabetico e non rappresenta una classifica, ma vuole essere una guida per conoscere l’offerta attualmente disponibile per la gestione di Big Data e analytics.

Alation

Alation analizza le risorse di un’azienda per catalogare ogni bit di informazione disponibile e poi centralizzare tutto il patrimonio dei dati aziendali, estraendo automaticamente le informazioni su ciò che i dati descrivono, da dove provengono, da chi e come vengono utilizzati.

In altre parole, gli strumenti offerti da Alation trasformano tutti i dati in metadati e consentono di fare ricerche rapide attraverso parole (in inglese) e non stringhe informatiche. I prodotti della società forniscono analytics collaborativi per insight più veloci e un mezzo unificato di ricerca, permettendo ai clienti di ottimizzare la struttura e migliorare la governance dei dati aziendali.

Alpine Data Labs

Creata da un gruppo di dipendenti di Greenplum, la società Alpine Data Labs offre un’interfaccia di analisi avanzata su Apache Hadoop. L’obiettivo è fornire uno strumento intuitivo, che permette di analizzare il flusso di dati e costruire modelli predittivi che chiunque può utilizzare, anziché rivolgersi a un costoso data scientist per programmare le analisi.

Alteryx

Alteryx si definisce come leader delle analisi dati “self-service”. Il suo software permette di integrare dati provenienti da diverse fonti, analizzarli e condividerli in modo che possano essere prese opportune decisioni. Le query possono essere fatte a partire da qualsiasi contesto, che sia lo storico delle operazioni di vendita alle attività sui social media.

In Italia sono presenti molti partner tra i più grandi integratori di sistemi, consulenti e rivenditori a valore aggiunto, individuabili dal link sul titolo.

Amazon Web Services

Amazon offre una serie di piattaforme per i Big Data, tra cui Elastic MapReduce (basato su Hadoop), Kinesis Firehose per lo streaming di grandi quantità di dati in AWS, Kinesis Analytics per l’analisi dei dati, il database DynamoDB, NoSQL e HBase, il servizio di data warehousing Redshift. Tutti questi servizi sono inseriti all’interno delle offerte Amazon Web Services.

Big Panda

BigPanda offre una piattaforma dedicata a staff IT e DevOps per gestire gli alert di sovraccarico. Una delle tante fonti di Big Data sono i log, che possono generare avvisi ridondanti o falsi facendo perdere il controllo della situazione. A partire da questa premessa, attraverso la sua piattaforma, BigPanda riconosce gli allarmi significativi di sovraccarico, permettendo di reagire più rapidamente ai problemi reali.

Cogito

Cogito Dialog è un servizio verticale progettato per il personale addetto al supporto telefonico. Grazie a tecnologie di analisi comportamentale, che permettono di analizzare email dei clienti, social media, voce umana, Cogito Dialog aiuta il personale a migliorare la comunicazione con i clienti in tempo reale e le aziende a gestire meglio le performance.

Datameer

Datameer definisce la sua Datameer Analytics Solution (DAS) l’unica soluzione Hadoop end-to-end per gli analytics.DAS supporta tutte ile principali varianti Hadoop, tra cui Apache, Cloudera, EMC Greenplum HD, IBM BigInsights, MapR, Yahoo e Amazon. La piattaforma gestisce l’integrazione delle fonti di dati, esegue analisi e visualizza i risultati con una interfaccia in stile foglio elettronico, che offre più di 200 funzioni di analisi e di visualizzazione.

Google

Google continua a espandere la sua offerta di Big Data analytics, a partire da BigQuery, una piattaforma basata su cloud che permette di analizzare rapidamente grandi insiemi di dati. BigQuery utilizza un modello pay-as-you-go ed è serverless, quindi non richiede infrastrutture da gestire.

Google offre anche Dataflow, un servizio di elaborazione dei dati in tempo reale, Dataproc, un servizio basato su Hadoop/Spark, Pub/Sub per connettere i propri servizi alla messaggistica di Google, e Genomics, focalizzato sulle scienze genomiche.

HP Enterprise

HP Enterprise ha sviluppato un considerevole portafoglio di prodotti Big Data in un tempo molto breve. Il suo prodotto principale è Vertica Analytics Platform, progettato per gestire volumi grandi e in rapida crescita di dati strutturati e fornire veloci prestazioni delle query su Hadoop e SQL Analytics con scalabilità a livello di petabyte.

Il software HPE IDOL fornisce un ambiente unico per dati strutturati, semi-strutturati e non strutturati. Supporta analisi ibride che sfruttano tecniche statistiche e Natural Language Processing (NLP).

HPE offre una serie di prodotti hardware, tra cui i sistemi di server HPE Moonshot per carichi di lavoro ottimizzati e HPE Apollo 4000, appositamente sviluppato per Big Data, analytics e object storage.

I sistemi iperconvergenti e l’architettura componibile Synergy di HPE sono progettati per carichi di lavoro SAP HANA e HPE 3PAR StoreServ 20000 immagazzina i dati analizzati, gestendo la domanda e la crescita futura dei carichi di lavoro.

IBM

Oltre ai suoi sistemi mainframe e Power, IBM offre servizi cloud per l’elaborazione dei Big Data la sua controllata Softlayer. Sul lato software, i suoi database DB2, Informix e InfoSphere supportano le analisi dei Big Data, mentre Cognos e SPSS sono specializzati in BI e data insight. IBM offre anche InfoSphere, la piattaforma di base per l’integrazione dei dati e il data warehousing utilizzati in ambito Big Data.

Microsoft

La strategia Big Data di Microsoft è ampia ed è cresciuta rapidamente. L’azienda ha una partnership con Hortonworks e offre lo strumento HDInsights based per l’analisi di dati strutturati e non strutturati sulla Hortonworks Data Platform.

Microsoft offre anche la piattaforma iTrend per il reporting dinamico di campagne, brand e singoli prodotti. SQL Server 2016 è dotato di un connettore ad Hadoop per l’elaborazione di Big Data, e Microsoft ha recentemente acquisito Revolution Analytics, che ha sviluppato l’unica piattaforma di analisi dei Big Data scritta in R, un linguaggio di programmazione per creare applicazioni Big Data senza avere le competenze di un data scientist.

Mu Sigma

Mu Sigma offre un framework di servizi di analisi che consulta tabelle su tabelle e risponde a domande relative per esempio, al miglioramento delle vendite e del marketing. Pulisce i dati aziendali per mostrare solo quelli rilevanti, genera insights e offre suggerimenti. Mu Sigma cerca di capire come sta realmente funzionando l’azienda e di identificare eventuali problemi.

New Relic

New Relic utilizza un modello SaaS per monitorare in tempo reale applicazioni web e mobile nel cloud, on-premise o in un mix ibrido. Gli strumenti di monitoraggio della società utilizzano più di 50 plugin di partner tecnologici, che includono servizi PaaS/cloud, caching, database, server Web.

Tra i prodotti offerti da New Relic ci sono il software Insights per l’analisi dei dati, che è utilizzabile su tutta la linea di prodotti dell’azienda, e Insights Data Explorer, progettato per semplificare l’esplorazione degli eventi Insights.

Oracle

La Big Data Appliance di Oracle combina un server Intel con una serie di prodotti software Oracle. Tra questi ci sono Oracle NoSQL Database, Apache Hadoop, Oracle Data Integrator con Application Adapter for Hadoop, Oracle Loader per Hadoop, lo strumento Oracle R Enterprise, Oracle Linux e Oracle Java HotSpot Virtual Machine.

Pentaho

La suite Pentaho Business Analytics offre strumenti open source con funzionalità di integrazione dei dati, servizi OLAP, reporting, data mining e funzioni ETL.

Pentaho for Big Data è uno strumento di integrazione dati specificamente progettato per l’esecuzione di processi ETL in ambienti Big Data, come Apache Hadoop o distribuzioni Hadoop su Amazon, Cloudera, EMC Greenplum, MapR, e Hortonworks. Lo strumento supporta anche fonti di dati NoSQL come MongoDB e HBase.

La società è stata acquisita da Hitachi Data Systems nel 2015, ma continua a operare in modo indipendente.

SAP

Il principale strumento di Big Data di SAP è il database relazionale in-memory HANA, che si integra con Hadoop. Il database può eseguire analisi avanzate, come analisi predittiva, elaborazione spaziale dei dati, analisi e ricerca del testo, elaborazione di dati a grafo, e offre funzioni ETL (Extract, Transform e Load).

Mentre alcune aziende si specializzano in una o poche fonti di dati, SAP gestisce dati provenienti da una vasta gamma di fonti, compresi sensori, log di macchine e altre apparecchiature, insieme a dati generati da esseri umani attraverso social, ERP, documenti email, e altre cose che compongono i dati aziendali.

SiSense

SiSense offre Prism ed ElastiCubes, un database analitico ad alte prestazioni progettato in modo specifico per l’analisi in tempo reale. Gli ElastiCubes sono archivi di dati super veloci progettati per le query tipicamente richieste dalla applicazioni di business intelligence. Adatti anche per le PMI, rappresentano un’alternativa più economica dei sistemi Vertica di HP.

Splice Machine

Splice Machine si propone come il fornitore dell’unico sistema di gestione di database relazionale Hadoop (RDBMS, relationship database management system). Può agire come un database general-purpose che può sostituire database Oracle, MySQL o SQL Server per diversi carichi di lavoro su Hadoop. Nell’ultima versione, la 2.0, è stato aggiunto Spark, che fa tutte le analisi in-memory anziché su disco. La versione 2.0 aggiunge anche la capacità di indirizzare il lavoro verso uno dei due motori di elaborazione OLTP e OLAP.

Splunk

Splunk Enterprise iniziato come uno strumento di analisi dei log, ma da allora ha ampliato la sua attenzione e ora si concentra sul machine data analytics per rendere le informazioni utilizzabili da chiunque. E’ in grado di monitorare transazioni online e end-to-end, studiare il comportamento dei clienti e l’utilizzo dei servizi in tempo reale, monitorare le minacce alla sicurezza, identificare le tendenze e sentiment sulle piattaforme social.

Striim

Precedentemente nota come WebAction, Striim è una piattaforma software di analisi in tempo reale del flusso di dati. Striim legge i dati provenienti da diverse fonti, quali database, log file, applicazioni e sensori IoT, e consente ai clienti di filtrare, trasformare, aggregare e arricchire i dati nel momento in cui vengono acquisiti, organizzandoli in-memory prima ancora che arrivino sul disco.

Tableau

Nata come progetto di ricerca della Stanford University, Tableau ha iniziato la propria attività offrendo tecniche di visualizzazione per l’esplorazione e l’analisi di database relazionali e data cube.

Successivamente la società ha ampliato la propria offerta, che oggi include strumenti per la visualizzazione di dati da qualsiasi fonte, da Hadoop ai file di Excel, che funzionano su qualsiasi dispositivo, dal PC all’iPhone.

Teradata

Teradata ha riunito tutte le sue applicazioni dedicate ai Big Data nell’Unified Data Architecture, che include Teradata QueryGrid, Listener, Unity e Viewpoint. QueryGrid fornisce un tessuto di dati senza soluzione di continuità attraverso motori di analisi nuovi e già esistenti, tra cui Hadoop.

Listener è un framework di importazione dei dati progettato per le aziende con diversi flussi di dati, TeradUnity è un portafoglio di quattro prodotti integrati per la gestione del flusso di dati, Viewpoint è una dashboard basata sul Web e personalizzata per gestire l’ambiente Teradata.

Thoughtworks

ThoughtWorks applica i principi dello sviluppo software Agile alla realizzazione di applicazioni Big Data attraverso il suo prodotto Agile Analytics. Agile Analytics aiuta le aziende a creare applicazioni per il data warehousing e la business intelligence, facilitando la distribuzione rapida e continua di nuove applicazioni per estrarre insight dai dati.

Tibco Jaspersoft

Jaspersoft ha introdotto un’offerta sul Cloud di Amazon che permette di acquistare analytics a partire da 0,53 dollari l’ora. La società si distingue anche per la capacità di integrare i suoi strumenti di analisi e reportistica all’interno di applicazioni aziendali esistenti, e tra i suoi clienti ci sono aziende come Red Hat, CA, Verizon, Tata, Groupon, British Telecom, Virgin e la Marina Stati Uniti.

VMware

VMware ha incorporato i Big Data nel suo prodotto di punta dedicato alla virtualizzazione, VMware vSphere Big Data Extensions (BDE). BDE è un’appliance virtuale che consente agli amministratori di implementare e gestire i cluster Hadoop in vSphere. Supporta una serie di distribuzioni Hadoop, tra cui Apache, Cloudera, Hortonworks, MapR e Pivotal.