Le aziende hanno capito che nei dati che possiedono risiede un enorme valore e stanno provvedendo a unificarli e organizzarli, ma si trovano di fronte a un problema di natura squisitamente umana: al mondo, ci sono un miliardo e mezzo di utenti aziendali dei sistemi informativi nelle linee di business, ma solo un milione e mezzo di analisti IT in grado di tradurre le loro richieste di informazioni in query o analisi sui dati strutturati e non strutturati.

I primi sanno quali sono le domande da fare, hanno le informazioni di contesto sul business ma sanno usare Excel e, quando va bene, Tableau. I secondi sanno come modellare e preparare i dati, conoscono R e Python e sanno come costruire una query. Il rapporto tra i due è uno su mille, ed è evidente che questo gap causa un collo di bottiglia che è necessario allargare.

Abbiamo di recente incontrato due startup americane che, attorno a questo problema, hanno costruito soluzioni basate sull’intelligenza artificiale e mirate a velocizzare il lavoro degli analisti in modo esponenziale l’una, e rendere accessibili i dati anche a persone non esperte di database l’altra. Ecco cosa ci hanno raccontato.

Promethium: velocizzare l’estrazione di valore dai dati

promethium-logoCome Prometeo rubò il fuoco agli dei per donarlo agli uomini, Promethium si propone di portare la luce della conoscenza insita nei dati aziendali agli utenti di business che possono trarne vantaggio (Promethium in inglese è l’elemento chimico Promezio, il cui nome è sua volta ispirato dal mitologico titano Prometeo).

Uno dei mantra della Business Intelligence Analytics negli ultimi anni è stato “comincia ad accumulare dati, che prima o poi sfrutterai per qualcosa di utile”.

Kaycee Lai, CEO di Promethium.

Kaycee Lai, CEO di Promethium.

Secondo Kaycee Lai, CEO di Promethium, invece, “Le aziende non vogliono più solo accumulare dati, vogliono avere risposte, velocemente. Non è questo, in fondo, l’obiettivo della Business Intelligence?”.

Tra il dato e la risposta, però, ci sono diversi livelli di difficoltà che limitano il numero di richieste del business che gli analisti possono esaudire in un certo tempo.

  1. I dati devono essere scovati nei diversi database e data lake, e catalogati in modo che siano utilizzabili (aggiunta di meta-dati), compito particolarmente difficile per le fonti di dati non strutturati.
  2. Rispondere alle richieste richiede molto sforzo manuale dopo la fase di discovery.
  3. Le query su più fonti dati sono molto difficili.
  4. La necessità di governance dei dati complicano le possibilità di analisi.

promethium-bi-processPuò capitare che solo nella fase finale del processo si scopra che un errore o una formattazione non corretta dei dati hanno pregiudicato l’analisi, e bisogna ricominciare daccapo. Esaudire una richiesta complessa può impiegare mesi. L’obiettivo di Promethium è ridurre questo tempo a poche ore o minuti (“vogliamo passare da 4 richieste esaudite all’anno, a 4.000”, nelle parole di Lai).

La risposta di Promethium a questi problemi è rappresentata dal Data Navigation System (DNS), un servizio che eroga direttamente come Software as a Service ma che può essere anche installato nel cloud privato del cliente o anche on-premises e che supporta numerose fonti dati: Oracle, MS SQL, MySQL, Cloudera, Teradata, Hortonworks, Snowflake, AWS Aurora e AWS Athena.

Ecco come le diverse componenti di DNS funzionano nelle varie fasi dell’analisi.

Esplorazione dei dati

L’esplorazione dei dati disponibili viene fatta attraverso Smart Bot, che fornisce connessioni API per i data base, data lake e fonti dati vari, oltre a strumenti per la gestione dei metadati. Smart Explorer fornisce poi la possibilità di fare ricerche basate su keyword su tutte queste fonti dati, permettendo di cercare su valori e metadati e associando i termini di ricerca alle domande a cui questi possono rispondere.

Modellazione dei dati

NLP Question Builder è un metodo per tradurre una richiesta fatta in linguaggio naturale in un modello di dati mappato sulle fonti effettive, proponendo i dati più rilevanti da considerare nel costruire un modello logico che assista l’utente.

Data Map Builder fornisce una rappresentazione dinamica dei dati necessari a completare la richiesta, fornendo un diagramma di relazioni tra diverse tabelle e database.

Directions genera istruzioni passo passo per assemblare i dati richiesti alla query.

Costruzione delle query SQL

SQL AI converte l’output di Directions in un’espressione SQL, che può essere usata direttamente o modificata e che si può integrare con strumenti di Business Intelligence di terze parti, come Tableau. Attraverso la virtualizzazione e la simulazione, le query SQL possono essere applicate anche a dati non strutturati.

Virtualizzazione dei dati

Kaleidoscope crea una vista virtuale dell’espressione SQL e utilizza Apache Presto per ottimizzare le prestazioni e la scalabilità dell’effettiva aggregazione ed elaborazione dei dati.

Governance dei dati

Il modulo Guardian sovraintende sulla governance su tutte le fonti dati, restringendo la visibilità ai soli dati necessari alla query, evidenziando eventuali duplicazioni o problemi nella fase di discovery.

promethium-esempio

Dal sito di Promethium è possibile richiedere una dimostrazione o un periodo di prova gratuita del servizio.

Al momento la soluzione di Promethium non è pensata per consentire accesso diretto da parte degli utenti aziendali generici, ma per consentire ad analisti e db manager di rispondere alle richieste delle funzioni di business in modo più veloce, completo e sicuro. E non è certo poco.

Bouquet.ai: vuoi chattare col tuo database?

bouquet.aiTradurre domande espresse in linguaggio naturale in query SQL da lanciare sui database aziendali è invece l’obiettivo di Aristotle, servizio chatbot di Bouquet.ai, startup californiana ma nata a Parigi. Aristotle, che è disponibile come app su Slack ma dispone di API e connettori per interfacciarsi anche con Microsoft Teams, Skype, Facebook Messenger, servizi web e persino SMS (utile laddove non ci sia copertura internet). Aristotle interpreta i messaggi che gli utenti finali gli inviano e li traduce in query da inviare a diverse fonti dati (l’azienda dichiara di supportarne più di 100).

Un esempio di query eseguita in linguaggio naturale su Slack e della risposta di Aristotle.

Un esempio di query eseguita in linguaggio naturale su Slack e della risposta di Aristotle.

Ricevuti i dati risultanti dalla query, l’app li traduce in un messaggio di risposta che può contenere menu e selettori per approfondire il livello di dettaglio. Si va da “chi è il nostro contatto nell’azienda Acme?” a “qual è stata la scontistica media nell’ultimo trimestre?”. Il risultato può essere poi analizzato per regione, linea di prodotto, agente e ogni altro dettaglio disponibile nei database.

Gli esempi di utilizzo vanno dal rappresentante sul campo che può richiedere la disponibilità di un prodotto dal cellulare o i ricavi generati dal cliente che sta per visitare, ai manager che possono ottenere risposte immediate durante un meeting, all’assistenza ai clienti o partner, che possono ottenere risposte a domande complesse senza bisogno di far intervenire un operatore.

Adrien Schmidt, CEO di,Aristotle

Adrien Schmidt, CEO di,Aristotle

Il chatbot può essere addestrato per imparare sinonimi o un gergo aziendale specifico (ogni azienda ne ha uno…), e permette di impostare diversi livelli di accesso ai dati in base all’utente. Il database deve essere accessibile dall’esterno attraverso API o Jdbc, e viene direttamente supportato Salesforce.

Come detto, l’app Aristotle è disponibile sul marketplace di Slack, ed è anche possibile fare una demo live con l’interfaccia web disponibile sul sito di Bouquet.ai.