Home Blog Big Data e Alternati ...

Big Data e Alternative Data: da dove provengono e quali sono le differenze.

Fabrizio Milano d'Aragona

Il mondo moderno è un calderone in continua ebollizione, un luogo nel quale gli step evolutivi impressi dallo sviluppo umano sono così repentini e portentosi che spesso risulta difficile comprenderne la natura e addirittura individuarne l’inizio esatto.

Non è solo una questione di innovazioni, almeno non direttamente. A livello sociale, i cambiamenti sono figli anche dell’aumentata capacità di osservazione e descrizione del quotidiano. Siamo capaci di tracciare nel dettaglio la vita di ciascuno di noi tramite la raccolta e l’analisi di dati correlati alle nostre abitudini giornaliere. E lo stesso discorso può essere fatto per analogia con la “vita” dei soggetti economici operanti nei mercati.

Questo insieme di informazioni suscettibile di raccolta e analisi è conosciuto con l’espressione inglese “Big Data”.

Con questa definizione, ci si riferisce al processo algoritimico utilizzato per portare alla luce informazioni nascoste all’interno di set di dati non strutturati e di dimensioni troppo grandi per essere processati da tradizionali database relazionali. Il dato nudo e crudo non ha utilità se prima non viene processato.

Il concetto stesso è in continua evoluzione, in quanto rappresenta la spinta dietro molte delle trasformazioni digitali in atto, incluse l’intelligenza artificiale e l’Internet delle cose.

I Big Data riflettono i cambiamenti del mondo in cui viviamo. Maggiore è il loro numero, maggiore è la quantità di dati che vengono prodotti e possono essere registrati. Si tratta di una mole di informazioni davvero enorme. Per intenderci, attualmente creiamo ogni due giorni l’equivalente di dati prodotto dall’umanità a partire dai suoi albori fino al 2003, secondo “Il filtro. Quello che internet ci nasconde”.

Come funzionano i Big Data.

Tutto è iniziato con l’esplosione della quantità di dati generati dall’avvento dell’era digitale che ha portato con sé la diffusione dei computer, di Internet e della tecnologia capace di registrare e conservare quanto prodotto. Mentre questa mole di dati continua a aumentare con fattori di crescita esponenziali, si comprende che, se opportunamente organizzati e messi in correlazione secondo regole predefinite, possono rappresentare un vantaggio rispetto ai competitor.

Il principio è semplice: più si conosce un qualsiasi argomento o situazione, più attendibili sono gli insights che si possono ottenere sull’evoluzione futura. Confrontando più punti, le relazioni tra dati prima nascoste cominciano ad emergere, e queste relazioni ci permettono di migliorare e prendere così decisioni più intelligenti e redditizie.

Comunemente, questo viene fatto attraverso un processo che prevede la costruzione di modelli, basati sui dati che possono essere raccolti, e quindi con l’esecuzione di simulazioni, modificando continuamente il valore dei punti e monitorando il modo in cui ciò può influire sui risultati. Questo processo è automatizzato: la moderna tecnologia analitica basata su sofisticati algoritmi può eseguire milioni di queste simulazioni in brevissimo tempo, modificando tutte le possibili variabili fino a quando non troverà uno schema, o un’intuizione, che aiuti a risolvere il problema su cui sta lavorando.

Gli Alternative Data.

All’interno dei Big Data possiamo distinguere gli Alternative Data come quei set di dati strutturati e non strutturati tipicamente non utilizzati per prendere decisioni di investimento, ma ad alto potenziale di utilità per questo scopo, ricavati da fonti particolari come:

  • news feed;
  • social;
  • informazioni geospaziali e immagini satellitari;
  • transazioni finanziarie.

L’analisi degli Alternative Data può fornire insights più efficaci di quelli ricavabili dalle fonti utilizzate usualmente.

La questione di cosa costituisca un dato alternativo varia in funzione del settore preso in esame. In quello bancario, ad esempio, un istituto può tradizionalmente fare affidamento sul punteggio di credito di un potenziale cliente per valutare il rischio e determinare la probabilità che un prestito venga rimborsato. Tuttavia, se il richiedente non ha precedenti di credito, i dati alternativi che descrivono la capacità “storica” del richiedente di adempiere a obblighi finanziari possono essere informazioni utili al raggiungimento dello scopo.

Immaginiamo che un albergatore richieda un finanziamento in banca. La presenza di giudizi estremamente positivi di una struttura alberghiera su TripAdvisor può costituire un valido indicatore dell’afflusso di turisti nella struttura medesima: più recensioni positive indicano maggiore visibilità e quindi più prenotazioni. Questo implica che vi siano più soldi in cassa e di conseguenza una capacità di rimborso più alta.

In conclusione, oggi è molto difficile ignorare l’utilizzo di queste nuove informazioni se si vuole competere con successo sul mercato, e farlo può tramutarsi in un handicap rispetto alla concorrenza del proprio settore. Per sfruttarli correttamente, occorre comunque scegliere il giusto set di dati e tenere a mente che non è la quantità ma la qualità delle informazioni (e di riflesso dell’algoritmo utilizzato) a fare la differenza.