Home Blog 5 consigli per inizi ...

5 consigli per iniziare ad usare gli Alternative Data

FinScience

La gestione delle risorse aziendali si sta evolvendo radicalmente, influenzata dai cambiamenti in atto nel mondo dell’informazione. Per rimanere competitivi, trader, gestori di portafogli e asset manager hanno sempre più bisogno di incorporare nuovi dati alternativi che si estendono ben oltre quelli tradizionalmente disponibili sul mercato finanziario e che sono stati le colonne che hanno sostenuto gli investimenti fino a oggi.

Questi dati alternativi provengono da fonti tra loro molto eterogenee, come ad esempio immagini satellitari, tracciamenti GPS di automobili e telefoni cellulari, dati transazionali delle carte di credito, news mainstream, blog post, social post e così via. Gli Alternative Data fino ad oggi vengono sempre più spesso utilizzati dalle aziende per scopi legati al marketing e alla comunicazione, o per arricchire la business intelligence. Tali dati però si stanno rivelando utili anche come supporto per indirizzare le scelte di investimento.

Scegliere quali dati utilizzare non è tuttavia semplice. Nell’enorme mare di informazioni prodotto quotidianamente, non tutte sono utili. Il processo di definizione del grado di utilità o non utilità di un dato alternativo deve sempre essere guidato dalla finalità pratica per cui si intende utilizzarlo. Ad esempio non è scontato che negli ormai 280 caratteri di Twitter vi sia del contenuto informativo utile per un asset manager o un analista finanziario, i quali è più opportuno che vadano a cercare informazioni in testi più ampi e maggiormente descrittivi del contesto di riferimento.

Inoltre, un eccesso informativo pone serie problematiche di gestione sistematica del dato. La necessaria scrematura non è possibile tramite i tradizionali strumenti di gestione dati, ma richiede l’utilizzo di algoritmi progettati appositamente.

Vediamo alcuni consigli utili per affacciarsi in modo proficuo nel mondo degli Alternative Data.

1. Scegliere un provider affidabile.

Identificare quale, tra le migliaia di fonti disponibili, è la più adatta alle nostre necessità può rivelarsi un compito arduo. Anche il numero di data provider è in continuo aumento, il che rende più complicato valutare compiutamente l’intero universo dei dati alternativi.

Le società interessate all’acquisto di informazioni dovrebbero cercare fornitori di Alternative Data che pre-elaborino dati non strutturati per fornire informazioni processate in un formato strutturato, interpretabile poi tramite propri modelli ed algoritmi. A meno che non si voglia diventare a propria volta dei data provider, il segreto è quello del testing continuo di nuove serie numeriche, da implementare senza soluzione di continuità.

2. Capire quali dati è bene monitorare.

Non tutti i dati sono utili o necessari. L’abilità consiste nell’assicurarsi che l’analisi includa solo le informazioni rilevanti e disponibili in un momento specifico, evitando così di aggiungere informazioni pregiudizievoli.

Altro aspetto critico è la gestione di dati sensibili: i garanti della privacy nei vari Paesi hanno sollevato preoccupazioni sull’aumento dell’utilizzo di dati di localizzazione degli utenti di telefonia mobile da parte degli hedge fund, al fine di monitorare le visite a negozi, palestre e ospedali. Operare quindi nel pieno rispetto ad esempio della normativa europea GDPR (acronimo per General Data Protection Regulation) è ad oggi una pre-condizione irrinunciabile. Il nocciolo della questione è l’effettivo anonimato del dato: o i dati vengono sfruttati in modo veramente anonimo, oppure devono essere trattati come dati personali e quindi rispettare tutte le regole e i requisiti del GDPR.

Sia i fornitori che i clienti devono capire da dove provengono veramente le loro informazioni, assicurandosi che non violino alcuna legge.

3. Prestare attenzione alla componente tecnica e metodologica.

Data la loro atipicità, non tutti sanno gestire tecnicamente i dataset alternativi, tanto è vero che solo lo 0,5% dei dati prodotti sino ad oggi dall’umanità è stato in qualche forma analizzato. Ancora meno, poi, sono coloro i quali sanno come estrarre valore dagli stessi (elaborazione di algoritmi in grado di scalare su più nodi per processazioni parallele dei dataset digitali).

Il primo passo nell’ottimizzazione della gestione e integrazione dei dati è la catalogazione di tutti i fornitori, delle tipologie di dati e la determinazione dell’interazione fra le varie parti che costituiscono la catena che trasmette l’informazione processata. Lo scambio di dati tra sistemi è la componente fondamentale di qualsiasi flusso di lavoro.

4. Quale modello di analisi adottare?

Tradizionalmente, l’analisi dei dati ha implicato un approccio quantitativo, in base al quale i dati altamente strutturati vengono elaborati in un foglio di calcolo o in un database.

I modelli quantitativi con dati tradizionali sono molto complessi ed elaborati, perché per creare “l’edge” e trovare l’alpha hanno bisogno di macinare in maniera differente da quello che fanno altri, i classici dati finanziari che sono a disposizione di tutti.

Individuare nuovi set di dati digitalizzati e combinare input di dati numerici da diverse fonti in genere richiede una sostanziale normalizzazione e mappatura dei dati, in modo che l’informazione possa essere uniformemente accessibile.

I modelli di analisi “digitale” o “misti” devono tenere conto dell’immensa mole di dati da macinare e quindi devono per forza essere più “semplici” nell’algoritmo, in quanto il valore aggiunto per ottenere un vantaggio sui competitor è il dataset alternativo.

5. Il lato umano del dato: l’esperto Digital.

Scegliere figure da inserire all’interno dell’azienda che siano in grado di interpretare e rendere fruibili queste informazioni è fondamentale.

I ruoli sono principalmente tre:

  • Il Data Analyst è colui che, agendo sui dati pre-processati, estrae elementi informativi di secondo livello dal dato (non si occupa perciò di modellistica), utili a scopi decisionali;
  • Il Data Scientist è colui il quale abilita l’intelligenza artificiale nell’estrarre informazioni dai dati alternativi, selezionando, migliorando o costruendo modelli di analisi degli stessi.
  • Il Data Engineer è la figura di raccordo tra i due, in quanto ingegnerizza i modelli del Data Scientist per consentire al Data Analyst di effettuare le proprie analisi.