FinTech company del gruppo Datrix
  • 23 Aprile 2021

AI per leggere, capire e classificare i documenti bancari

AI per leggere, capire e classificare i documenti bancari

AI per leggere, capire e classificare i documenti bancari 1024 576 FinScience

di Marco Belmondo, Chief Marketing Officer del gruppo Datrix

La definizione di un glossario univoco dei termini di business è oggi uno dei filoni principali su cui si stanno concentrando le attività di data governance.

In questa ottica una nota banca ci ha chiesto di costruire un modello data-driven di glossario bancario in grado di:

  1. leggere tutti i suoi documenti interni (procedure, circolari, guide operative, manuali utente, contratti, …), anche quelli scritti in “banchese”
  2. evidenziare i principali concetti
  3. ricondurre tali concetti a delle tassonomie di riferimento

L’esigenza della banca è nata dall’enorme quantità di documenti prodotti nel tempo e dal bisogno di essere più efficiente, reperendo immediatamente quelli utili alla necessità del momento dell’operatore. La classificazione automatica riduce l’impegno manuale, azzera praticamente i tempi di esecuzione, favorisce la revisione migliorativa dell’intera documentazione e l’eliminazione di quanto non più attuale e utile.

Solo a mo’ di esempio si pensi al caso attuale per cui entro il 2021 le banche devono eliminare da tutti i documenti ogni riferimento, diretto o indiretto, al tasso Libor. Non può essere un lavoro manuale, per lo meno con una scadenza così ravvicinata. Ecco che la tecnologia basata su Intelligenza Artificiale viene in supporto dell’uomo.

Il progetto glossario bancario

Per svolgere l’attività commissionataci dalla banca abbiamo applicato la nostra soluzione Knowledge Discovery Machine basata su tecnologie di NLP, cioè di lettura e comprensione di testi e immagini (dati non strutturati) e di restituzione in forma organizzata e classificata (dati strutturati). Con la possibilità di aggiungere alert su specifici dati meritevoli di immediata attenzione.

Abbiamo operato suddividendo il progetto in due fasi.

NLP Banca Lettura, comprensione e classificazione documenti 1Fase 1

  • Analisi semantica dei documenti interni
  • Evidenziazione dei «concetti», ossia entità logiche trattate nel documento (organizzazione, processo, servizio/prodotto, privacy…)
  • Apposizione ad ogni documento di taggature relative ai vari concetti

In questa fase abbiamo allenato la macchina insegnandole il “banchese” in generale e quello specifico della banca cliente, sulla base di esempi che ci sono stati resi disponibili. Abbiamo quindi studiato una classificazione comune dei concetti.

classificazione documenti interni bancaFase 2

Associazione delle taggature a delle tassonomie di riferimento, ad esempio mappa delle informazioni, mappa dei processi, mappa delle applicazioni.

L’attività ha aiutato anche a ottimizzare le tassonomie a partire dai concetti presenti nella documentazione. L’analisi incrociata di tag e contenitori tematici ha contribuito anche al miglioramento della qualità dei documenti rispetto ai concetti trattati.

SCOPRI LA TECNOLOGIA DI ANALISI DOCUMENTALE AUTOMATIZZATA

Datrix Data Breakfast

Le newsletter di approfondimento del gruppo Datrix

Trend, novità e casi studio sull'applicazione di dati e Intelligenza Artificiale a Marketing & Sales, Investing e Publishing.

Iscriviti subito