KDM

KDM sta per Knowledge Discovery Machine ed è la nostra soluzione basata su AI di lettura automatizzata dei documenti (sotto forma di testo, video, voce, …), di conversione e categorizzazione in dati azionabili e di arricchimento eventuale con contenuti esterni e provenienti da fonti alternative.

Dedicato a Legal Advisory, Asset Management, Family Office, Credit & Risk Management

Ogni organizzazione produce e riceve milioni di documenti testuali, report, contratti, presentazioni, materiali audio e video, …

E stanno aumentando esponenzialmente le informazioni disponibili online: dalle news ai blog, forum, recensioni e social media, tutti sono pieni di dati potenzialmente utili.  Non si può pensare di analizzare e classificare tutto a mano.

I dipendenti delle aziende trascorrono 1,8 ore al giorno a cercare e raccogliere informazioni interne. In media sono 9,3 ore settimanali ossia il 23% delle ore di lavoro settimanali totali. Forse troppo!

I dipendenti delle aziende trascorrono 1,8 ore al giorno a cercare e raccogliere informazioni interne.

In media sono 9,3 ore settimanali ossia il 23% delle ore di lavoro settimanali totali. Forse troppo!

Fonte: McKinsey

Fonte: International Data Corporation

Convertiamo documenti (in ogni formato) in dati.

FinScience applica algoritmi proprietari di Intelligenza Artificiale per sintetizzare contenuti, estrarre e classificare dati provenienti da enormi volumi di documenti.

1

Grande quantità di documenti (testi, audio, video, …)

2

KDM digitizza, estrae dati, categorizza e sintetizza i contenuti

3

KDM genera accurati risultati di ricerca arricchiti eventualmente con insight provenienti dagli Alternative Data

Il caso NPL

Dalla carta all'analisi dei testi

Usiamo tecnologie di NLP (Natural Language Processing) e di machine / deep learning di nostra proprietà e tecnologie di digitizzazione dei documenti cartacei di PaperLit (tech company specializzata nella Digital Transformation dell’Editoria, parte del nostro stesso gruppo Datrix).

Digitizzazione dei contenuti

  • La tecnologia OCR trasforma in testi digitali editabili le scansioni di documenti cartacei o in formato .pdf
  • Ogni estrazione di testi è valutata con un punteggio di qualità

Individuazione delle frasi chiave

  • Sulla base dell’esempio fornito dal cliente di clausole di trasferibilità dei prestiti, viene generata una lista di frasi chiave interessanti per permettere il training degli algoritmi di machine learning
  • Mappatura delle frasi con possibili tipologie di esito (trasferibile, non trasferibile, …)

Analisi dei documenti

  • Analisi NLP dell’intera documentazione
  • Per ciascun caso, le parti “interessanti” di testo sono individuate per similitudine o prossimità con le frasi chiavi precedentemente evidenziate. Questo genera un “punteggio di interesse” utile per le analisi successive. 

Graduatoria dei documenti

  • Sulla base dei risultati precedenti, ciascun possibile esito genera un classificatore in grado di descrivere sinteticamente le caratteristiche dei prestiti e il loro status determinato dalle clausole.
  • Viene creato automaticamente un documento di sintesi finale.

Metodologia innovativa

KDM si basa su 4 principali fasi operative

1

Digitizzazione / sintesi

2

Classificazione

3

Etichettatura

4

Arricchimento

In FinScience abbiamo affrontato diverse sfide, tra le quali il raggruppamento di documenti simili e riassunto degli stessi in maniera non supervisionata, estrazione delle emozioni contenute in un testo tramite algoritmi proprietari basati su deep learning, definizione delle parole chiave in un testo (le parole presenti nel testo vengono rappresentate tramite i nodi di una rete; si cerca poi di misurare quale siano i nodi più importanti all’interno della rete similmente a quanto viene fatto nel celebre PageRank di Google), classificazione supervisionata di una grande quantità di documenti a partire da un insieme di etichette specifiche (tag) in ambito legale.

Per risolvere questi problemi è necessario riuscire a coniugare conoscenza di campo, collaborando ad esempio con avvocati nel caso di applicazioni legali, e conoscenza tecnologica di algoritmi e programmazione.

FinScience ha esperienze relative alla conversione in dati di contratti sottostanti a Non-performing Loan (NPL), compravendite immobiliari, sviluppo di indicatori alternativi di investimento e strategie quantamental, valutazione ESG delle aziende in particolare misurazione della distanza tra quanto autodichiarato nei bilanci di sostenibilità e la percezione esterna, miglioramento dell’affidabilità dei modelli di stima rischio default delle PMI.

Leggi anche

La “datizzazione” dei testi.

La “datizzazione” dei testi. 1022 700 FinScience

Trasformare documenti in dati per migliorare decisioni, azioni e risultati…

Vantaggi principali

1

trova quello che stai cercando più velocemente

2

risparmia tempo per le attività più importanti 

3

riconosci le informazioni nascoste nei tuoi documenti

4

trova connessioni tra soggetti / oggetti presenti nei tuoi contenuti e in dati esterni

Il valore aggiunto degli Alternative Data

Scopri le soluzioni ed i servizi FinScience più adatti alla tua attività.

Il valore aggiunto degli Alternative Data

Scopri le soluzioni ed i servizi FinScience più adatti alla tua attività.