tecnologie e saperi tra università e impresa
Numero 14 | Anno 6 | Febbraio 2016

Francesco Profumo, Flavio Deflorian, Fabio Massacci, convegno "Deep Natural Language Processing for Cognitive Dialog Systems", foto archivio Università di Trento

Primo piano

L’EVOLUZIONE DEL DIALOGO UOMO-MACCHINA

Assegnato l’IBM Faculty Award a una ricerca dell’Ateneo nel campo dei sistemi di Question Answering

Versione stampabile
di Simona Sorrentino
Lavora presso la Divisione Supporto alla Ricerca Scientifica e al Trasferimento Tecnologico dell’Università di Trento.
L’importante riconoscimento al Dipartimento di Ingegneria e Scienza dell’Informazione (DISI) segna una nuova tappa nella consolidata collaborazione con il gruppo IBM.

Intervista di Simona Sorrentino ad Alessandro Moschitti.

L'Università di Trento si è aggiudicata, anche per il 2015, uno dei rari IBM Faculty Awards assegnati annualmente a gruppi di ricerca altamente qualificati, selezionati a livello mondiale e attivi in settori strategici per il colosso tecnologico americano dell’informatica. 
Il premio, nell’ambito del cognitive computing, è stato conferito il 18 novembre 2015 ad Alessandro Moschitti, professore associato del Dipartimento di Ingegneria e Scienza dell’Informazione (DISI) dell’Ateneo, in occasione del convegno” Deep Natural Language Processing for Cognitive Dialog Systems”. Le ricerche del professor Moschitti erano già state premiate da IBM nel 2010, 2011 e 2013. Il rinnovato interesse di IBM per il progetto vincente “Hybrid Knowledge Retrieval for Dialog and Question Answering” conferma le potenzialità future dell’elaborazione automatica del linguaggio naturale, tecnologia sviluppata dall'Università di Trento e da altri centri trentini come la Fondazione Bruno Kessler e il CNR.

Professor Moschitti, cosa si intende per Natural Language Processing o NLP? 
NLP identifica la ricerca sulle tecniche, modelli, teoria e algoritmi per l’elaborazione del linguaggio naturale; riguarda quindi i procedimenti automatici che estraggono dal testo una serie di informazioni linguistiche come, ad esempio, la morfologia delle parole, la struttura sintattica di una frase o l’individuazione di concetti ed entità, fino all’elaborazione semantica dell’intero testo.
Una definizione più moderna e applicativa potrebbe essere la seguente: il Natural Language Processing riguarda la teoria, gli algoritmi e i sistemi automatici che migliorano la gestione di testi semplici, ad esempio per traduzioni da una lingua all’altra o per estrarre informazioni su una persona o un’entità di rilievo da milioni di documenti o, ancora, per la ricerca di informazioni in base alla semantica della domanda invece che in base alle sole parole usate individualmente.

Quali sono gli obiettivi della tecnologia, premiata da IBM, che il vostro gruppo ha elaborato?
L’obiettivo primario è sviluppare sistemi intelligenti di ricerca che possano reperire informazioni in base a domande di elevata complessità formulate dagli utenti in linguaggio naturale. Tali sistemi sono chiamati Question Answering (QA) Systems e, tipicamente, rispondono a domande molto più complesse di quelle poste ai motori di ricerca, i quali raramente possono fornire risposte corrette per questa tipologia di richieste, oppure incapsulano le risposte in documenti molto lunghi. Ovviamente, l’interpretazione di domande complesse può essere difficile anche per un essere umano, il quale può chiedere un chiarimento o un’esemplificazione al suo interlocutore, iniziando quindi, un dialogo. 
Il mio gruppo si è aggiudicato il premio IBM esattamente per contribuire a costruire sistemi allo stato dell’arte che integrino sistemi di Question Answering con tecnologia di dialogo.

Il dialogo uomo-macchina è in continua evoluzione. Quali sono le prossime frontiere da superare? 
Il dialogo uomo-macchina è un ambito di ricerca molto attivo iniziato diverse decine di anni fa con i cosiddetti Sistemi Esperti come ad esempio ELIZA. La sua complessità è tale che per decenni non si è riusciti a modellarlo in modo efficace con tecniche di apprendimento automatico (machine learning). Queste ottimizzano la probabilità di fornire la risposta adeguata attraverso analisi statistiche. 
Sfortunatamente anche recentemente le tecniche più moderne, come l’apprendimento con rinforzo, non forniscono ancora soluzioni soddisfacenti per domini di applicazioni di dialogo complessi.
In questo ambito, una direzione di ricerca che anche il mio gruppo sta seguendo è l’utilizzo di approcci ibridi basati su tecniche di ricerca di informazione non strutturata, come il Question Answering, e tecniche base di dialogo. Questa sembra essere una direzione interessante per abbattere una delle frontiere più complesse dei sistemi di dialogo, ossia il loro uso per domini più ampi e non limitati a semplici contesti applicativi come, ad esempio, domande specifiche su prodotti specifici nei call-center

Uno dei settori applicativi del Natural Language Processing è la medicina; quale supporto potrebbe fornire? 
Uno dei principali problemi in questo settore è rendere disponibili ai medici le informazioni della loro intera comunità e coordinarle per crearne una sintesi favorendo, così, la correttezza delle diagnosi mediche.
Spesso, il lavoro del medico si traduce nel riconoscere pattern di sintomi del paziente, tipicamente descritti in documenti medici. I sistemi di NLP, tra i quali IBM Watson è sicuramente un precursore, saranno in grado, in base alle domande inserite, di restituire i documenti contenenti i pattern desiderati e di enfatizzare le sezioni che il medico non conosce, migliorando, così, la capacità di diagnosi.
Altri supporti, al momento ancora futuristici, prevedono la capacità di combinare l’informazione di diverse sorgenti rispetto a una domanda fatta dal medico in modo da determinare, eseguendo un compito creativo, nuove cure o conclusioni non presenti nelle basi di dati. 

Quali altri settori potrebbero essere migliorati o addirittura rivoluzionati in futuro? 
L’analisi della semantica di documenti testuali può essere determinante in ogni ambito applicativo. Nell’era dell’Information Technology chi può accedere in modo più veloce e completo all’informazione rilevante per i suoi ambiti di interesse è sicuramente in vantaggio rispetto ai suoi concorrenti: questo dà un vantaggio concreto nell’ambito delle applicazioni industriali.

Il premio rappresenta una nuova tappa della collaborazione con il gruppo IBM. Quali saranno gli ulteriori sviluppi?
La collaborazione con IBM continua da circa sette anni; è partita direttamente dai laboratori IBM di New York, ai tempi del famoso supercomputer IBM Watson, e si è consolidata anche grazie alla lungimiranza dei manager e ricercatori di IBM Italia che hanno riconosciuto le grandi opportunità industriali della tecnologia del NLP per il cui sviluppo futuro l’Ateneo trentino potrà essere una componente chiave.