ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-04052019-150458


Tipo di tesi
Tesi di laurea magistrale
Autore
ANDREOZZI, ALESSANDRA
URN
etd-04052019-150458
Titolo
Leveraging Deep Learning for Automated Image Anonymization in the Insurance Domain
Dipartimento
INGEGNERIA DELL'ENERGIA, DEI SISTEMI, DEL TERRITORIO E DELLE COSTRUZIONI
Corso di studi
INGEGNERIA GESTIONALE
Relatori
relatore Prof.ssa Martini, Antonella
correlatore Dott. Ricciardi Celsi, Lorenzo
Parole chiave
  • insurance
  • image anonymization
  • deep learning
Data inizio appello
02/05/2019
Consultabilità
Non consultabile
Data di rilascio
02/05/2089
Riassunto
Sommario
Questo lavoro di tesi è il risultato di uno stage della durata di cinque mesi, inserito all’interno del programma Junior Consulting promosso da ELIS Consulting & Labs. Durante questo periodo, la candidata ha preso parte ad un progetto di consulenza finalizzato all’utilizzo degli strumenti di Image Analytics per la corretta gestione dei dati sensibili che vengono processati in ambito assicurativo, in conformità con la normativa Europea GDPR. L’obiettivo del progetto è stato quello di realizzare un algoritmo di Object Detection ed anonimizzazione di persone, targhe e numeri di telaio presenti in immagini, basato sui concetti di apprendimento supervisionato delle reti neurali profonde. La componente tecnologica dell’algoritmo è stata prodotta utilizzando il framework TensorFlow, che ha consentito di implementare una versione del modello RetinaNet in linea con le specifiche del task di anonimizzazione che è stato richiesto dal committente di progetto. Il lavoro svolto durante l’attività progettuale ha fornito lo spunto per lo svolgimento di una ulteriore analisi. L’oggetto dell’indagine ha riguardato le possibili modalità di sfruttamento dei più recenti strumenti di Intelligenza Artificiale nei processi dell’industria assicurativa, in modo tale da supportare una strategia di trasformazione digitale che dipende largamente dalla corretta gestione ed interpretazione dei dati. I risultati ottenuti dall’analisi della letteratura in merito evidenziano come l’implementazione di strumenti basati su modelli di machine learning e deep learning possa consentire alle aziende del settore assicurativo di migliorare i processi basati sull’analisi di dati strutturati e non strutturati (come le immagini). Tale miglioramento è potenzialmente quantificabile mediante l’incremento delle metriche di performance legate alla soddisfazione del cliente nel medio/lungo termine.

Abstract
This thesis work is the result of a five-month internship, included in a talent-program called Junior Consulting promoted by ELIS Consulting & Labs, in Rome. During this period, the candidate took part in a consulting project aimed at using Image Analytics tools for the proper management of sensitive data which are usually processed in insurance companies’ business processes, in order to be compliant with the GDPR European regulation. In this respect, the need has emerged for the implementation of an Object Detection algorithm, also aimed to remove license plates, Vehicle Identification Numbers (VIN), and persons from images used for insurance purposes, by relying on the supervised learning of deep neural networks. The technological part was realized using the TensorFlow framework, which allowed to implement a customized RetinaNet model in line with the anonymization task requirements that were specifically sought by the project client. In addition, the work carried out during the project provided the basis for further context analysis. The object of this additional survey concerns the possible ways of leveraging the most recent artificial intelligence tools in insurance business processes, in order to support a digital transformation strategy focused on value deriving from meaningful interpretation and management of data. The results which were obtained from the literature review show how the implementation of machine learning-based and deep learning-based tools allow insurance companies to improve their data-driven processes, unlocking value from the analysis of both structured and unstructured data (e.g., images). The benefits of this approach are expected to be measured in the medium/long run, in terms of positive impact on the customer satisfaction key performance indicators in the insurance domain.
File