Model-agnostic explanations of black box classifiers for image recognition
Dipartimento
INFORMATICA
Corso di studi
INFORMATICA
Relatori
relatore Monreale, Anna relatore Guidotti, Riccardo
Parole chiave
classification
classificazione
data mining
explanations
interpretabilità
interpretability
machine learning
saliency maps
spiegazioni
Data inizio appello
05/10/2018
Consultabilità
Non consultabile
Data di rilascio
05/10/2088
Riassunto
For image recognition tasks, prediction models with ad-hoc structures and high performances have been developed throughout the last years. Their particular architectures often nullify their level of interpretability, making them untrustable to the end user. The aim of this work is then to illustrate different strategies of explanations for image classification and provide the user with visual evidences that summarize the local behaviour of the classifier. Explanations can be used both to increase confidence in the model and understand the reasons of potential misclassifications. The proposed approach consists in highlighting parts of an image that are mainly responsible for a certain prediction.
Negli ultimi anni, nel campo del riconoscimento di immagini, sono stati sviluppati modelli di predizione con strutture ad-hoc e alte prestazioni. La loro particolare architettura sacrifica spesso il loro livello di interpretabilità, diminuendo la fiducia dell'utilizzatore. L'obiettivo di questo lavoro è illustrare diverse strategie di spiegazione e fornire all'utente spunti visuali che riassumano il comportamento locale del classificatore. Esse possono essere usate sia per aumentare la credibilità del modello che per correggere eventuali errori. L'approccio proposto consiste nell'evidenziare parti dell'immagine responsabili per una certa predizione.