logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-10142020-204703


Tipo di tesi
Tesi di specializzazione (4 anni)
Autore
VITELLI, FEDERICA
URN
etd-10142020-204703
Titolo
Analisi della voce attraverso le Reti Neurali: applicazione di software nello screening delle disfonie.
Dipartimento
PATOLOGIA CHIRURGICA, MEDICA, MOLECOLARE E DELL'AREA CRITICA
Corso di studi
OTORINOLARINGOIATRIA
Relatori
relatore Prof. Fattori, Bruno
correlatore Dott. Nacci, Andrea
Parole chiave
  • disfonie
  • reti neurali
  • screening
  • software
  • voce
Data inizio appello
17/11/2020
Consultabilità
Non consultabile
Data di rilascio
17/11/2090
Riassunto
Background. La disfonia è un sintomo di alterazione qualitativa e/o quantitativa dell’emissione vocale che accompagna una modificazione strutturale o funzionale di uno o più organi coinvolti nella produzione della voce. Per alcune categorie di lavoratori, l’argomento relativo ai disturbi professionali derivanti da uno scorretto utilizzo della voce non è ancora stato definito pienamente in termini di screening e prevenzione. Lo scopo del nostro studio è quello di fornire file relativi alla valutazione della voce da analizzare tramite i Deep Learning, algoritmi di apprendimento automatico ispirati alle reti neurali biologiche con promettenti applicazioni nell’ambito di varie specialità mediche. L’obiettivo è quello di proporre uno strumento di screening di primo livello della voce in grado di indirizzare i soggetti disfonici dal foniatra o dal logopedista. Sarà poi loro compito eseguire su tali pazienti un’analisi completa della voce, al fine di stabilire la causa della disfonia ed impostare un’adeguata terapia. Materiali e Metodi. Sono stati utilizzati 828 file audio raccolti tra Gennaio 2013 e Luglio 2019 e convertiti in spettrogrammi. Ciascuno spettrogramma è stato catalogato secondo una nuova classificazione da noi ideata per poter essere poi analizzato dalle reti neurali. Risultati e conclusione. La nostra classificazione ha fornito risultati altamente accurati sia in termini di sensibilità che di specificità rispetto al gold standard per la diagnosi di disfonia rappresentato dalla laringostroboscopia. Inoltre, la successiva analisi degli spettrogrammi con le reti neurali ha permesso di ottenere risultati promettenti, raggiungendo percentuali di riconoscimento dei soggetti sani e patologici nel 94% dei casi.
File