logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-03282022-170235


Tipo di tesi
Tesi di laurea magistrale
Autore
DIPASQUALE, CELESTE
URN
etd-03282022-170235
Titolo
Valutazione di strumenti per l'estrazione e l'analisi automatica di sottotitoli impressi nei video
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Relatori
relatore Prof.ssa Simi, Maria
correlatore Dott. Serramazza, Davide Italo
Parole chiave
  • annotazione morfosintattica
  • annotazione linguistica
  • Optical Character Recognition
  • Text Mining
  • NLP
  • keywords
  • video
  • remix
  • PH-Remix
  • valutazione
  • entità nominali
  • NER
Data inizio appello
14/04/2022
Consultabilità
Completa
Riassunto
Il presente lavoro di tesi si pone l'obiettivo di valutare gli strumenti per l'estrazione e l'analisi automatica dei sottotitoli, in lingua inglese, impressi in film documentari.
Sono valutate varianti dell'output di un modello di estrazione di testo dai singoli fotogrammi per raggrupparli, sulla base del sottotitolo, in un'unica clip.
Dai sottotitoli rilevati sono estratte, automaticamente, le informazioni linguistiche a livello di annotazione morfologica e sintattica.
Sono, inoltre, utilizzati strumenti per l'estrazione di entità nominali (NER o Named Entity Recognition).
Le informazioni estratte rappresentano le etichette che identificano una singola clip e consentono la ricerca della clip all'interno di una piattaforma web: PH-Remix.
File