Thesis etd-05192009-110522 |
Link copiato negli appunti
Thesis type
Tesi di laurea specialistica
Author
MARCHEGGIANI, DIEGO
URN
etd-05192009-110522
Thesis title
Active learning per estrazione di informazioni
Department
SCIENZE MATEMATICHE, FISICHE E NATURALI
Course of study
INFORMATICA
Supervisors
Relatore Dott. Sebastiani, Fabrizio
Relatore Dott. Esuli, Andrea
Relatore Dott. Esuli, Andrea
Keywords
- active learning
- information extraction
- information retrieval
- machine learning
Graduation session start date
05/06/2009
Availability
Full
Summary
L'active learning si occupa di definire una funzione di ranking che, dato un classificatore derivato da relativamente pochi esempi di training, ordina un insieme di esempi non etichettati in termini di quanta informazione ciascuno apporterebbe, a una fase di re-training che cerchi di ottenere un classificatore migliore.
In questa tesi proponiamo e testiamo alcune strategie realistiche di active learning per l'estrazione dell'informazione, e in particolare per il subtask della named entity recognition. Ogni strategia consiste in una regola che prende gli output del classificatore per ogni singola occorrenza di parola (token), li combina creando un valore per la frase a cui i token appartengono, e ordina le frasi non etichettate in base al valore che esse hanno ricevuto. Presentiamo i risultati di alcuni esperimenti sul corpus CoNLL 2003, uno dei corpora standard per la sperimentazione sulla named entity recognition.
In questa tesi proponiamo e testiamo alcune strategie realistiche di active learning per l'estrazione dell'informazione, e in particolare per il subtask della named entity recognition. Ogni strategia consiste in una regola che prende gli output del classificatore per ogni singola occorrenza di parola (token), li combina creando un valore per la frase a cui i token appartengono, e ordina le frasi non etichettate in base al valore che esse hanno ricevuto. Presentiamo i risultati di alcuni esperimenti sul corpus CoNLL 2003, uno dei corpora standard per la sperimentazione sulla named entity recognition.
File
Nome file | Dimensione |
---|---|
main.pdf | 612.61 Kb |
Contatta l’autore |