logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-09062015-153223


Tipo di tesi
Tesi di laurea magistrale
Autore
CHIARELLO, FILIPPO
URN
etd-09062015-153223
Titolo
Strumenti a supporto dell'analisi di testi tecnici
Dipartimento
INGEGNERIA DELL'ENERGIA, DEI SISTEMI, DEL TERRITORIO E DELLE COSTRUZIONI
Corso di studi
INGEGNERIA GESTIONALE
Relatori
correlatore Dott. Dell'Orletta, Felice
relatore Prof. Fantoni, Gualtiero
Parole chiave
  • analisi automatica del testo
  • analisi testuali
  • articoli scientifici
  • automatic analysis of text
  • brainstorming
  • brevetti
  • technical texts
  • testi tecnici
  • text mining
Data inizio appello
23/09/2015
Consultabilità
Non consultabile
Data di rilascio
23/09/2085
Riassunto
[ITALIANO] In questa tesi viene discussa l’applicazione di strumenti di analisi automatica del testo a corpus di testi tecnici in ambito innovazione. La gestione della documenta- zione tecnica in azienda è vista quindi come un potenziale vantaggio competitivo e l’utilizzo delle informazioni contenute in essa diventa un driver per il controllo della crescente turbolenza del mercato. La prima analisi è su testi brevettuali in ambito automotive. Qui si vanno ad estrarre e a mettere in relazione tre tipologie di entità particolarmente rilevanti riguardo l’invenzione descritta nel brevetto: utenti, van- taggi e svantaggi. Ciò che è emerso è la possibilità di estrarre informazioni sensibili tanto per la progettazione quanto per il marketing. Si passa poi ad un’analisi su abstract di articoli scientifici riguardanti le lavorazioni micro-milling. Il lavoro si è concentrato sul individuare gli argomenti rilevanti all’interno del corpus di ar- ticoli estratti. Sono state create quindi due blacklist (di contesto e generica) per il filtraggio dei termini ed un metodo statistico di selezione dei termini rimanenti. Tale strumento si è dimostrato efficace per una rapida analisi dello stato dell’arte su una tecnologia e per individuare trend emergenti a riguardo. Vengono infine analizzate idee in output da un brainstorming su un orologio per la misurazione della qualità del tempo. Qui ci si è concentrati sull’effettuare una clusterizzazione sulle idee e sulle parole semanticamente simili. Ciò ha permesso di ottenere un’im- mediata analisi dei risultati del brainstorming e soprattutto l’individuazione delle idee particolari in quanto diverse dalle altre.

[ENGLISH] The tools application for automatic analysis of technical corpus texts, in innova- tion area, are discussed in this thesis. The technical documentation management is a potential competitive advantage and the use of the contained information become a key for the control of increasing stormy market. The first analysis concerns about patents in car industry. The three relevant subjects of the invention, described in the patent, and extracted for the analysis are users, advantages and failures; what has appeared is the possibility to extract sensitive information as for the design in- dustry as for the marketing area. The second analysis concerns about abstracts of scientific documents applicable of micro-milling technology. The target is focused on identifying relevant topics on the corpus texts. In view of this were generated two blacklists (about context and a generic one) for filtering terms and a statistical method of selection of the remaining terms. This tool has proved to be valid for quick analysis of the state-of-the-art of the technology and to identify emerging trends on this matter. Finally new ideas were analyzed through a brainstorming on a clock, which measures the time quality. The focus was clustering semantically similar ideas. This allowed to obtain an immediate analysis of the brainstorming results and, in particular, the identification of unconventional ideas.
File