ETD system

Electronic theses and dissertations repository

 

Tesi etd-06302017-121959


Thesis type
Tesi di laurea magistrale
Author
BARILARI, GIANLUCA
URN
etd-06302017-121959
Title
Advanced Methods for Technology Mapping and Intelligence
Struttura
INGEGNERIA DELL'ENERGIA, DEI SISTEMI, DEL TERRITORIO E DELLE COSTRUZIONI
Corso di studi
INGEGNERIA GESTIONALE
Commissione
relatore Prof. Bonaccorsi, Andrea
correlatore Dott. Chiarello, Filippo
Parole chiave
  • text mining
  • patent analysis
  • clustering
  • industry 4.0
Data inizio appello
19/07/2017;
Consultabilità
parziale
Data di rilascio
19/07/2020
Riassunto analitico
L&#39;ultimo decennio ha visto il moltiplicarsi delle tecniche di Data Mining, contestualmente alla nascita di un<br>nuovo background culturale.<br>All&#39;interno della pletora di tecniche emerse, la definizione di Text Mining racchiude strumenti e metodi<br>utilizzati nell&#39;analisi documentale.<br>Questo lavoro ha lo scopo di definire una nuova metodologia, basata sul concetto di Features, intese come<br>parole singole o multiple in grado di descrivere il documento tramite il suo contenuto tecnico. Selezionando il<br>giusto set di Features è infatti possibile analizzare la similarità tra documenti appartenenti ad un medesimo<br>corpus in maniera performante, ottenendo preziose informazioni da essi.<br>Lo strumento utilizzato a tale scopo è la Matrice Documenti-Features, punto di partenza per le successive<br>analisi di similarità attraverso cui costruire successivamente i cluster contenenti gli oggetti più simili tra loro.<br>La metodologia è stata validata usando un primo set brevettuale contenente invenzioni catalogate secondo<br>quattro differenti categorie IPC, già conosciute in partenza. I risultati ottenuti dimostrano come sia possibile<br>selezionare appropriatamente un dizionario in maniera tale da ottenere una distinzione tra i documenti che<br>rispecchi le loro differenze tecnologiche, certificate tramite la classe di appartenenza.<br>Il Caso Studio successivo ha riguardato l&#39;applicazione della tecnica alla ricerca di brevetti nel campo<br>Industry 4.0; l&#39;attività è stata svolta in collaborazione con Errequadro Srl. nell&#39;ambito di una application<br>per EPO. Stavolta è stato testato il Technimetro 4.0, un dizionario contenente Features afferenti al concetto<br>di Industria 4.0. L&#39;oggetto di analisi, dopo una prima scrematura su quattro tecnologie (Augmented/virtual<br>reality, Barcode/RFID, Blockchain), ha riguardato l&#39;analisi di brevetti legati a Blockchain.<br><br><br>Data Mining techniques acquired growing importance during the last decade, contextually to the born of<br>a new industrial background. In this situation of innovative turbulence is fundamental to delineate methods<br>to be able to detect and map emerging technologies; monitoring patents and technical papers, particularly,<br>could give the meter of how new paradigms born and raised.<br>Text Mining is the global definition of tools and tasks used to analyze documents, including clustering<br>algorithms, citation analysis, co-word analysis, overlay mapping, pattern recognition.<br>This work aims to define a new method for Text Mining, basing on the concept of Features, intended<br>as single or multiple words able to describe a document in its technical content. Selecting the proper set<br>of features to analyze patents could give useful information on how a patent set is composed, and what are<br>the relations between documents. Various sets of features were tested, using Document-feature matrices to<br>relate terms with their occurrences in each document; these information gave a measure of similarity by<br>which clustering patents in order to observe their distribution, using both a graphical visualization and a<br>clustering algorithm of new conception.<br>The method was validated using a known set of patents, pertaining to four di erent IPC classes, chosen for<br>the verticality between two of them and the transversal position of the remaining two, with characteristics<br>common with both of them. The results obtained demonstrated that is possible to maximize distances<br>between patent classes by selecting suitable sets of features; in particular it emerges that a set of Actions<br>qualifies for distinguish patents.<br>Once validated, the method was applied to a Case Study to retrieve patents in the environment of<br>Industry 4.0 concept. The activity was done in collaboration with Errequadro Srl, due to apply for a EPO<br>project. The aim of the work was to test Technimeter 4.0, a list of features consisting in technologies of<br>Industry 4.0; firstly the terms were used to make queries for retrieving patents related to three technologies<br>(Augmented/virtual reality, Barcode/RFID, Blockchain), then the patent set containing documents about<br>Blockchain was analyzed using the method described above and the features of the Technimeter.
File