Tesi etd-03182026-203940 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea magistrale
Autore
PIETRICCIOLI, ALICE
URN
etd-03182026-203940
Titolo
Unsupervised Segmentation of Industrial Machines for Usage Pattern Analysis
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof. Guidotti, Riccardo
correlatore Prof. Mazzei, Daniele
correlatore Prof. Mazzei, Daniele
Parole chiave
- analisi dei dati mancanti
- apprendimento non supervisionato
- clustering di serie temporali
- dati industriali
- industrial data
- missing value handling
- time series clustering
- unsupervised learning
Data inizio appello
10/04/2026
Consultabilità
Non consultabile
Data di rilascio
10/04/2029
Riassunto (Inglese)
This thesis is situated within the context of industrial data analysis and is based on data provided by Zerynth, a company operating in the field of industrial machine monitoring. The main objective of the work is the definition of a methodology for the segmentation of machines, based on the analysis of specific operational variables, particularly related to power and consumption, in order to enable meaningful comparisons between assets characterized by similar usage behaviors, independently of the company context or the production sector.
The work begins with an exploratory analysis of the provided historical data. Subsequently, a data preparation phase is addressed, which includes the extraction of time series, the construction of consolidated datasets, and the handling of missing values, with the aim of making the data suitable for subsequent analyses.
The thesis continues with the definition and comparison of different clustering strategies based on the representation and approximation of univariate time series, applied to the selected variables of interest.
A non-supervised clustering pipeline is then selected and implemented, designed to identify increasing levels of dissimilarity in machine behavior. Finally, the obtained results are presented through different graphical representations, in order to facilitate their interpretation.
The work begins with an exploratory analysis of the provided historical data. Subsequently, a data preparation phase is addressed, which includes the extraction of time series, the construction of consolidated datasets, and the handling of missing values, with the aim of making the data suitable for subsequent analyses.
The thesis continues with the definition and comparison of different clustering strategies based on the representation and approximation of univariate time series, applied to the selected variables of interest.
A non-supervised clustering pipeline is then selected and implemented, designed to identify increasing levels of dissimilarity in machine behavior. Finally, the obtained results are presented through different graphical representations, in order to facilitate their interpretation.
Riassunto (Italiano)
La presente tesi si inserisce nel contesto dell’analisi dei dati industriali e prende avvio dai dati forniti da Zerynth, azienda operante nel monitoraggio di macchinari industriali. L’obiettivo principale del lavoro è la definizione di una metodologia per la segmentazione dei macchinari, basata sull’analisi di specifiche variabili operative, in particolare legate a potenza e consumo, al fine di consentire confronti significativi tra asset caratterizzati da comportamenti di utilizzo simili, indipendentemente dal contesto aziendale o dal settore produttivo.
Il lavoro inizia con un’analisi esplorativa dei dati storici forniti. Successivamente, viene affrontata una fase di data preparation, che include l’estrazione delle serie temporali, la costruzione di dataset consolidati e la gestione dei valori mancanti, al fine di rendere i dati idonei alle analisi successive.
La tesi prosegue con la definizione e il confronto di diverse strategie di clustering basate sulla rappresentazione e sull’approssimazione delle serie temporali univariate, applicate alle variabili di interesse selezionate.
Viene quindi scelta e implementata una pipeline di clustering non supervisionato, progettata per individuare livelli crescenti di dissimilarità nel comportamento dei macchinari. Infine, i risultati ottenuti vengono presentati attraverso diverse rappresentazioni grafiche, al fine di facilitarne l’interpretazione.
Il lavoro inizia con un’analisi esplorativa dei dati storici forniti. Successivamente, viene affrontata una fase di data preparation, che include l’estrazione delle serie temporali, la costruzione di dataset consolidati e la gestione dei valori mancanti, al fine di rendere i dati idonei alle analisi successive.
La tesi prosegue con la definizione e il confronto di diverse strategie di clustering basate sulla rappresentazione e sull’approssimazione delle serie temporali univariate, applicate alle variabili di interesse selezionate.
Viene quindi scelta e implementata una pipeline di clustering non supervisionato, progettata per individuare livelli crescenti di dissimilarità nel comportamento dei macchinari. Infine, i risultati ottenuti vengono presentati attraverso diverse rappresentazioni grafiche, al fine di facilitarne l’interpretazione.
File
| Nome file | Dimensione |
|---|---|
La tesi non è consultabile. |
|