Tesi etd-03182026-203940

Tipo di tesi

Tesi di laurea magistrale

URN

etd-03182026-203940

Titolo

Unsupervised Segmentation of Industrial Machines for Usage Pattern Analysis

Dipartimento

INFORMATICA

Corso di studi

DATA SCIENCE AND BUSINESS INFORMATICS

Relatori

relatore Prof. Guidotti, Riccardo
correlatore Prof. Mazzei, Daniele

Parole chiave

analisi dei dati mancanti
apprendimento non supervisionato
clustering di serie temporali
dati industriali
industrial data
missing value handling
time series clustering
unsupervised learning

Data inizio appello

10/04/2026

Consultabilità

Non consultabile

Data di rilascio

10/04/2029

Riassunto (Inglese)

This thesis is situated within the context of industrial data analysis and is based on data provided by Zerynth, a company operating in the field of industrial machine monitoring. The main objective of the work is the definition of a methodology for the segmentation of machines, based on the analysis of specific operational variables, particularly related to power and consumption, in order to enable meaningful comparisons between assets characterized by similar usage behaviors, independently of the company context or the production sector.
The work begins with an exploratory analysis of the provided historical data. Subsequently, a data preparation phase is addressed, which includes the extraction of time series, the construction of consolidated datasets, and the handling of missing values, with the aim of making the data suitable for subsequent analyses.
The thesis continues with the definition and comparison of different clustering strategies based on the representation and approximation of univariate time series, applied to the selected variables of interest.
A non-supervised clustering pipeline is then selected and implemented, designed to identify increasing levels of dissimilarity in machine behavior. Finally, the obtained results are presented through different graphical representations, in order to facilitate their interpretation.

Riassunto (Italiano)

La presente tesi si inserisce nel contesto dell’analisi dei dati industriali e prende avvio dai dati forniti da Zerynth, azienda operante nel monitoraggio di macchinari industriali. L’obiettivo principale del lavoro è la definizione di una metodologia per la segmentazione dei macchinari, basata sull’analisi di specifiche variabili operative, in particolare legate a potenza e consumo, al fine di consentire confronti significativi tra asset caratterizzati da comportamenti di utilizzo simili, indipendentemente dal contesto aziendale o dal settore produttivo.
Il lavoro inizia con un’analisi esplorativa dei dati storici forniti. Successivamente, viene affrontata una fase di data preparation, che include l’estrazione delle serie temporali, la costruzione di dataset consolidati e la gestione dei valori mancanti, al fine di rendere i dati idonei alle analisi successive.
La tesi prosegue con la definizione e il confronto di diverse strategie di clustering basate sulla rappresentazione e sull’approssimazione delle serie temporali univariate, applicate alle variabili di interesse selezionate.
Viene quindi scelta e implementata una pipeline di clustering non supervisionato, progettata per individuare livelli crescenti di dissimilarità nel comportamento dei macchinari. Infine, i risultati ottenuti vengono presentati attraverso diverse rappresentazioni grafiche, al fine di facilitarne l’interpretazione.

File

Nome file	Dimensione
La tesi non è consultabile. Contatta l’autore

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-03182026-203940