Tesi etd-01142015-145722

Tipo di tesi

Tesi di laurea magistrale

Autore

DI GIGLIO, MARIANTONIETTA

URN

etd-01142015-145722

Titolo

Analisi delle componenti principali in spazi di Hilbert e applicazioni

Dipartimento

MATEMATICA

Corso di studi

MATEMATICA

Relatori

relatore Prof. Romito, Marco
relatore Prof. Flandoli, Franco

Parole chiave

pca
spazi di Hilbert
fPCA

Data inizio appello

30/01/2015

Consultabilità

Completa

Riassunto

Negli ultimi anni, sempre più dati statistici sono contraddistinti da una struttura funzionale, grazie anche alle nuove tecnologie con cui questi vengono estrapolati. L'analisi di tali dati chiamati FD (Functional data) risulta essere non poco laboriosa per via delle grandi dimensioni che presentano, per la complessità di rappresentazione e, non ultimo, per l'elevata correlazione da cui, in genere, sono caratterizzati. Un potente strumento statistico che ci permette di analizzare qualitativamente tali dati, con sforzi decisamente minori, è l'analisi delle componenti principali funzionale. Tale tecnica nasce da una generalizzazione della più comune versione vettoriale multivariata, nota come PCA. L'analisi delle componenti principali funzionale si presta bene come tecnica di riduzione della dimensione e di visualizzazione della variabilità funzionale intrinseca nei dati; come PCA, ci consente di classicare e modellizzare i dati. Altro notevole uso di fPCA è quello di snellire metodi regressivi che hanno input funzionali e output scalare. Inoltre, la peculiarità del metodo delle componenti principali è quella di essere supportata da ottime basi teoriche che ci permettono di analizzare il metodo matematicamente.
Il seguente lavoro seguirà due binari, uno puramente teorico e l'altro pratico. Da un lato svilupperemo attentamente una solida teoria del metodo delle componenti principali funzionale, curandone i dettagli in un generale spazio di Hilbert, prima, e in L2(I), poi; dall'altro vedremo degli esempi di applicazione del metodo alle serie storiche e, successivamente, un esempio di carattere innito-dimensionale tramite il riconoscimento facciale. Per conseguire gli esempi applicativi ci siamo serviti principalmente di R e matlab. Nello specico la tesi sarà strutturata come segue.
• Nel primo capitolo ci occuperemo di ricordare la teoria di PCA analizzandone gli obiettivi, ma soprattutto, gli aspetti geometrici in uno spazio reale di dimensione nita d.
• Partendo dalle basi di PCA, vedremo in quale maniera, quanto descritto in uno spazio finito-dimensionale si generalizzi a spazi infinito-dimensionali. Cercheremo di definire, costruttivamente, l'operatore di covarianza, necessario per la teoria di PCA, e di analizzarne a fondo le sue proprietà. Seguiremo con la presentazione della teoria spettrale in spazi hilbertiani e sfrutteremo questa per portare a termine una teoria infinito-dimensionale di PCA.
• Nel terzo capitolo passeremo dal generale al particolare: guarderemo più da vicino la teoria di PCA infinito dimensionale sullo spazio L2(I) generando cosi' quella che viene chiamata fPCA. • Prima di occuparci degli esempi pratici cercheremo di creare un ponte tra gli aspetti teorici e quelli applicativi; tenteremo, quindi, di capire come riusciamo ad utilizzare buona parte della teoria studiata nelle applicazioni e nell'uso dei software.
• Nell'ultimo capitolo, infine, presenteremo alcuni esempi. Come per la sezione teorica, partiremo da un esempio di analisi esplorativa e riduzione della dimensione con PCA, applicando tale tecnica ad alcuni dati forniti dall'azienda Intraget-Group. Successivamente, servendoci del sito ISTAT, analizzeremo l'andamento dei laureati in discipline tecnico scientiche nelle regioni italiane tra il 2000 e il 2011; si tratta di più realizzazioni di una stessa serie storica. Seguiremo nella presentazione dei nostri esempi con l'aiuto di un archivio meteo (disistile.it), dal quale estrarremo i millimetri di acqua piovana caduti a Pisa tra il 2000 e il 2013; questo è il caso, più complesso, di una sola serie storica; vedremo quindi quali sono gli effetti dell'analisi esplorativa su un problema di questo genere e ci occuperemo di affiancare fPCA a uno dei metodi previsivi per serie storiche. Infine, presenteremo il problema del riconoscimento facciale proponendone un algoritmo ottenuto attraverso PCA infinito-dimensionale.

File

Nome file	Dimensione
tesimag.pdf	2.57 Mb
Contatta l’autore

ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-01142015-145722