ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-01142015-145722


Tipo di tesi
Tesi di laurea magistrale
Autore
DI GIGLIO, MARIANTONIETTA
URN
etd-01142015-145722
Titolo
Analisi delle componenti principali in spazi di Hilbert e applicazioni
Dipartimento
MATEMATICA
Corso di studi
MATEMATICA
Relatori
relatore Prof. Romito, Marco
relatore Prof. Flandoli, Franco
Parole chiave
  • pca
  • spazi di Hilbert
  • fPCA
Data inizio appello
30/01/2015
Consultabilità
Completa
Riassunto
Negli ultimi anni, sempre più dati statistici sono contraddistinti da una struttura funzionale, grazie anche alle nuove tecnologie con cui questi vengono estrapolati. L'analisi di tali dati chiamati FD (Functional data) risulta essere non poco laboriosa per via delle grandi dimensioni che presentano, per la complessità di rappresentazione e, non ultimo, per l'elevata correlazione da cui, in genere, sono caratterizzati. Un potente strumento statistico che ci permette di analizzare qualitativamente tali dati, con sforzi decisamente minori, è l'analisi delle componenti principali funzionale. Tale tecnica nasce da una generalizzazione della più comune versione vettoriale multivariata, nota come PCA. L'analisi delle componenti principali funzionale si presta bene come tecnica di riduzione della dimensione e di visualizzazione della variabilità funzionale intrinseca nei dati; come PCA, ci consente di classicare e modellizzare i dati. Altro notevole uso di fPCA è quello di snellire metodi regressivi che hanno input funzionali e output scalare. Inoltre, la peculiarità del metodo delle componenti principali è quella di essere supportata da ottime basi teoriche che ci permettono di analizzare il metodo matematicamente.
Il seguente lavoro seguirà due binari, uno puramente teorico e l'altro pratico. Da un lato svilupperemo attentamente una solida teoria del metodo delle componenti principali funzionale, curandone i dettagli in un generale spazio di Hilbert, prima, e in L2(I), poi; dall'altro vedremo degli esempi di applicazione del metodo alle serie storiche e, successivamente, un esempio di carattere innito-dimensionale tramite il riconoscimento facciale. Per conseguire gli esempi applicativi ci siamo serviti principalmente di R e matlab. Nello specico la tesi sarà strutturata come segue.
• Nel primo capitolo ci occuperemo di ricordare la teoria di PCA analizzandone gli obiettivi, ma soprattutto, gli aspetti geometrici in uno spazio reale di dimensione nita d.
• Partendo dalle basi di PCA, vedremo in quale maniera, quanto descritto in uno spazio finito-dimensionale si generalizzi a spazi infinito-dimensionali. Cercheremo di definire, costruttivamente, l'operatore di covarianza, necessario per la teoria di PCA, e di analizzarne a fondo le sue proprietà. Seguiremo con la presentazione della teoria spettrale in spazi hilbertiani e sfrutteremo questa per portare a termine una teoria infinito-dimensionale di PCA.
• Nel terzo capitolo passeremo dal generale al particolare: guarderemo più da vicino la teoria di PCA infinito dimensionale sullo spazio L2(I) generando cosi' quella che viene chiamata fPCA. • Prima di occuparci degli esempi pratici cercheremo di creare un ponte tra gli aspetti teorici e quelli applicativi; tenteremo, quindi, di capire come riusciamo ad utilizzare buona parte della teoria studiata nelle applicazioni e nell'uso dei software.
• Nell'ultimo capitolo, infine, presenteremo alcuni esempi. Come per la sezione teorica, partiremo da un esempio di analisi esplorativa e riduzione della dimensione con PCA, applicando tale tecnica ad alcuni dati forniti dall'azienda Intraget-Group. Successivamente, servendoci del sito ISTAT, analizzeremo l'andamento dei laureati in discipline tecnico scientiche nelle regioni italiane tra il 2000 e il 2011; si tratta di più realizzazioni di una stessa serie storica. Seguiremo nella presentazione dei nostri esempi con l'aiuto di un archivio meteo (disistile.it), dal quale estrarremo i millimetri di acqua piovana caduti a Pisa tra il 2000 e il 2013; questo è il caso, più complesso, di una sola serie storica; vedremo quindi quali sono gli effetti dell'analisi esplorativa su un problema di questo genere e ci occuperemo di affiancare fPCA a uno dei metodi previsivi per serie storiche. Infine, presenteremo il problema del riconoscimento facciale proponendone un algoritmo ottenuto attraverso PCA infinito-dimensionale.
File