logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-05212015-140944


Tipo di tesi
Tesi di laurea magistrale
Autore
SANCHI, SARA
URN
etd-05212015-140944
Titolo
Approccio statistico robusto multivariato per lo studio di dati composizionali relativi alle acque superficiali dei principali corsi d'acqua del Bacino di Follonica
Dipartimento
SCIENZE DELLA TERRA
Corso di studi
SCIENZE E TECNOLOGIE GEOLOGICHE
Relatori
correlatore Prof.ssa Buccianti, Antonella
correlatore Dott. Battaglini, Raffaele
relatore Dott.ssa Raco, Brunella
Parole chiave
  • Cook distance
  • distanza di Cook
  • distanza di Mahalanobis
  • Follonica
  • Mahalanobis distance
  • multivariata
  • Pecora river
  • statistica
  • statistics
Data inizio appello
12/06/2015
Consultabilità
Completa
Riassunto
In questo lavoro di tesi sono presentati e discussi i risultati di un’indagine idrochimica, condotta sulle acque superficiali del Bacino di Follonica (Grosseto, Toscana), costituito nel suo complesso dai sottobacini del Fiume Pecora, del Canale Allacciante-Fosso Rigiolato, e del Torrente Gora delle Ferriere. L’obiettivo principale è di caratterizzare le acque campionate dal punto di vista chimico e isotopico, seguendo un approccio basato su metodologie statistiche robuste e di confrontare gli esiti di queste ultime con i risultati ottenuti attraverso tecniche interpretative proprie della indagine geochimica tradizionale.
A questo scopo, nel periodo compreso tra Aprile e Maggio 2014, è stato effettuato il campionamento di 104 campioni di acque di scorrimento superficiale distribuiti su tutto il bacino idrografico della Piana di Follonica. In particolare sono stati prelevati: 38 campioni lungo l’asta del Fiume Pecora e di suoi tributari minori; 49 lungo il Canale Allacciante - Fosso Rigiolato; 9 lungo il Torrente Gora delle Ferriere; altri 8 campioni sono stati prelevati in fossi facenti parte del bacino idrografico.
Sui campioni raccolti sono state eseguite le analisi chimiche presso il Laboratorio di chimica delle acque dell’ Istituto di Geoscienze e Georisorse (IGG) del CNR di Pisa, dove sono stati determinati i contenuti dei costituenti ionici principali (Na, K, Ca, Mg, Alcalinità, SO4, Cl, NO3), alcuni dei minori (NH4, Al) e i metalli in tracce (Fe, Mn, Cu, Zn, Cr, Ni, Cd, Pb, V, Co, Se, Ti, Al, Hg, As, Sb). Sugli stessi campioni, presso i laboratori isotopici dell’Institute of Material Science, "Stable Isotope Unit" del National Center for Scientific Research "Demokritos" (Atene, Grecia), sono inoltre stati determinati i rapporti isotopici δ18O e δ2H.
I dati ottenuti sono stati elaborati sia con metodi geochimici classici, a fini classificativi (tesi di Cristina Capuzzo), sia con metodologie statistiche robuste al fine di valutare le potenzialità di queste ultime nel contribuire a realizzare una modellazione geochimica del sistema studiato.
Per una migliore visualizzazione, i campioni sono stati suddivisi e tematizzati a seconda del bacino di appartenenza e della facies chimica di riferimento la cui definizione è stata portata a termine attraverso la costruzione dei classici diagrammi quadrangolari di Langelier-Ludwig e delle relative sezioni. Dal punto di vista statistico i dati raccolti sono stati elaborati sia con tecniche univariate, per una descrizione complessiva dei diversi parametri chimici e chimico fisici acquisiti, con particolare attenzione alla distribuzione di frequenza, sia con tecniche multivariate per individuare le correlazioni e associazioni tra i parametri. Preliminarmente all’analisi statistica, allo scopo di ottenere elaborazioni “robuste”, i dati sono stati trasformati secondo le indicazioni di Atchinson (1981, 1986) per l’analisi statistica di dati composizionali. Le elaborazioni sono state eseguite con il software Statistica e con vari pacchetti analitici del codice R.
L’approccio statistico multivariato è consistito in un work-flow sinteticamente schematizzabile come segue:
- Analisi dei dati composizionali con le tecniche “Robust Location and Scatter Estimation”, con il pacchetto rrcov di R, che prevedono il confronto tra distanza robusta (Rousseeuw an Leroy (1987); Rousseeuw and Driessen (1999); Hubert, Rousseeuw and Verdonck (2012); Pison, Van Aelst, and Willems (2002); Todorov & Filzmoser (2009)) e distanza di Mahalanobis, per l’individuazione di gruppi omogenei di dati (Mahalanobis (1936)).
- Cluster analysis robusta, con il pacchetto pvclust di R (Shimodaira (2002) e (2004)) per l’individuazione di associazioni tra le specie chimiche principali.
- Analisi delle Componenti Principali (PCA), realizzata con il software Statistica, per l’individuazione di associazioni tra le specie chimiche principali e per l’isolamento dei fattori rappresentativi della reale dimensionalità dello spazio composizionale.
- Costruzione di modelli di regressione lineare per modellare la concentrazione delle specie in traccia (variabili dipendenti) sulla base dei valori assunti dai fattori isolati con la PCA.
Con queste procedure sono stati individuati due sottogruppi omogenei di campioni, composti da 82 e 22 campioni, sui quali le analisi successive hanno permesso di individuare, per il primo gruppo due e per il secondo tre componenti principali capaci di spiegare, rispettivamente il 86.5% e il 95.25% della varianza complessiva osservata. In particolare per il primo gruppo sono stati individuati un fattore principalmente dipendente da Cl-Na-HCO3/SO4-Mg-Ca (63.36% di varianza spiegata), e uno caratterizzato da Ca-HCO3/K , mentre per il secondo sottogruppo un fattore dipendente da HCO3-Ca/Cl-Na-Mg (58.24% di varianza spiegata), un secondo fattore dato da K/SO4-Mg-Ca (82.08% di varianza spiegata) e un terzo costituito da SO4-K/HCO3.
Ciascuno dei fattori individuati è associabile a diversi processi geochimici e/o sorgenti che contribuiscono alle caratteristiche chimiche delle acque.
Utilizzando i suddetti fattori come variabili indipendenti e le concentrazioni delle specie in traccia come variabili dipendenti, sono stati realizzati modelli di regressione multipla per modellare i contenuti dei metalli sulla base delle concentrazioni delle specie ioniche principali, al fine di verificare la eventuale congruenza, e dunque la probabile origine comune, tra specie maggiori e tracce. In alcuni casi i modelli hanno dato risposte molto positive, come per l’As, in entrambi i sottogruppi, evidenziando la presenza di meccanismi naturali o comunque diffusi, all’origine di tale elemento nelle acque superficiali. In altri casi invece i modelli hanno evidenziato difformità di comportamenti, suggerendo pertanto l’esistenza di processi differenziati alla base delle concentrazioni delle specie in traccia rispetto al contenuto in ioni principali.
Infine l’analisi spaziale dei dati ha permesso l’individuazione di potenziali aree anomale.
Il confronto tra i risultati emersi dall’approccio statistico sopra descritto e l’approccio geochimico “classico” ha evidenziato una buona concordanza dei risultati in particolare per quanto concerne il legame trovato tra l’arsenico e il solfato.
File