ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-06282009-123830


Tipo di tesi
Tesi di laurea specialistica
Autore
PARLANGELI, GIANLUCA
Indirizzo email
gianluca.prlngl@yahoo.it
URN
etd-06282009-123830
Titolo
DATA MINING SU DECESSI A TARANTO 1998-2005
Dipartimento
INTERFACOLTA'
Corso di studi
INFORMATICA PER L'ECONOMIA E PER L'AZIENDA
Relatori
correlatore Pedreschi, Dino
relatore Dott.ssa Vigotti, Maria Angela
Parole chiave
  • Taranto
  • decessi
  • data mining
Data inizio appello
17/07/2009
Consultabilità
Non consultabile
Data di rilascio
17/07/2049
Riassunto
La provincia di Taranto subisce da diversi anni l’influenza di numerose fonti di inquinamento, tra cui, l’esempio più noto, è l’acciaieria ILVA costruita a ridosso del centro cittadino del capoluogo di provincia. La situazione è aggravata dalla mancanza di un intervento amministrativo che porti al risanamento della zona e dalla grande influenza “politica” di alcuni soggetti inquinanti.
A motivo di questa situazione geografica l’area di Taranto è stata oggetto da parte dell’ Organizzazione Mondiale della Sanità (OMS) di studi di mortalità [1,2] che hanno coinvolto, oltre al capoluogo, anche quattro comuni confinanti, tutti in provincia di Taranto (Crispiano, Massafra, Statte, Montemesola), con una popolazione pari al 39% dei residenti dell’intera provincia, confrontati con i corrispettivi dati di mortalità della regione Puglia. Nel solo capoluogo risiede circa l’83% della popolazione dell’intera area a rischio, motivo per cui il comune di Taranto è stato considerato come un’unità territoriale a sé stante. Da entrambi gli studi è emerso un eccesso di mortalità riferita a tutte le cause in particolare alla mortalità per tumore.
Attualmente sono disponibili dati sulla mortalità disaggregati sul territorio del comune per sezione di censimento e sono disponibili i dati ISTAT al censimento 2001 da cui si possono ricavare indicatori sullo stato socio economico della popolazione 1998-2005. I dataset utilizzati contengono quindi sia dati socio-economici disaggregati per sezioni di censimento (2001), forniti dall’ISTAT, che informazioni sui decessi dei residenti del comune di Taranto, nell' arco di tempo tra il 1998 e 2005.
I dataset sono costituiti da una grande quantità di dati distribuiti irregolarmente nel corso del periodo in questione, rendendo impossibile un’ analisi diretta.
Un approccio interessante è stato, quindi, applicare le tecniche di data mining per scoprire informazioni preziose tra i due insiemi di dati.
Obiettivo di questo lavoro di tesi è quello di verificare se esiste una patologia dominante tra i vari quartieri di Taranto e constatare la presenza di una relazione tra i decessi e le condizioni socio-economiche dei quartieri interessati.
Il progetto è stato condotto seguendo le linee guida della metodologia CRISP-DM.
La tesi spiega il lavoro eseguito attraverso le cinque sezioni che descrivono
altrettante fasi di tale metodologia:

• Business Understanding;
• Data Understanding;
• Data Preparation;
• Modelling;
• Evaluation.
File