ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-03152007-230440


Tipo di tesi
Tesi di laurea specialistica
Autore
Sechi, Veronica
Indirizzo email
veronicasechi@libero.it
URN
etd-03152007-230440
Titolo
Progettazione e implementazione di algoritmi per estrazione di Pattern Sequenziali
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
TECNOLOGIE INFORMATICHE
Relatori
Relatore Turini, Franco
Relatore Baglioni, Miriam
Parole chiave
  • grafi
  • process
  • prefix-growth
  • vincoli temporali
  • gap
  • KDD
Data inizio appello
05/04/2007
Consultabilità
Completa
Riassunto
L’obbiettivo della tesi è stato studiare tutte le tecniche di data mining presenti in letteratura applicabili al progetto BRITE (in particolare lo stato dell’arte riguardante i Sequential Pattern ed il Workflow Mining), scegliere e implementare un algoritmo per inferire pattern sequenziali dai file di logs estratti dalla piattaforma.
L’algoritmo implementato è GenPrefixGrowth e il linguaggio di programmazione utilizzato è Java. Si basa sul metodo pattern-growth e la sua caratteristica principale è la possibilità di trattare vincoli di tipo temporale, esistenziale (minimo supporto) e di contenuto. Nel corso di questa tesi per semplicità sono stati applicati solo i primi due vincoli. GenPrefixGrowth inoltre utilizza una tecnica di proiezione del database basata sul prefisso, la pseudo proiezione, che è una versione main memory.
File