logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-03152007-230440


Thesis type
Tesi di laurea specialistica
Author
Sechi, Veronica
email address
veronicasechi@libero.it
URN
etd-03152007-230440
Thesis title
Progettazione e implementazione di algoritmi per estrazione di Pattern Sequenziali
Department
SCIENZE MATEMATICHE, FISICHE E NATURALI
Course of study
TECNOLOGIE INFORMATICHE
Supervisors
Relatore Turini, Franco
Relatore Baglioni, Miriam
Keywords
  • gap
  • grafi
  • KDD
  • prefix-growth
  • process
  • vincoli temporali
Graduation session start date
05/04/2007
Availability
Full
Summary
L’obbiettivo della tesi è stato studiare tutte le tecniche di data mining presenti in letteratura applicabili al progetto BRITE (in particolare lo stato dell’arte riguardante i Sequential Pattern ed il Workflow Mining), scegliere e implementare un algoritmo per inferire pattern sequenziali dai file di logs estratti dalla piattaforma.
L’algoritmo implementato è GenPrefixGrowth e il linguaggio di programmazione utilizzato è Java. Si basa sul metodo pattern-growth e la sua caratteristica principale è la possibilità di trattare vincoli di tipo temporale, esistenziale (minimo supporto) e di contenuto. Nel corso di questa tesi per semplicità sono stati applicati solo i primi due vincoli. GenPrefixGrowth inoltre utilizza una tecnica di proiezione del database basata sul prefisso, la pseudo proiezione, che è una versione main memory.
File