Tesi etd-03152007-230440 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea specialistica
Autore
Sechi, Veronica
Indirizzo email
veronicasechi@libero.it
URN
etd-03152007-230440
Titolo
Progettazione e implementazione di algoritmi per estrazione di Pattern Sequenziali
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
TECNOLOGIE INFORMATICHE
Relatori
Relatore Turini, Franco
Relatore Baglioni, Miriam
Relatore Baglioni, Miriam
Parole chiave
- gap
- grafi
- KDD
- prefix-growth
- process
- vincoli temporali
Data inizio appello
05/04/2007
Consultabilità
Completa
Riassunto
L’obbiettivo della tesi è stato studiare tutte le tecniche di data mining presenti in letteratura applicabili al progetto BRITE (in particolare lo stato dell’arte riguardante i Sequential Pattern ed il Workflow Mining), scegliere e implementare un algoritmo per inferire pattern sequenziali dai file di logs estratti dalla piattaforma.
L’algoritmo implementato è GenPrefixGrowth e il linguaggio di programmazione utilizzato è Java. Si basa sul metodo pattern-growth e la sua caratteristica principale è la possibilità di trattare vincoli di tipo temporale, esistenziale (minimo supporto) e di contenuto. Nel corso di questa tesi per semplicità sono stati applicati solo i primi due vincoli. GenPrefixGrowth inoltre utilizza una tecnica di proiezione del database basata sul prefisso, la pseudo proiezione, che è una versione main memory.
L’algoritmo implementato è GenPrefixGrowth e il linguaggio di programmazione utilizzato è Java. Si basa sul metodo pattern-growth e la sua caratteristica principale è la possibilità di trattare vincoli di tipo temporale, esistenziale (minimo supporto) e di contenuto. Nel corso di questa tesi per semplicità sono stati applicati solo i primi due vincoli. GenPrefixGrowth inoltre utilizza una tecnica di proiezione del database basata sul prefisso, la pseudo proiezione, che è una versione main memory.
File
Nome file | Dimensione |
---|---|
tesi.pdf | 1.32 Mb |
Contatta l’autore |