ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-04182005-112518


Tipo di tesi
Tesi di laurea vecchio ordinamento
Autore
Nassi, Adriano
Indirizzo email
a_nassi@libero.it
URN
etd-04182005-112518
Titolo
Progettazione e realizzazione di un Motore di Ricerca Euristico inserito in portali Web, basato sul Teoria dell'informazione di Claude Shannon e sulla Teoria inferenziale di Bayes.
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Dott. Lanza, Marco
relatore Prof. Dini, Gianluca
Relatore Prof. Marcelloni, Francesco
Parole chiave
  • ricerca
  • motore
  • java
  • web-app
  • search engine
  • portale
Data inizio appello
06/05/2005
Consultabilità
Parziale
Data di rilascio
06/05/2045
Riassunto
Nel mondo delle applicazioni orientate all'Enterprise Business nasce ogni giorno l'esigenza sempre maggiore di sfruttare le applicazioni web al fine di mettere a disposizione le più moderne strutture a favore dell'utente (front-end side).
La documentazione prodotta nelle varie aree dell'azienda, se opportunamente condivisa, potrebbe offrire una ottimizzazione dei tempi di servizio e darebbe la possibilità ai vari utenti di usufruire di materiale di natura ed ubicazione diversa.
Generalmente viene messo in secondo piano l'importanza dei documenti prodotti in aree applicative diverse, senza dare il giusto interesse alle potenzialità offerte dalla reperibilità e conseguente ottenimento di una documentazione esaustiva.
Questo comporta le seguenti problematiche:
- inefficiente organizzazione distribuita del flusso informativo;
- rallentamento del processo produttivo di applicativi che richiedano una documentazione completa proveniente da tutte le aree aziendali.
I motori di ricerca commerciali adottati come servizi di supporto web, eseguono una ricerca dei documenti condivisi focalizzata nella individuazione dei testi che contengono al loro interno la parola o frase digitata dall'utente sul proprio front-end.
Questo tipo di individuazione del documento possiede delle limitazioni. Come risultato della ricerca vengono visualizzate informazioni, oltre ai documenti strettamente necessari, che a livello semantico non appartengono ai risultati che il cliente si attende.
La ricerca eseguita dai principali Search-Engine focalizza le attenzioni sul concetto sintattico e non semantico della parola.
L'obiettivo dei motori di ricerca presenti sul mercato è finalizzato a visualizzare documenti che hanno al loro interno le parole che l'attore ha digitato durante la fase di richiesta di visualizzazione dei dati.
La visualizzazione di documenti semanticamente scorrelati con la richiesta eseguita dall'utente, genera un onere in termini di tempo, al fine di ottenere una documentazione esaustiva: l'utente deve settacciare a mano i documenti estrapolando le informazioni effettivamente utili da quelle inutili.
Un altro grosso limite derivante da questo metodo tradizionale di ricerca è dovuto alla inevitabile omissione di documenti scritti in lingue diverse.
Eseguire un confronto tra testi scritti in lingue diverse è una operazione che non restituisce alcun risultato valido, omettendo tanta documentazione probabilmente utile.
Questo lavoro ha l'obiettivo di realizzare un motore di ricerca euristico che permetta di classificare i documenti senza conoscere informazioni a priori ed all’atto della ricerca sia capace di individuare i testi semanticamente coerenti con la richiesta eseguita dall'utente durante la digitazione della/e chiave/i di ricerca.
L'algoritmo altresì si preoccupa di classificare i documenti inseriti da tutti i fruitori dell'applicazione catalogando la nuova documentazione senza la necessità di inserire manualmente informazioni sul documento stesso.
Tale obiettivo proposto ottimizzerà i tempi necessari all'utente per la individuazione e classificazione dei dati utili, permettendo a questi di essere operativo in minor tempo ed mettendolo in condizione di possedere tutti i documenti utili messi a disposizione dall'azienda.
La mancanza di un motore di ricerca euristico, limita il potenziale giro d’affari di un gruppo costringendo tutti gli operatori a lavorare con un numero di informazioni non esaustivo, mettendo il dipendente in condizione di lavorare con minore produttività e velocità realizzativa.
Questa tesi è stata sviluppata presso l'azienda:
FINAF - Gruppo Angelini - Roma.
File