logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-08292024-143417


Tipo di tesi
Tesi di laurea magistrale
Autore
FICINI, NICOLA
URN
etd-08292024-143417
Titolo
Educational Intelligence: a framework to enhance learning and teaching processes
Dipartimento
INGEGNERIA DELL'ENERGIA, DEI SISTEMI, DEL TERRITORIO E DELLE COSTRUZIONI
Corso di studi
INGEGNERIA GESTIONALE
Relatori
relatore Ing. Chiarello, Filippo
correlatore Ing. Giordano, Vito
correlatore Prof.ssa Martini, Antonella
Parole chiave
  • education
  • generative artificial intelligence
  • intelligence
  • named entity recognition
  • natural language processing
  • skill analysis
  • skill intelligence
  • text mining
Data inizio appello
02/10/2024
Consultabilità
Non consultabile
Data di rilascio
02/10/2064
Riassunto
Questo lavoro di tesi ha come obiettivo la creazione di un framework da applicare in ogni processo di design di nuovi curricula, chiamato Educational Intelligence, che ha lo scopo di mappare lo stato dell’arte della formazione in un determinato campo tramite tecniche di Text Mining. La partecipazione al progetto di ricerca DETAILLs (DEsign Tools of Artificial Intelligence in Sustainability Living LabS) ha stimolato la necessità di sviluppo e di applicazione di questo framework. Le attività svolte durante il periodo della Borsa di Ricerca di 6 mesi sono state: (1) analisi della letteratura sulle tecniche di Text Mining per il loro utilizzo nel framework; (2) design del framework Educational Intelligence, con la definizione della metodologia per l’intero processo di mappatura tramite tecniche di Text Mining; (3) descrizione del framework e della sua metodologia nello specifico, (4) applicazione di Educational Intelligence al progetto di ricerca DETAILLs, ed esposizione dei risultati nel meeting tenuto a Zagabria, (5) ulteriore applicazione del framework nel progetto di ricerca ARISA (Artificial Intelligence Skills Alliance). I risultati ottenuti da questo lavoro di tesi definiscono un nuovo standard applicabile dalle varie organizzazioni, e mostrano una solida applicazione di Educational Intelligence.
Lo scopo di questo lavoro è sviluppare un framework che applichi tecniche di intelligence all'industria della formazione, in un campo specifico (ad esempio, GenAI nella sezione del caso di studio), partendo dalla progettazione dell'intelligence fino all'analisi. La metodologia applicata è divisa nei seguenti cinque passaggi: (1) Query and data design, (2) Data collection, (3) Information extraction, (4) Results analysis, e (5) Communication and visualization.
La fase di (1) Query and data design impiega il metodo "5W" (Who, Why, Where, When, What) per formulare query precise che mirano a dati rilevanti, evitando informazioni superflue. Questo approccio strutturato assicura che le query risultanti siano allineate con gli obiettivi prefissati e siano adattabili a diverse fonti, facilitando la riproducibilità e l'aggiornamento nel tempo. Successivamente alla progettazione delle query, la fase di Data Design applica il modello SIPOC (Suppliers, Inputs, Processes, Outputs, Customers) per mappare le informazioni necessarie per la raccolta di intelligence, basandosi sul “Why” identificato in precedenza. Questo modello, comunemente utilizzato nella mappatura dei processi aziendali, è adattato qui per strutturare i dati educativi supportando la completezza necessaria, stimolando la ricerca delle informazioni in ogni punto importante della fruizione del materiale educativo.
Nella fase di (2) Data collection, le informazioni vengono raccolte attraverso metodi sia manuali che automatizzati. La raccolta manuale dei dati comporta il copia e incolla delle informazioni rilevanti da siti web in un foglio Excel pre-progettato, garantendo completezza ma richiedendo più tempo. Nel frattempo, la raccolta automatizzata dei dati sfrutta strumenti di scraping e codice personalizzato utilizzando selettori CSS per estrarre efficientemente grandi volumi di dati dai siti web target. Questo processo ottimizza la raccolta dei dati identificando elementi specifici del sito web, sviluppando codice di estrazione e organizzando i dati per l'analisi. La combinazione di questi metodi assicura sia efficienza che precisione nel processo di raccolta delle informazioni.
Poiché le competenze e i metodi di insegnamento sono stati un tema centrale durante la fase di progettazione dei dati, un approccio top-down nella fase di (3) Information extraction, specificamente il Named Entity Recognition gazetteer-based, è preferito per la sua precisione nel mirare a queste entità predefinite.
Nella fase di (4) Results analysis, tramite i linguaggi di programmazione si analizzano i dati strutturati, partendo da tecniche di base e progredendo verso metodi più complessi. Infine, in (5) Communication and visualization, il risultato analizzato deve essere comunicato per migliorare la fase di progettazione dei curricula, in modo che quanto emerso dall'Educational Intelligence possa essere utilizzato efficacemente.

This thesis aims to create a framework called Educational Intelligence, designed to be applied in the development of new curricula. Its purpose is to map the state of the art in education within a specific field using Text Mining techniques. The need to develop and implement this framework arose from participation in the DETAILLs research project (DEsign Tools of Artificial Intelligence in Sustainability Living Labs). During the six-month Research Fellowship, the following activities were carried out: (1) a literature review on Text Mining techniques for their application within the framework; (2) the design of the Educational Intelligence framework, including the definition of the methodology for the entire mapping process using Text Mining techniques; (3) a detailed description of the framework and its specific methodology; (4) the application of Educational Intelligence to the DETAILLs research project, with results presented at a meeting held in Zagreb; and (5) further application of the framework in the ARISA (Artificial Intelligence Skills Alliance) research project. The results of this thesis establish a new standard that can be applied by various organizations, demonstrating a robust implementation of Educational Intelligence.
The purpose of this work is to develop a framework applying intelligence techniques to the education industry, in a specific field (i.e. GenAI in the case study section), starting from the design of the intelligence to the analysis. The applied methodology is divided into the following five steps: (1) Query and data design, (2) Data collection, (3) Information extraction, (4) results analysis, and (5) Communication and visualization.
The (1) Query and data design phase employs the "5W" method (Who, Why, Where, When, What) to frame precise queries that target relevant data, avoiding unnecessary information. This structured approach ensures that the resulting queries are aligned with the intended objectives and are adaptable across different sources, facilitating reproducibility and updating over time. Following the query design, the Data Design phase applies the SIPOC model (Suppliers, Inputs, Processes, Outputs, Customers) to map out the necessary information for intelligence gathering, based on the “Why” identified earlier. This model, commonly used in business process mapping, is adapted here to structure educational data in a way that enhances clarity and facilitates efficient analysis.
In the (2) data collection phase, information is gathered through both manual and automated methods. Manual data collection involves copying and pasting relevant information from websites into a pre- designed Excel spreadsheet, ensuring completeness but requiring more time. Meanwhile, automated data collection leverages scraping tools and custom code using CSS selectors to efficiently extract large volumes of data from targeted websites. This process streamlines data gathering by identifying specific website elements, developing extraction code, and organizing the data for analysis. Combining these methods ensures both efficiency and accuracy in the information gathering process.
Since skills and teaching methods were a prominent theme during the data design phase, a top- down approach in the (3) information extraction phase, specifically gazetteer-based Named Entity Recognition, is preferred for its precision in targeting these predefined entities.
In the (4) result analysis phase coding tools are needed to analyze structured data, starting with basic techniques and advancing to more complex methods. In (5) communication and visualization Finally, the analyzed result needs to be communicated to improve the curricula design phase, so that what emerged from the Educational Intelligence could be effectively utilized.
File