ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-02082017-074628


Tipo di tesi
Tesi di laurea vecchio ordinamento
Autore
MATELLI, MARCO
URN
etd-02082017-074628
Titolo
Progettazione di un sistema per la profilazione degli utenti di un social network mediante tecniche di clustering e classificazione
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Prof.ssa Lazzerini, Beatrice
correlatore Dott. Pistolesi, Francesco
Parole chiave
  • Social Network
  • Knn
  • K-means
  • Data Mining
  • Clustering
  • Classificazione
  • Big Data
  • Text Mining
Data inizio appello
24/02/2017
Consultabilità
Non consultabile
Data di rilascio
24/02/2026
Riassunto
I moderni Social Network ospitano un’enorme quantità di dati debolmente strutturati, caratterizzati da rapida evoluzione e alta dimensionalità (Big Data). Per poter rilevare informazioni nascoste in tali dati sono necessarie sofisticate tecniche di Data Mining.
La presente tesi si inserisce nell’ambito di un Social Network utilizzato per condividere esperienze di NSSI (Not-Suicidal Self-Injury). La NSSI è una patologia che spinge chi ne è affetto all’autolesionismo, procurandosi piccole lesioni (Self-Injury), in assenza di un intento suicida (Not-Suicidal). Questo tipo di autolesionismo è quasi sempre associato ad una situazione di disagio dovuta a un disturbo psicologico.
Lo scopo di questa tesi è effettuare la profilazione degli utenti di un Social Network di NSSI, collocando ciascuno di loro in una categoria patologica e in una macro-Community di utenti, grazie alle informazioni che mettono a disposizione durante l’utilizzo del Social Network. Tali informazioni includono l’attività degli utenti sul Social Network, i loro interessi e ciò che scrivono nelle Community.
In ottica di profilazione, è stato dapprima effettuato un clustering delle Community, cioè una loro ripartizione oggettiva direttamente indotta dai dati sull’uso che gli utenti ne fanno.
Successivamente, l’analisi del testo pubblicato dagli utenti ha permesso di selezionare automaticamente particolari espressioni ricorrenti. Un esperto in psicologia ha eseguito una preventiva fase di etichettatura di alcuni Post presenti nel database (Data Labeling). In questa fase, l’esperto ha assegnato ad alcuni Post una categoria di tipo patologico (Cutting) o riabilitativo (Uncutting), dipendentemente dal fatto che i Post denotassero una fase della patologia (stabile o in avanzamento) o una fase di guarigione dell’utente.
I dati etichettati sono stati usati per addestrare un classificatore grazie al quale il sistema è in grado di stabilire autonomamente la categoria di appartenenza di un Post (Cutting o Uncutting).
Grazie al sistema sviluppato, gli utenti del social network possono essere automaticamente collocati in un particolare stato patologico e in un particolare gruppo di Community in funzione della tipologia di post che hanno pubblicato e in funzione di dove li hanno pubblicati.
Analizzando l’utente nel tempo, è stata poi studiata la natura migliorativa o peggiorativa dell’evoluzione temporale dello stato dell’utente, attraverso l’eventuale cambio di gruppo di Community.
File