logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-02082017-074628


Thesis type
Tesi di laurea vecchio ordinamento
Author
MATELLI, MARCO
URN
etd-02082017-074628
Thesis title
Progettazione di un sistema per la profilazione degli utenti di un social network mediante tecniche di clustering e classificazione
Department
INGEGNERIA DELL'INFORMAZIONE
Course of study
INGEGNERIA INFORMATICA
Supervisors
relatore Prof.ssa Lazzerini, Beatrice
correlatore Dott. Pistolesi, Francesco
Keywords
  • Big Data
  • Classificazione
  • Clustering
  • Data Mining
  • K-means
  • Knn
  • Social Network
  • Text Mining
Graduation session start date
24/02/2017
Availability
Withheld
Release date
24/02/2026
Summary
I moderni Social Network ospitano un’enorme quantità di dati debolmente strutturati, caratterizzati da rapida evoluzione e alta dimensionalità (Big Data). Per poter rilevare informazioni nascoste in tali dati sono necessarie sofisticate tecniche di Data Mining.
La presente tesi si inserisce nell’ambito di un Social Network utilizzato per condividere esperienze di NSSI (Not-Suicidal Self-Injury). La NSSI è una patologia che spinge chi ne è affetto all’autolesionismo, procurandosi piccole lesioni (Self-Injury), in assenza di un intento suicida (Not-Suicidal). Questo tipo di autolesionismo è quasi sempre associato ad una situazione di disagio dovuta a un disturbo psicologico.
Lo scopo di questa tesi è effettuare la profilazione degli utenti di un Social Network di NSSI, collocando ciascuno di loro in una categoria patologica e in una macro-Community di utenti, grazie alle informazioni che mettono a disposizione durante l’utilizzo del Social Network. Tali informazioni includono l’attività degli utenti sul Social Network, i loro interessi e ciò che scrivono nelle Community.
In ottica di profilazione, è stato dapprima effettuato un clustering delle Community, cioè una loro ripartizione oggettiva direttamente indotta dai dati sull’uso che gli utenti ne fanno.
Successivamente, l’analisi del testo pubblicato dagli utenti ha permesso di selezionare automaticamente particolari espressioni ricorrenti. Un esperto in psicologia ha eseguito una preventiva fase di etichettatura di alcuni Post presenti nel database (Data Labeling). In questa fase, l’esperto ha assegnato ad alcuni Post una categoria di tipo patologico (Cutting) o riabilitativo (Uncutting), dipendentemente dal fatto che i Post denotassero una fase della patologia (stabile o in avanzamento) o una fase di guarigione dell’utente.
I dati etichettati sono stati usati per addestrare un classificatore grazie al quale il sistema è in grado di stabilire autonomamente la categoria di appartenenza di un Post (Cutting o Uncutting).
Grazie al sistema sviluppato, gli utenti del social network possono essere automaticamente collocati in un particolare stato patologico e in un particolare gruppo di Community in funzione della tipologia di post che hanno pubblicato e in funzione di dove li hanno pubblicati.
Analizzando l’utente nel tempo, è stata poi studiata la natura migliorativa o peggiorativa dell’evoluzione temporale dello stato dell’utente, attraverso l’eventuale cambio di gruppo di Community.
File