logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-05062024-163439


Tipo di tesi
Tesi di laurea magistrale
Autore
MARCONCINI, GABRIELE
URN
etd-05062024-163439
Titolo
Linking Online Reviews to Product Features: A Text-Mining Based Method and a Case Study on Smartphones
Dipartimento
INGEGNERIA DELL'ENERGIA, DEI SISTEMI, DEL TERRITORIO E DELLE COSTRUZIONI
Corso di studi
INGEGNERIA GESTIONALE
Relatori
relatore Chiarello, Filippo
relatore Giordano, Vito
relatore Martini, Antonella
Parole chiave
  • customers reviews
  • Kano model
  • nlp
  • product features
Data inizio appello
27/05/2024
Consultabilità
Non consultabile
Data di rilascio
27/05/2094
Riassunto
La Tesi tratta l’analisi delle recensioni dei clienti tramite tecniche di NLP per estrarre informazioni utili alla strategia aziendale e al supporto del design di prodotto. Le recensioni possono contenere preziosi insight sul prodotto, valutazioni personali e informazioni direttamente esplicitate dai clienti senza un pattern da seguire. Particolare interesse per questo studio sono le valutazioni espresse come sentiment che gli users esprimono rispetto alle product features (PF).
L’obiettivo è quello di strutturare un metodo per comprendere quanto ciascuna product feature (PF), valutata secondo il sentiment espresso dal cliente, impatti nella valutazione complessiva del prodotto.
Il metodo è strutturato in 3 maco-attività:
1. Estrazione delle Product Feature: fase composta da attività quali pulizia dei dati, selezione di potenziali PF, generazione di un’ontologia con metodo semi-strutturato basato su embeddings di parole, estrazione delle PF. L’output è un dataset contenente le PF citate dalle recensioni.
2. Valutazione del Sentiment: Classificazione del sentiment espresso verso le PFs all’interno delle recensioni tramite l’implementazione di un LLM. L’output è un dataset contenente le PF e il sentiment associato.
3. Analisi e Rappresentazione: Tramite dei modelli di regressione lineare multivariata si calcola la relazione tra le PF valutate secondo il sentiment e il voto in stelle dato dai clienti. L’output è un modello che mostra come le varie PF impattano la votazione in stelle. Inoltre, tramite la scomposizione del dataset è stato possibile anche mostrare come la valutazione delle PF sia variata nel tempo.
I risultati del modello sono stati poi interpretati utilizzando il modello di Kano. Questo ha permesso di trarre conclusioni riguardo la percezione delle PF nel settore smartphone.

(ENG)

The thesis addresses the analysis of customer reviews using NLP techniques to extract information useful for business strategy and product design support. Reviews can contain valuable insights about the product, personal evaluations, and information explicitly expressed by customers without a specific pattern to follow. Of particular interest for this study are the evaluations expressed as sentiment that users express regarding the product features (PF).
The goal is to structure a method to understand how each product feature (PF), evaluated based on the sentiment expressed by the customer, impacts the overall product evaluation.
The method is structured into three macro-activities:
1. Product Features Extraction: This phase consists of activities such as data cleaning, selection of potential PFs, generation of a semi-structured ontology based on word embeddings, and extraction of PFs. The output is a dataset containing the PFs mentioned in the reviews.
2. Sentiment Evaluation: Classification of the sentiment expressed towards the PFs within the reviews using the implementation of a Large Language Model (LLM). The output is a dataset containing the PFs and associated sentiment.
3. Analysis and Representation: Using multivariate linear regression models, the relationship between the PFs evaluated according to sentiment and the star rating given by customers is calculated. The output is a model that shows how the various PFs impact the star rating. Additionally, through the decomposition of the dataset, it was also possible to show how the evaluation of PFs has changed over time.
The results of the model were then interpreted using the Kano model. This allowed conclusions to be drawn regarding the perception of PFs in the smartphone sector.
File