logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-04032022-164332


Tipo di tesi
Tesi di laurea magistrale
Autore
GUIDUCCI, FEDERICA
URN
etd-04032022-164332
Titolo
Modelli di machine learning per la previsione delle mobile number portability in WindTre S.p.a.
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof.ssa Monreale, Anna
Parole chiave
  • Forecasting
  • Machine Learning
  • Mobile Number Portability
  • Settore delle Telecomunicazioni
Data inizio appello
22/04/2022
Consultabilità
Non consultabile
Data di rilascio
22/04/2092
Riassunto
In un’Italia sempre più digitale, un ruolo fondamentale è giocato da tutte quelle società che si occupano di fornire servizi telefonici ed accesso a internet. L'insieme di tutti gli operatori che forniscono questi servizi, tramite linea fissa o mobile, costituiscono il settore delle Telecomunicazioni. Non c'è da stupirsi quindi se la digitalizzazione e la velocità di cambiamento della società ha portato all'affermazione dello smartphone come device maggiormente utilizzato dalle famiglie italiane. Uno studio Istat del 2019 mostra come i telefoni cellulari si stiano sempre più affermando come strumento essenziale per l'accesso al web in tutte le fasce di età. Se si pensa che nel 2020 il numero di di SIM-CARD pro-capite registrato è di $1.73$, ovvero a ogni cittadino sono associati quasi due numeri di telefono. Le SIM registrate nel territorio italiano nel 2020 si contano per 103,1 milioni divise per 59.55 milioni di abitanti.

Il settore delle Telecomunicazioni costituisce ormai un bene comune essenziale per la collettività e garantisce la competitività del Paese nel mondo. Se non vi è alcun dubbio sull'importanza strategica del settore nell'industria, l'emergenza sanitaria del CoronaVirus ha messo in luce anche l'importanza del settore per la collettività. Tramite chiamate, messaggi e rete internet si è potuto restare a casa e nel contempo di poter svolgere le regolari attività lavorative, scolastiche e sociali contribuendo in modo sostanziale al contenimento del virus.

In questi ultimi due anni è stato registrato un forte aumento dell’utilizzo del traffico sulle reti fisse e mobili e le infrastrutture implementate dalle società di telecomunicazioni hanno garantito nel complessivo un buon servizio qualitativo e comunque la spesa per le famiglie è stata contenuta. Prezzi contenuti e ottima qualità del servizio sono tutte caratteristiche che connotano un settore che rispetta i principi della corretta e leale concorrenza imposta dagli standard Europei. Nonostante infatti il settore si configuri come un monopolio naturale, grazie alle politiche europee e ai provvedimenti legislativi presi negli ultimi 30 anni dal governo italiano si è potuto sviluppare un contesto competitivo di libero mercato, anche se sempre controllato.

Una delle novità più importanti che sono state introdotte è stata la portabilità di un numero di telefono. Per portabilità si intende il passaggio da un operatore all'altro di una linea fissa o mobile senza la necessità di cambiare numero. In questo modo si sono potuti ridurre di molto i costi di commutazione (switching cost) e i consumatori hanno potuto scegliere finalmente l'operatore più conveniente per i loro interessi. Il processo di portabilità è internazionalmente conosciuto con l'acronimo MNP che sta per Mobile Number portability ed è ampiamente utilizzato dai consumatori di tutto il mondo.

L'introduzione dell'MNP ha portato una serie di benefici per la collettività come l'aumento della competitività, un miglioramento della qualità dei servizi e la possibilità di scelta per i consumatori. Dal lato delle imprese però, se prima era difficile che un cliente si muovesse verso un altro operatore, ora è diventato estremamente più semplice anche per la riduzione per legge dei tempi per completare il processo di portabilità.
Sotto questo aspetto le imprese si sono sempre di più organizzate nella ricerca di pratiche e di strategie per fidelizzare il cliente e trattenerlo nel proprio marchio. A tutte le strategie di marketing si deve aggiungere il forte interesse dimostrato dalle aziende di telecomunicazioni nei confronti dei dati. Sin dall'inizio, anche prima della diffusione della data science e del machine learning, le aziende di telecomunicazioni si sono impegnate quanto più possibile a utilizzare la grande mole di dati e a trasformarle in informazioni. A tal proposito, i dati riguardanti i clienti che entrano ed escono dall'azienda tramite il processo di MNP costituisce un dato fondamentale per il business. Oltre, infatti a fornire un quadro estremamente chiaro delle quote di mercato detenute dalle varie organizzazioni, l'utilizzo di queste informazioni può consentire l'anticipazione delle tendenze del mercato e di poter reagire in tempo a alle minacce esterne.

Lo scopo di questa ricerca è quella di individuare un nuovo algoritmo predittivo, in sostituzione a quello attuale, del numero degli ordini di attivazione/disattivazione delle portabilità in entrata e in uscita del CRM di WindTre S.p.a. verso gli altri operatori telefonici. Il problema è quindi quello di stimare il volume giornaliero degli ordini di MNP che vedono come soggetto donator/recipient WindTre divise per tipologia di mercato: clienti business o clienti privati definiti genericamente come consumer.

Per svolgere l'indagine si sono presi in considerazioni i più attuali algoritmi di predizioni di machine learning divisi tra algoritmi di regressione e algoritmi di forecasting. In particolare si analizzeranno per il problema di regressione algoritmi quali XGBOOST e SVM mentre per il problema di forecasting la classe dei modelli ARMA.

I modelli risultati dall'analisi verranno poi confrontati con l'algoritmo attualmente utilizzato da WindTre. La necessità di implementare una nuova metodologia nasce infatti dal volere dell'azienda di ottenere delle predizioni più vicine alla realtà e che possano impiegare minori risorse computazionali.

Un importante punto che verrà sottolineato è che l'attuale algoritmo è altamente performante, ma ha dei costi computazionali piuttosto elevati dovuti alla tecnologia utilizzata (SQL). La tecnologia può essere però facilmente sostituita a favore di una più idonea (come python) e il problema può essere spostato verso la stima degli errori dell'algoritmo in un'ottica di poter migliorare i già ottimi risultati dell'algoritmo. La predizione degli errori dell'attuale algoritmo sarà poi confrontata con quella degli errori del migliore tra gli algoritmi analizzati.

In generale il lavoro sarà diviso in 6 capitoli. Il primo capitolo riguarda le aree di ricerca correlate all'analisi e i contributi scientifici sui quali si è basata l'analisi e si sono implementati i modelli. Il secondo e il terzo capitolo invece contribuiscono a dare maggiore contesto al problema dando una descrizione del settore delle telecomunicazioni sia dal punto di vista storico che di business attraverso l'analisi delle cinque forze competitive di Porter. In questo contesto verrà fornita anche una piccola panoramica sull'azienda WindTre S.p.a. spiegandone i valori e le aree di business. Il quarto capitolo è dedicato alla presentazione dei dati a disposizione dell'analisi e al calcolo di nuovi attributi che potrebbero risultare utili per l'analisi.
Il lavoro poi prosegue con la presentazione dell'attuale algoritmo (capitolo 5) e all'analisi dei nuovi algoritmi (capitolo 6). Infine, nel capitolo 7 viene fornita una comparazione dei risultati ottenuti e una soluzione alternativa basata sugli errori di predizione dell'attuale algoritmo e del migliore risultante dai precedenti.
File