logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-04022009-161501


Tipo di tesi
Tesi di laurea specialistica
Autore
VALENZA, GAETANO
URN
etd-04022009-161501
Titolo
Sviluppo di Metodi basati sull'Analisi delle Componenti Indipendenti per applicazioni di Brain Computer Interface
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA BIOMEDICA
Relatori
Relatore Landini, Luigi
Relatore Milanesi, Matteo
Relatore Vanello, Nicola
Relatore Ferro, Marcello
Parole chiave
  • analisi componenti indipendenti
  • brain computer interface
  • EEG
  • ICA
  • pattern recognition
Data inizio appello
28/04/2009
Consultabilità
Non consultabile
Data di rilascio
28/04/2049
Riassunto
Introduzione - Con Brain-Computer interface (BCI) s’intende l’insieme di tecnologie atte al controllo di dispositivi tramite la modulazione volontaria dell'attività cerebrale o un'opportuna elaborazione di eventi cerebrali spontanei.
Ogni sistema BCI comprende una parte di acquisizione del segnale, prelevato mediante tecniche invasive (elettrodi impiantabili) o non invasive (elettrodi posizionati sullo scalpo), una parte di signal processing che effettua l’estrazione di caratteristiche (features) mediante trasformazioni e filtraggi nel dominio spaziale e/o temporale dei segnali acquisiti, ed una parte di classificazione atta ad associare le features ad una specifica classe. L’uscita, associata ad ogni classe, può essere fornita mediante strumenti grafici (software) o attraverso l’attuazione di un sistema automatico (manipolatori robotici etc..).
Per quanto riguarda l’utilizzo di metodiche di registrazione non invasive, la più utilizzta è senza dubbio quella dell’elettroencefalogramma o EEG, che rappresenta la registrazione sullo scalpo dell’attivita elettrica della corteccia cerebrale. Relativamente all’EEG, è possibile sfruttare l’aumento della potenza media, nei range di frequenza 10-15 Hz (definito ritmo sensorimotorio μ) e 23-28 Hz (definito ritmo sensorimotorio β), che si verifica in corrispondenza della area sensorimotoria ad opera di un’immaginazione o di una pianificazione di movimento. Così i sistemi BCI possono permettere lo svolgimento di compiti, anche apparentemente elementari, a soggetti con lesioni al midollo spinale, distrofia muscolare, sclerosi multipla o qualsiasi altra patologia che nega il controllo dei propri muscoli, ma lascia inalterate le funzioni cerebrali superiori. Altre applicazioni di interesse riguardano la domotica, la robotica e l’assistenza nella riabilitazione.
Il problema principale di questi sistemi è quello di rendere robusta la parte di classifcazione e quindi dell’eventuale attuazione. Il cervello infatti durante una generica fase di apprendimento innesca dei meccanismi di plasticità sinaptica, adattando l’attività neurale alla realizzazione del compito da eseguire. Ciò si ripercuote negativamente nelle applicazioni BCI in quanto l’adattamento, attenuando le caratteristiche associate ad una specifica classe (compito/intenzione), provoca una riduzione delle prestazioni nel tempo rendendo necessario l’uso di algoritmi adattivi alle nuove condizioni. Ad oggi infatti, le prestazioni risultano buone solo in sessioni di lavoro limitate effettuate in ambiente controllato.
Metodi - In questo lavoro di tesi sono stati sviluppati, testati e confrontati algoritmi basati su metodi di tipo esplorativo, in modo da estrarre le caratteristiche di interesse dal segnale EEG in modo più robusto rispetto al segnale non trattato, e senza forti ipotesi a priori sulla loro struttura spazio-temporale. Lo scopo, infatti, è quello di trarre vantaggio dalla natura multicanale dell’EEG per estrarre pattern di attivazione che riflettono attività diffusa e stazionaria per funzioni sensori/motorio/cognitive che si presentano trial a trial.
In particolare, sono stati studiati ed implementati metodi basati su un’approccio di statistica multivariata come l’Analisi delle componenti Indipendenti (ICA).
Riferendoci alla descrizione di cui sopra, è stata valutata la risposta di vari classificatori, quali Linear Bayes Normal Classifier (Ldc), Quadratic Bayes Normal Classifier (Qdc), k-nearest neighbor classifier (K-nn), Parzen classifier (Parzen C), Nearest Mean Classifier (NMC), Kohonen Self Organizing Map (KSOM), MultiLayer Perceptron (MLP), Probabilistic Neural Network (PNN), espressa in termini di matrici di confusione, quando nella parte di acquisizione si considerano i segnali EEG, ottenuti dal dataset IIa delle BCI Competition 2003, prelevati da tre soggetti quando a questi veniva chiesto di controllare il movimento verticale di un cursore virtuale al fine di portarlo in una delle quattro posizioni target di un monitor e l’estrazione delle features viene effettuata confrontando tre diverse metodiche: estrazione diretta dai segnali EEG (metodo 1) ed estrazione dopo la trasformazione che questi subiscono mediante ICA considerando un modello istantaneo (metodo 2) e considerando un modello convolutivo (metodo 3).
E’ stato inizialmente affrontato il problema del riconoscimento delle due classi principali (posizione del target alta e bassa) al fine di valutare la metodica più idonea (robusta) per la risoluzione del problema, più complesso, a quattro classi.
Valutazioni comuni ai tre metodi derivano da un’analisi preliminare dei dati, al fine di stabilire con esattezza i canali EEG da considerare (l’acquisizione è stata fatta su 64 canali secondo lo standard 10-20, informazione ridondante per i nostri scopi per cui basta considerare i canali che correlano maggiormente uno spettro template) per l’estrazione delle features e le bande frequenziali ritenute ottime (11-13 Hz e 23-26 Hz).
Features da bande frequenziali - Per quanto riguarda il primo metodo sono state estratte le features, considerando i segnali del canale 16 (Cp3) in quanto presenta una più netta distintizione tra le classi in termini di potenza media entro le bande μ e β, valutando la costruzione di ogni esempio del Training Set mediante concatenazione dei valori medi di potenza oppure considerando i coefficenti della Densità Spettrale di Potenza entro le bande ottime, mediante il quale, si ottiene una soddisfaciente classificazione attraverso l’uso del classificatore statistico Quadratic Bayes Normal Classifier ed il classificatore neurale MultiLayer Perceptron.
Features da ICA istantanea - Il secondo metodo valuta la risposta dei vari classificatori ai segnali considerati dopo l’applicazione dell’ICA istantanea al fine migliorare i risultati di classificazione, dato che attraverso questa tecnica è possibile stimare sorgenti neurali, originariamente indipendenti, a partire dalle osservazioni sullo scalpo (segnale EEG) che derivano da un processo di mescolamento. In questo vengono considerati 26 canali EEG, di cui una metà è posta in corrisondenza della corteccia parietale relativa all’area sensorimotoria e un’altra metà nelle corrispondenti locazioni dell’emisfero destro. Di fondamentale importanza in questa fase risulta la scelta delle componenti indipendenti da considerare per l’estrazione delle features, effettuata in base alla localizzazione topografica (verngono infatti ricercate quelle originarie dell’area sensorimotoria o da regioni estese dello scalpo) ed all’andamento della potenza nel tempo dei ritmi sensorimotori μ e β di tutte e 10 componenti (il numero è stato ridotto a 10, essendo originariamente pari a 26, dati i canali considerati, operando un’Analisi delle Componenti Principali prima dell’ICA). I risultati sperimentali mostrano come una diminuzione dell’errore di classificazione, rispetto al metodo prcedente, si ottiene soltanto considerando anche il segnale “EEG basale” del soggetto, ossia l’aquisizione avvenuta nei secondi precedenti l’effettivo controllo del cursore sullo schermo. In questo caso è il Nearest Mean Classifier, per i classificatori statistici, ed la Probabilistic Neural Network, per i classificatori neurali, a fornire i risultati migliori.
Features da ICA convolutiva - Come detto, nell’ICA istantanea i segnali EEG sono visti come frutto di una combinazione lineare di sorgenti aventi diversa localizzazione spaziale (quindi diversa distanza da uno specifico eletrodo), per le quali però, si ipotizzano nulli i ritardi dovuti alla propagazione nel mezzo.
Il terzo metodo ha proprio l’obiettivo di considerare queste possibili (e molto probabili) differenze fase nelle dinamiche spazio-temporali.
Le osservazioni quindi vengono considerate come prodotto di convoluzione tra sistema e segnali sorgenti che, dal punto di vista implementativo, si traduce in un’ICA nel dominio della frequenza, ossia ad un’ICA applicata ai segnali della Short Time Fourier Transform (STFT) di ogni canale EEG considerato. Dall’applicazione dell’ICA convolutiva (detta anche complexICA dato la STFT retituisce numeri complessi in modulo e fase) si ottengono perciò un elevato numero di componenti indipendenti, ognuna rappresentante l’andamento dell’ampiezza di quella specifica frequenza nel tempo per ognuna delle classi, rendendo necessario lo sviluppo di un metodo di scelta automatica. La scelta delle componenti indipendenti, ai fini della classificazione, è stata effettuata tra quelle realtive alle bande di interesse. L'approccio ottimale è stato quello che ha considerato le coppie di componenti che presentavano una dipendenza residua minore, approssimata dal coefficiente di correlazione.
Risultati - Tra i metodi analizzati quello basato sulla ICA convolutiva è risultato il più robusto, in quanto fornisce minimi margini di errore quando viene associato al classificatore statistico di Parzen o al classificatore neurale Multilayer Perceptron. Il medesimo algoritmo è stato quindi testato con il problema delle BCI competition 2003 esteso a quattro classi, mostrando risultati del tutto comparabili con quelli ottenuti dal gruppo di ricerca che ha vinto la suddetta competizione.
Al fine di valutare la variabilità inter-soggetto, è stato applicato anche ai dati EEG registrati su o un’altro soggetto, ottenendo anche in questo caso buoni risultati in termini di classificazione, nonostante non sia stato effettuato alcun aggiornamento dei parametri. A titolo informativo, in calce a questo documento, viene presentata la classificazione ottenuta con ognuno dei tre metodi riportando inoltre i risultati ottenuti, attraverso il metodo 3 (complexICA), per quanto concerne il problema a 4 classi. Questi, sono esposti in termini di matrici di confusione, ossia date N classi si costruisce una matrice quadrata NxN in cui ogni elemento i,j indica, in percentuale, quanti esempi appartenenti alla i-esima classe sono stati correttamente classificati (elementi diagonali i=j) e quanti confusi con la j-esima classe. Quindi, più la matrice di confusione è diagonale, migliori sono i risultati.
Conclusioni - Questo lavoro di tesi dimostra che l’applicazione di un’analisi delle componenti indipendenti risulta un metodo robusto per l’estrazione delle features in applicazioni BCI facenti uso di ritmi sensorimotori. In particolare, l’utilizzo di un modello convolutivo per l’ICA è risultato il più accurato. A discapito di un elevato peso computazionale, infatti, risulta quello avente il minimo errore di classificazione, a parità di classificatore.

File