Tesi etd-03222010-165923 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea specialistica
Autore
MASIA, ALBERTO
URN
etd-03222010-165923
Titolo
Meccanismi di replicazione per cache di secondo livello in sistemi CMP
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Ing. Foglia, Pierfrancesco
relatore Ing. Solinas, Marco
relatore Prof. Prete, Cosimo Antonio
relatore Ing. Solinas, Marco
relatore Prof. Prete, Cosimo Antonio
Parole chiave
- CMP
- Conflict Hit.
- NUCA
- Replicazione
- Shared Blocks
Data inizio appello
06/05/2010
Consultabilità
Non consultabile
Data di rilascio
06/05/2050
Riassunto
Con l’aumentare del livello di integrazione sui chip, i sistemi multiprocessore sono passati dalle implementazioni di sistemi multi-chip a sistemi a singolo chip. I sistemi multiprocessore a singolo chip (chip multiprocessors, CMPs) contenenti da 2 a 8 processori sono diventati di recente disponibili anche commercialmente. Essendo in grado di fornire velocemente ai processori le istruzioni ed i dati, le memorie cache on-chip sono efficaci nel migliorare le prestazioni dei CMP.
Per far fronte alle dimensioni ridotte delle cache private di ciascun processore (le L1 cache), che soddisfano solo una parte delle richieste, è necessario accedere a cache più capienti di livello più basso (L2). Queste cache on-chip di grosse dimensioni dovrebbero essere in grado sia di memorizzare una grande quantità di dati, in modo da minimizzare l’impatto sulle prestazioni dovuto alla risoluzione off-chip di una miss, sia di recuperare velocemente i dati richiesti, in modo da ridurre gli effetti sulle prestazioni del ritardo di propagazione dei segnali sui fili.
I sistemi CMP attuali adottano cache condivise per massimizzare la capacità delle cache on-chip memorizzando solo un’unica copia di ciascun blocco. Anche se le cache condivise solitamente minimizzano gli accessi offchip, presentano elevate latenze di accesso dal momento che le richieste devono attraversare i fili per raggiungere i banchi di cache più distanti. Al contrario, invece, le cache private riducono la latenza media di accesso facendo migrare e replicare i blocchi vicino al processore richiedente, sacrificando però l’effettiva capacità on-chip ed incorrendo in un numero più alto di miss.
Con l’obiettivo di avere sistemi di elaborazione basati su cache condivisa di grande capacità che siano anche in grado di mascherare gli effetti del ritardo sui fili, sono state proposte architetture di cache non convenzionali, caratterizzate dall’avere un tempo medio di accesso non uniforme (Non-Uniform Cache Access, NUCA).
Il lavoro di tesi affronta un problema presente in questo tipo di cache, il fenomeno dei Ping-Pong che si presenta durante il funzionamento del meccanismo di migrazione. La ripetuta promozione di un blocco condiviso in direzioni opposte dovuta a continue richieste alternate da parte di processori posti su lati diversi, impedisce di fatto che questo raggiunga, con la migrazione, le vie a più bassa latenza della cache. La soluzione proposta consiste nella replicazione dei blocchi soggetti a richieste di questo tipo e risolve i conseguenti problemi di coerenza del protocollo.
Per far fronte alle dimensioni ridotte delle cache private di ciascun processore (le L1 cache), che soddisfano solo una parte delle richieste, è necessario accedere a cache più capienti di livello più basso (L2). Queste cache on-chip di grosse dimensioni dovrebbero essere in grado sia di memorizzare una grande quantità di dati, in modo da minimizzare l’impatto sulle prestazioni dovuto alla risoluzione off-chip di una miss, sia di recuperare velocemente i dati richiesti, in modo da ridurre gli effetti sulle prestazioni del ritardo di propagazione dei segnali sui fili.
I sistemi CMP attuali adottano cache condivise per massimizzare la capacità delle cache on-chip memorizzando solo un’unica copia di ciascun blocco. Anche se le cache condivise solitamente minimizzano gli accessi offchip, presentano elevate latenze di accesso dal momento che le richieste devono attraversare i fili per raggiungere i banchi di cache più distanti. Al contrario, invece, le cache private riducono la latenza media di accesso facendo migrare e replicare i blocchi vicino al processore richiedente, sacrificando però l’effettiva capacità on-chip ed incorrendo in un numero più alto di miss.
Con l’obiettivo di avere sistemi di elaborazione basati su cache condivisa di grande capacità che siano anche in grado di mascherare gli effetti del ritardo sui fili, sono state proposte architetture di cache non convenzionali, caratterizzate dall’avere un tempo medio di accesso non uniforme (Non-Uniform Cache Access, NUCA).
Il lavoro di tesi affronta un problema presente in questo tipo di cache, il fenomeno dei Ping-Pong che si presenta durante il funzionamento del meccanismo di migrazione. La ripetuta promozione di un blocco condiviso in direzioni opposte dovuta a continue richieste alternate da parte di processori posti su lati diversi, impedisce di fatto che questo raggiunga, con la migrazione, le vie a più bassa latenza della cache. La soluzione proposta consiste nella replicazione dei blocchi soggetti a richieste di questo tipo e risolve i conseguenti problemi di coerenza del protocollo.
File
Nome file | Dimensione |
---|---|
La tesi non è consultabile. |