ARQUITECTURA - JERARQUIA DE MEMORIAS

JERARQUIA DE MEMORIAS Parte 1 Ing. Noralma Yánez

2 Introducción Los programas comparten en la memoria tanto su código como sus datos. Estrategia de optimización de rendimiento: posibilitar a la CPU el acceso ilimitado y rápido tanto al código como a los datos. Inconveniente: tecnológicamente, cuanto más grandes son las memorias (más capacidad) más lentas y costosas resultan.

3 Introducción Ley de localidad: todo programa favorece una parte de su espacio de direcciones en cualquier instante de tiempo. Dimensiones: Localidad temporal (tiempo). Si se referencia un elemento tenderá a ser referenciado pronto. Localidad espacial (espacio). Si se referencia un elemento, los elementos cercanos a él tenderán a ser referenciados pronto.

4 Introducción El principio de localidad y la directriz que el hardware más pequeño es más rápido mantienen el concepto de una jerarquía basada en diferentes localidades y tamaños. Organizada en varios niveles, cada uno más pequeño, más caro y más rápido. Todos los datos de un nivel se encuentran también en el nivel siguiente, hasta el extremo inferior de la jerarquía.

5 D Ejemplos de jerarquías de memoria CPU CPU I Cache L2 cache RAM RAM disco disco red

6 Terminología básica El nivel superior, el más cercano al procesador es mas rápido y pequeño que el nivel inferior. Mínima unidad de información en una jerarquía de dos niveles bloque

7 Terminología básica (1) Acierto (hit) : un acceso a un bloque de memoria que se encuentra en el nivel superior. Fallo (miss) : el bloque no se encuentra en ese nivel. Frecuencia de aciertos : fracción de accesos a memoria encontrados en el nivel superior. Frecuencia de fallos (1 - frecuencia de aciertos): fracción de accesos a memoria no encontrados en el nivel superior.

8 Terminología básica (2) Tiempo de acierto : tiempo necesario para acceder a un dato presente en el nivel superior de la jerarquía incluye el tiempo necesario para saber si el acceso es un acierto o un fallo. Tiempo de fallo : tiempo necesario para sustituir un bloque de nivel superior por el correspondiente bloque de nivel más bajo, más el tiempo necesario para proporcionar este bloque al dispositivo que lo solicitó (generalmente la CPU). Penalización de fallo : tiempo de fallo + tiempo de acierto.

9 Tiempo de fallo... Componentes: Tiempo de acceso : tiempo necesario para acceder a la primera palabra de un bloque en un fallo relacionado con la latencia del nivel más bajo Tiempo de transferencia : tiempo para transferir las restantes palabras del bloque relacionado con el ancho de banda entre las memoria de nivel más bajo y más alto.

10 Direccionamiento CPU # blqs Log2 # blq Dirección de memoria 1 0 0 1 0 1 1 1 0 0 1 1 0 0 1 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 Dirección de la estructura de bloque DEB Dirección de desplazamiento de bloque OFS

11 Rendimiento de la jerarquía T medio de accesos= Frec. acierto * T acierto + Frec. fallo * Penalización de fallos = T acierto + Frecuencia de fallos * Tiempo de fallos

12 Clasificación de las jerarquías de memoria Ubicación del bloque  Dónde puede ubicarse un bloque en el nivel superior Identificación del bloque  Cómo se encuentra un bloque en el nivel superior Sustitución de bloque  Qué bloque debe reemplazarse en caso de fallo Estrategia de escritura  Qué ocurre en una escritura

13 Primer nivel : Memoria CACHE Memorias muy rápidas Poca capacidad Se interponen entre el procesador y la memoria principal CPU Cache RAM Nivel de cache

14 Ubicación de un bloque en la cache ,[object Object]

asociativa: un bloque puede ubicarse en cualquier lugar de la cache

asociativa por conjuntos: un bloque puede ser colocado en un grupo restringido de lugares de la cache un conjunto es un grupo de dos o más bloques de la cache.,[object Object]

16 Notas . . . En una cache asociativa por conjuntos, si hay n bloques por conjunto, la cache se llama asociativa por conjuntos de n vías (asociatividad n) Una cache de correspondencia directa podría decirse que es asociativa por conjuntos de una sola vía Una cache totalmente asociativa posee un solo conjunto con grado de asociatividad m (si posee m bloques en total)

17 bloque bloque bloque 01234567 num 01234567 num 01234567 num asociativa total corresp. directa asoc. por conj. 00000000001111111111222222222233 01234567890123456789012345678901 Ejemplo ,[object Object]

cache asociativa por conjuntos tiene 4 conjuntos de 2 bloques c/u,[object Object]

Cache de correspondencia directa : sólo se debe buscar una etiqueta

Cache asociativa por conjuntos : se deben buscar todas las etiquetas del conjunto en el que puede estar el bloque,[object Object]

21 Nuevo direccionamiento Dirección de memoria D E B 1 0 0 1 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 Dirección de desplazamiento de bloque OFS 1 0 0 1 0 1 1 1 0 0 1 1 0 0 1 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 Indice Etiqueta

Mas notas... El campo índice se usa para seleccionar el conjunto, y el etiqueta para la comparación Si se incrementa la asociatividad : ,[object Object]

disminuye el tamaño del índice

aumenta el tamaño de la etiquetaUna cache totalmente asociativa no tiene índice y la parte de etiqueta posee la dirección de la estructura de bloque total. 22

23 Ejemplo (parte 1) Caché de 512 bytes dividida en bloques de 16 bytes (32 bloques) La caché está, a su vez, agrupada en 8 conjuntos de 4 bloques cada uno (4 vías). 0 1 2 3 4 5 6 7 El nivel inferior es una RAM de 16 Kbytes. Entonces tiene 1024 bloques de 16 bytes cada uno 0 1 . . . . . . . . . . . . . . . . . . . . . . . . 1023

24 Ejemplo (parte 2) Si la dirección que necesita la CPU es 9000 entonces: bloque = 9000 DIV 16 = 562 desplaz = 9000 MOD 16 = 8 En la caché irá en el conjunto: conjunto = 562 MOD 8 = 2 y el valor de la etiqueta será: etiqueta = 562 DIV 8 = 70 70 2 8 indice desplazamiento etiqueta

25 Ejemplo (parte 3) En binario sería: 9000 = 1000 1100 101 000 Como el bloque es de 16 bytes, el desplazamiento lo dan los 4 últimos bits desplazamiento = 1000 ( = 8) dir.est. bloque = 1000 1100 10 Como la caché es de 8 conjuntos, entonces, el MOD 8 representa los últimos 3 bits de la dirección de estructura de bloque. Entonces: indice = 010 ( = 2) etiqueta = 1000 110 ( = 70) 1000110 010 1000 indice desplazamiento etiqueta

26 Uso de los campos de la DEB etiqueta desplazamiento Cache 1 D e c o d i f i c a d o r índice datos Cache 2 Cache 3

27 Diagrama de bloques del subsistema de cache bloque offset dato Memoria memoria de datos # blq CPU Dir Memoria de etiquetas DEB pres presencia

28 Sustitución de bloques Ante un fallo de cache es necesario traer un bloque nuevo y ubicarlo en algún lugar del nivel superior Si existe algún bloque de cache con datos no válidos, el reemplazo se hace en ese lugar Debido a la alta frecuencia de aciertos de la cache es necesario tomar estrategias de reemplazo

ARQUITECTURA - JERARQUIA DE MEMORIAS

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to ARQUITECTURA - JERARQUIA DE MEMORIAS

Similar to ARQUITECTURA - JERARQUIA DE MEMORIAS (20)

Recently uploaded

Recently uploaded (20)

ARQUITECTURA - JERARQUIA DE MEMORIAS