ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas...

13
ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and Design (The hardware / software interface), 4ta Edición, de David A. Patterson y John L. Hennessy. Editorial Morgan Kaufmann

Transcript of ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas...

Page 1: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

ARQUITECTURA DE COMPUTADORES

Semestre A-2009

Clase 04

La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and Design (The hardware / software interface), 4ta Edición, de David A. Patterson y John L. Hennessy. Editorial Morgan Kaufmann

Page 2: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

AGENDA

• El muro de la disipación de potencia

• Máquinas multiprocesadores

• Proceso de construcción de un chip

• SPEC y otras medidas de rendimiento (Artificiales)

• Ley de Amdahl

Page 3: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

La pared de la disipación de potencia

La frecuencia de reloj y el consumo de energía ha aumentado por décadas, pero se detuvo hace unos años.

Page 4: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Potencia• La tecnología CMOS (Complementary Metal Oxide

Semiconductor) es con la que se suelen construir la mayoría de circuitos integrados en la actualidad

• Los transistores CMOS presentan fuga, que se traduce en calor. Mientras más se disminuye el voltaje, más fuga se produce y más debe ser enfriado el chip

• Actualmente, 40% del consumo de energía, se fuga como calor. Este calor debe ser disipado por dispositivos de enfriamiento o apagando partes del procesador.

• Se pierde potencia a pesar de apagar los transistores.• Debido a esta problemática, se decidió cambiar la forma

tradicional de mejorar el rendimiento de los procesadores

Potencia consumida = Carga capacitiva x Voltaje2 x Frecuencia de switcheo

Page 5: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Evolución en las CPUs

Page 6: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Multicores

• Varios procesadores por Chip• Para evitar la confusión al decir “un procesador

con varios procesadores”, se dice “un procesador con varios núcleos”

• Este cambio implica que los programadores tendrán que recodificar sus programas para sacar provecho de la multiplicidad de núcleos. Retos:– Programas más complejos– No todo se puede paralelizar– Existe un costo por programar procesos, balancearlos

y por coordinar esta paralelización

Page 7: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Construcción de un Chip

Page 8: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Construcción de un Chip• La construcción comienza con el silicio (Sustancia

semiconductora que se encuentra en la arena). • Tras un proceso químico, pueden construirse

dispositivos que conducen o aíslan (switch): Transistor• El proceso de manufactura es crítico para el costo del

chip• Tubos de silicio (20-30 cm.) son rebanados en obleas

(2.5 mm)• Estas obleas son procesadas, construyendo los distintos

componentes, siguiendo un patrón.• Se buscan los defectos y se dividen los dados.• Cada dado es probado, encapsulado y probado otra vez

Costo del dado = Costo por obleaDados por oblea x Yield

Yield = 1

(1 + (Defectos por área x Area/2))2

Page 9: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Oblea

Page 10: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

SPEC CPU benchmark

• SPEC: System Performance Evaluation Cooperative

• Carga de trabajo: Conjunto de programas ejecutados en un computador (Pueden ser provistos por un usuario o artificiales)

• El último es el SPEC CPU2006• SPECratio: Es un tiempo de referencia que

provee SPEC• Existen SPEC para distintos mercados de

computadores y para Potencia.

Page 11: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

SPEC del AMD Opteron X4

Page 12: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

MIPS• Otra alternativa al tiempo para intentar estimar

el rendimiento son los MIPS: Millones de Instrucciones por Segundo.

• Es fácil de entender y es inversa al tiempo de ejecución

• Tiene problemas:– No permite comparar computadores con diferentes

juegos de instrucciones– MIPS varía entre programas del mismo computador

MIPS = Cantidad de instruccionesTiempo de ejecución x 106

= Frecuencia de relojCPI x 106

Page 13: ARQUITECTURA DE COMPUTADORES Semestre A-2009 Clase 04 La mayor parte del contenido de estas láminas, ha sido extraído del libro Computer Organization and.

Ley de Amdahl

• El aumento posible del rendimiento por una mejora, está limitado a la magnitud de la parte mejorada.

Tiempo de ejecución después de la mejora

Tiempo de ejecución afectadopor la mejora

Magnitud de la mejora =

Tiempo de ejecuciónno afectado+