Post on 06-Jan-2016
description
1. EL COMPUTADOR
1
EL COMPUTADOR
1. El Pasado
2. El Presente
3. Estructura Básica
4. Rendimiento
5. Disipación de Potencia
2
1. El Pasado
3
EL COMPUTADOR
El Pasado
El Computador 4
Los precursores
Ábaco
Máquina de LeibnizMáquina analítica
Pascalina
El Computador 5
ENIAC
1946
El Pasado
El Computador 6
ENIAC
1946
El Pasado
El Computador 7
ESPAÑA
1954
El Pasado
El Computador 8
Esta foto es falsa pero refleja las ideas de la época.
Supuesta predicción hecha en 1954 sobre el aspecto de un computador personal en 2004
El Pasado
El Computador 9
“Where a calculator on the ENIAC is equipped with 18,000 vaccuum tubes and weighs 30 tons, computers in the future may have only 1,000 vaccuum tubes and perhaps weigh 1.5 tons.”
Popular Mechanics, March 1949
“Mientras que el ENIAC está equipado con 18.000 válvulas de vacío y pesa 30 toneladas, los computadores del futuro pueden tener sólo 1.000 válvulas de vacío y quizás pesen 1.5 toneladas”
El Pasado
El Computador 10
Es evidente que la previsión no fue muy acertada…
¿Por qué se alejaron tanto de la realidad?
Principalmente por la revolución tecnológica que supusieron el transistor y la integración de circuitos a gran escala.
El Pasado
El Computador 11
ENIAC en un chip
1997
7,44 mm
5,29 mm
El Pasado
Tecnologíade 500 nm
El Computador 12
El Pasado
El grado de integración ha ido en aumento:
ENIAC en un chip1997
Tecnología de 500 nm
Intel Core i72008 Tecnología de 45 nm
Tecnología de 8 µm = 8000 nmIntel 4004
1971
Cabello humano100 µm
Pero . . . ¿de qué tamaños estamos hablando?
El Computador
El Pasado
Tecnología de8 µm
(1971)
13
El Computador 14
El Pasado
Bacteria Escherichia Coli1 µm x 3 µm
Virus HIV100 nm
Tecnología de45 nm(2008)
Pero . . . ¿de qué tamaños estamos hablando?
Tecnología de500 nm(1997)
Tecnología de8 µm
(1971)
. . . y sigue aumentando el grado de integración.
El Computador 15
Intel 4004
1971
El Pasado
El Computador 16
Intel 4004
El Pasado
El Computador 17
Intel 4004
El Pasado
El Computador 18
Intel 4004
El Pasado
El Computador 19
Intel 4004Generador de 8 fases de reloj
Decodificación de instrucciones
ALU
Registros índice
Pila y contador de programa
El Pasado
2. El Presente
20
EL COMPUTADOR
El Computador 21
Intel Core i7
2008
El Presente
El Computador 22
Intel Core i7
2008
El Presente
El Computador 23
Intel Core i7
2008
Núcleos
Caché L3 común
El Presente
El Computador 24
Núcleos
Caché L3 común
Intel Core i7
2008
El Presente
El Computador 25
Núcleos
Caché L3 común
Intel Core i7
2008Unidades
de Ejecución
Caché L1 de datos
Caché L2
Planificador de ejecución
fuera de orden
Decodificación
Caché L1 de instruccione
s
Predicción de salto
El Presente
El Computador 26
Intel Core i7
2008
Núcleos
Caché L3 común
El Presente
El Computador 27
POWER 7(IBM 2010)
El Presente
Ceramic module
El Computador 28
El Presente
POWER 7(IBM 2010)
45 nm 1200 millones de transistores 4,6 y 8 núcleos Por núcleo:
• 4 hilos de ejecución por núcleo• L1 32K (instrucciones) + 32K (Datos)• L2 256K• L3 4M (máximo 32 MB)
Potencia Teórica de cálculo para 8 núcleos y reloj a 4 Ghz• Por núcleo 33,12 GFLOPS• Por procesador 264,96 GFLOPS
El Computador 29
El Presente
POWER 7(IBM 2010)
National Center for Supercomputing ApplicationsUniversity of Illinois at Urbana-Champaign
Completed in 2011http://www.ncsa.illinois.edu/BlueWaters/
300.000 núcleos POWER 7
L3 caché 32MB
Reloj a 4.0 GHz
Memoria principal 1 petabyte (1015)
Disco más de10 petabytes
Conexión a Internet 400 Gbit/s
10 PETAFLOPS
Aplicaciones• Biología • Evolución del cosmos• Investigación en nuevos materiales• Fenómenos climatológicos
El Computador 30
CELL(Sony-Toshiba-IBM)
El Presente
El Computador 31
CELL(Sony-Toshiba-IBM)
El Presente
El Computador 32
CELL(Sony-Toshiba-IBM)
El Presente
El Computador 33
CELL(Sony-Toshiba-IBM)
El Presente
3. Estructura Básica
34
EL COMPUTADOR
El Computador 35
Niveles de máquina
Lenguaje ensamblador
Sistema operativo
Máquina convencional
Lenguajes de alto nivel
Es lo que define la “arquitectura”
Estructura Básica
El Computador 36
Soporte de los niveles
Interpretación
Programa fuente
Nivel 2
Intérprete
Nivel 1
Estructura Básica
El Computador 37
Soporte de los niveles
Traducción
Programa fuente
Nivel 2
Traductor
Nivel 1
Programa objeto
Estructura Básica
El Computador 38
Soporte de los niveles
Traducción
Programa fuente
Nivel 2
Traductor
Nivel 1
Programa objeto
Traductor
Ensamblador:
1 instrucción fuente 1 instrucción objeto
Compilador:
1 instrucción fuente varias instrucciones objeto
Estructura Básica
El Computador 39
Arquitecturas CISC(Complex Instruction Set Computer)
Máquina convencional
Con la microprogramación era muy fácil implementar instrucciones complejas
Ventajas de tener instrucciones muy potentes:
• Los programas ocupan menos (La memoria era muy cara)
• Hay menos accesos a memoria (La memoria era muy lenta)
• Puede facilitar la construcción compiladores
Máquina convencional
Microprograma
Estructura Básica
El Computador 40
Arquitecturas CISC(Complex Instruction Set Computer)
Máquina convencional
Características de las instrucciones:
• Número elevado
• Muchos modos de direccionamiento
• Longitud variable
• Formato irregular
• Muchas instrucciones operan con la memoria
Estructura Básica
El Computador 41
Arquitecturas RISC(Reduced Instruction Set Computer)
Máquina convencional
Ventajas de tener instrucciones sencillas:
• Se ejecutan más rápido
• Acceso a memoria más rápido
• Procesadores más simples, lo que permite mejorarlos
Estructura Básica
El Computador 42
Arquitecturas RISC(Reduced Instruction Set Computer)
Máquina convencional
Características de las instrucciones:
• Número más reducido
• Menos modos de direccionamiento
• Longitud fija (Optimiza la extracción)
• Formato regular (Optimiza la decodificación)
• Filosofía Load / Store
•Memoria separada
•Cauce segmentado
Estructura Básica
El Computador 43
Taxonomía de Flynn
SISDF
lujo
de
inst
rucc
ione
s
Sim
ple
Múl
tiple
SIMD
MISD MIMD
Flujo de datos
MúltipleSimple
Estructura Básica
El Computador 44
Arquitectura de Von Newman
CPU MEMORIA E/S
Estructura Básica
El Computador 45
Chipset típico CPU
Puente Norte(MCH)
Puente Sur
(ICH)
Tarjeta Gráfica
Memoria Principal
Ratón Teclado Disco USB
FSB
Estructura Básica
El Computador 46
Chipset para
Intel Core i7
Estructura Básica
Placa base de
Intel Core i7
X58
ICH10
CPU
El Computador
Estructura Básica
47
Placa base de
Intel Core i7
El Computador
CPU
ICH10
X58
Estructura Básica
48
4. Rendimiento
49
EL COMPUTADOR
El Computador
Rendimiento =1
Tiempo de ejecución
:
move r1,r2
add r3,r4
move r1,r5
:
Programa
Tiempo de ejecución
Rendimiento
50
El Computador
:
move r1,r2
add r3,r4
move r1,r5
:
Programa A
:
xor r4,r1
move r4,r5
sub r1,r2
:
Programa B
n =Tiempo de ejecución de B
Tiempo de ejecución de A
Rendimiento de A
Rendimiento de B=
Si Tiempo de ejecución de A < Tiempo de ejecución de Bdiremos que A es n veces más rápido que B, siendo…
Rendimiento
51
Ecuación de rendimiento del procesador
El Computador
CPI =Ciclos de reloj para el programa
Número de instrucciones ejecutadas
Ciclos Por Instrucción:
move r1,r2
add r3,r4
move r1,r5
:
Programa
Tej. = I x CPI x T =I x CPI
F
I : Instrucciones ejecutadas
T : Periodo del reloj
F : Frecuencia del reloj
Rendimiento
52
Permite calcular la ganancia en el rendimiento que obtendríamos al mejorar una parte del computador.
Establece que la ganancia está limitada por la fracción de tiempo en la que puede ser utilizada la mejora.
Seguidamente vamos a definir algunos conceptos a partir de los cuales definiremos la ley.
El Computador
Ley de Amdhal
Rendimiento
53
El Computador
S =Rendimiento con la mejora
Rendimiento sin la mejora
S =Tiempo de ejecución sin la mejora
Tiempo de ejecución con la mejora
Nos indica el aumento de rendimiento o mejora del tiempo de ejecución tras haber introducido la mejora.
Aceleración (speedup)
Rendimiento
54
El Computador
Indica cuantas veces es más rápida la parte mejorada respecto a la versión sin la mejora.
Indica la parte del tiempo total de ejecución que puede ser reducida mediante la mejora.
Fracción mejorable
Mejora
F =Tiempo que se puede mejorar
Tiempo total
M =Tiempo sin mejora
Tiempo con mejora
Rendimiento
55
El Computador
El nuevo tiempo de ejecución se puede calcular como:
Con lo que la aceleración tras la mejora será:
(1 - F) +
S =TAntiguo
TNuevo
=F
M
1
Tnuevo =1
MTAntiguo x (1 - F) + F
Rendimiento
56
57
Medición del rendimiento
¿Cómo medir el comportamiento de los computadores?
• Información del S.O.
• Kernels
• Conjuntos de benchmarks
• Monitores hardware
Los más utilizados son los conjuntos de benchmarks de la organización SPEC
El Computador
Rendimiento
58
SPEC
Standard Performance Evaluation Corporation
• Consiste en un conjunto de programas que se pasan en la máquina a evaluar.
• Los resultados se comparan con los obtenidos en una máquina de referencia.
• Hay distintos tipos de test según las características que se quieran evaluar.
El Computador
Rendimiento
El Computador 59
Ejemplo de SPEC
Rendimiento
El Computador 60
Rendimiento
El Computador 61
Rendimiento
El Computador 62
Rendimiento
El Computador 63
Rendimiento
El Computador 64
Rendimiento
El Computador 65
Rendimiento
El Computador 66
Rendimiento
El Computador 67
Rendimiento
El Computador 68
El resto son indicaciones sobre las opciones de compilación usadas, flag de optimización, etc …
Rendimiento
5. Disipación de Potencia
69
EL COMPUTADOR
Disipación de Potencia
El Computador
La disipación de calor es uno de los grandes problemas en el diseño de los procesadores y de los circuitos integrados en general.
El calor es generado por la potencia disipada y ésta ha ido en aumento con el paso de los años:
0,45 W 160 W
70
El Computador
El intercambio de calor con el aire exterior se realiza a través de la superficie del chip.
Por lo tanto conviene:
• Lograr una gran superficie de intercambio.
• Renovar rápidamente el aire que se va calentando.
Disipación de Potencia
71
El Computador
El aumento de la superficie de disipación se obtiene acoplando estructuras de materiales que conduzcan fácilmente el calor y una gran superficie.
Disipación de Potencia
72
El Computador
La rápida renovación del aire se logra acoplando ventiladores a las estructuras de disipación.
Disipación de Potencia
73
El Computador
En casos extremos se utilizan métodos más sofisticados:
Disipación de Potencia
Refrigeración por agua
Célula Peltier
Hielo seco
74
El Computador
Disipación de Potencia
Potencia total disipada
Potenciadinámica + Potencia
de cortocircuitoPotenciaestática+
75
El Computador
Se produce por la conmutación de los transistores.
Pd = A x C x V 2 x F
A : Coeficiente de actividad
C : Capacidad
V : Voltaje de funcionamiento
F : Frecuencia de conmutación
Disipación de Potencia
Potenciadinámica
76
El Computador
Es debida a la corriente que fluye durante un tiempo t entre la alimentación y la tierra cuando las puertas conmutan.
Pc = A x t x V x Ic
A : Coeficiente de actividad
t : Tiempo
V : Voltaje de funcionamiento
Ic : Corriente de cortocircuito
Disipación de Potencia
Potenciade cortocircuito
77
El Computador
Es provocada por la corriente de pérdida que fluye por el transistor aunque éste no funcione.
Pe = V x Ie
V : Voltaje de funcionamiento
Ie : Corriente estática de fuga
Disipación de Potencia
Potenciaestática
Aunque es muy pequeña, adquiere la suficiente importancia cuando el número de transistores es elevado.
78
El Computador
Para disminuir el consumo de potencia se puede:
• Disminuir la tensión de alimentación (V)
(Ha pasado de 5 V a poco más de 1 V)
• Disminuir la frecuencia (F)
La capacidad (C) depende del número de transistores, la tecnología y su interconexión.
Algunos procesadores reducen su actividad de forma automática cuando se calientan demasiado.
También pueden desconectar el reloj de los módulos que no se están utilizando (por ejemplo, la unidad F.P.)
Disipación de Potencia
79