Descargar

Introducción a la Computación de Alto Rendimiento (HPC) (página 2)

Enviado por Pablo Turmero


Partes: 1, 2
edu.red

Procesadores, Memoria y Redes Los sistemas de memoria compartida y distribuida tienen: procesadores: RISC procesadores memoria: DRAM red/interconexión: entre los procesadores y memoria (bus, crossbar, fat tree, torus, hypercube, etc.) Estas piezas se tienen que describir en detalles, comenzando con definiciones de terminos.

edu.red

Procesador-Términos Relacionados Período de Reloj (cp): el mínimo intervalo de tiempo entre sucesivas acciones en el procesador. Fijo: depende del diseño del procesador. Medidas en nanosegundos (~1-5 para procesadores muy rápidos). Inverso de la frequencia (MHz). Instrucción: una acción ejecutada por un procesador, tal como una operación matemática o una operación de memoria. Registro: una pequeña y extremadamente rápida ubicación para almacenar datos o instrucciones en el procesador.

edu.red

Procesador-Términos Relacionados Unidad Funcional (FU): un elemento de hardware que ejecuta una operación sobre un operando o parejas de operaciones. Comúmente las FUs son ADD, MULT, INV, SQRT, etc. Pipeline : técnica de solapar multiples instrucciones en ejecución. Superscalar: multiples instrucciones son posibles por período de reloj. Flops: operaciones de punto flotante por segundo.

edu.red

Procesador-Términos Relacionados Cache: memoria rápida (SRAM) cercana del procesador. Ayuda a mantener instrucciones y datos cercanos a las unidades funcionales, entonces el procesador puede ejecutar más instrucciones más rápidamente. Translation-Lookaside Buffer (TLB): mantiene direcciones de páginas (bloques de memoria) en memoria principal que recientemente han sido accesados (una cache para direcciones de memoria)

edu.red

Memoria-Términos Relacionados SRAM: Static Random Access Memory (RAM). Muy rápida (~10 nanosegundos), hecha usando el mismo tipo de tecnología del procesador, entonces la velocidad es comparable. DRAM: Dynamic RAM. El tiempo de acceso es más lento (~100 nanosegundos), pero mantiene más bits y es menos costosa (10x más barata). Jerarquía de Memoria: la jerarquía de memoria en un sistema paralelo, desde registros a cache a memoria local a memoria remota. Luego….

edu.red

Interconexión-Términos Relacionados Latencia: Redes: Cuanto tiempo se lleva incializar el envio de un "mensaje"? Medido en microsegundos. Procesador: Cuanto tiempo se lleva la salida de resultados de algunas operaciones, tales como suma punto flotante, dividir etc., las cuales son hechas en pipelined?) Ancho de Banda: Qué porcentaje de data puede ser sostenida una vez que el mensaje es inicializado? Medido en Mbytes/sec o Gbytes/sec

edu.red

Interconexión-Términos Relacionados Topología: la forma en la cual los nodos son conectados. La mejor elección es conexión completa (cualquier procesador con cualquier otro). Infactible debido a razones de costo y escalamiento. Por ejemplo, los procesadores son conectados en alguna variación de mallas, torus, o hypercube.

(Gp:) 3-d hypercube (Gp:) 2-d mesh (Gp:) 2-d torus

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente