Procesadores Intel Sapphire Rapid-SP Xeon para incluir hasta 64 GB de memoria HBM2e, además de GPU de centro de datos y Xeon de próxima generación para 2023+

En SC21 (Supercomputing 2021), Intel organizó una breve sesión en la que discutió la hoja de ruta del centro de datos de próxima generación y las próximas GPU Ponte Vecchio y los procesadores Sapphire Rapids-SP Xeon.

Intel habla sobre los procesadores Sapphire Rapids-SP Xeon y las GPU Ponte Vecchio en SC21; también revela la gama de centros de datos de próxima generación para 2023+

Intel había discutido previamente la mayoría de los detalles técnicos con respecto a su línea de procesadores de centro de datos de próxima generación y GPU en Hot Chips 33. Reafirman lo que dijeron y también revelan algo más de información sobre SuperComputing 21.

Intel celebra el 50 aniversario de 4004: primer microprocesador comercial del mundo: una retrospectiva

La generación actual de procesadores escalables Intel Xeon ha sido ampliamente adoptada por nuestros socios en el ecosistema HPC y estamos agregando nuevas funciones con Sapphire Rapids, nuestro procesador escalable Xeon de próxima generación que actualmente se está probando con los clientes. Esta plataforma de próxima generación ofrece múltiples capacidades al ecosistema HPC, brindando memoria de banda ancha integrada con HBM2e por primera vez aprovechando la arquitectura de múltiples mosaicos de Sapphire Rapids. Sapphire Rapids también ofrece un rendimiento mejorado, nuevos aceleradores, PCIe Gen 5 y otras excelentes funciones optimizadas para IA, análisis de datos y cargas de trabajo HPC.

Las cargas de trabajo de HPC cambian rápidamente. Se diversifican y se especializan, requiriendo una mezcla de arquitecturas heterogéneas. Dado que la arquitectura x86 sigue siendo el caballo de batalla para las cargas de trabajo escalares, si queremos ofrecer mejoras de rendimiento de varios órdenes de magnitud y avanzar más allá de la era de la exaescala, debemos echar un vistazo a Cómo se realiza el trabajo crítico de HPC en las cargas vectoriales, matriciales y arquitecturas espaciales, y debemos asegurarnos de que estas arquitecturas funcionen juntas sin problemas. Intel ha adoptado una estrategia de «carga de trabajo completa», en la que los aceleradores específicos de la carga de trabajo y las unidades de procesamiento de gráficos (GPU) pueden funcionar sin problemas con las unidades de procesamiento central (CPU) desde una perspectiva de hardware y software.

Estamos implementando esta estrategia con nuestros procesadores escalables Intel Xeon de próxima generación y GPU Intel Xe HPC (con nombre en código «Ponte Vecchio») que impulsarán la supercomputadora Aurora 2 exaflops en el Laboratorio Nacional Argonne. Ponte Vecchio tiene la densidad de cómputo más alta por socket y por nodo, con 47 mosaicos con nuestras tecnologías de empaquetado avanzadas: EMIB y Foveros. Hay más de 100 aplicaciones HPC ejecutándose en el Ponte Vecchio. También estamos trabajando con socios y clientes, incluidos ATOS, Dell, HPE, Lenovo, Inspur, Quanta y Supermicro, para implementar Ponte Vecchio en sus últimas supercomputadoras.

vía Intel

Procesadores Intel Sapphire Rapids-SP Xeon para centros de datos

Según Intel, Sapphire Rapids-SP estará disponible en dos variantes de paquete, una configuración estándar y una configuración HBM. La variante estándar contará con un diseño de chiplet que consta de cuatro matrices XCC con un tamaño de matriz de aproximadamente 400 mm2. Este es el tamaño de un solo dado XCC y habrá cuatro en total en el chip Sapphire Rapids-SP Xeon superior. Cada chip se interconectará a través de EMIB, que tiene un tamaño de paso de 55u y un paso de núcleo de 100u.

Leer más:  ¿Está Football Manager 2022 en Xbox Game Pass?

El chip Sapphire Rapids-SP Xeon estándar contará con 10 interconexiones EMIB y la carcasa completa medirá 4446 mm2. Al cambiar a la variante HBM, obtenemos un mayor número de interconexiones que son iguales a 14 y son necesarias para interconectar la memoria HBM2E a los núcleos.

Las pruebas de rendimiento del procesador Intel Core i7-12800H Alder Lake-P también pierden, hasta un 25% más rápido que el procesador AMD Ryzen 7 5800H en la prueba de un solo hilo

Los cuatro paquetes de memoria HBM2E incluirán pilas 8-Hi, por lo que Intel buscará al menos 16 GB de memoria HBM2E por pila para un total de 64 GB en el paquete Sapphire Rapids-SP. Hablando de embalaje, la variante HBM medirá 5700 mm2 o un 28% más que la variante estándar. En comparación con los números EPYC de Génova recientemente revelados, el paquete HBM2E para Sapphire Rapids-SP sería un 5% más grande, mientras que el paquete estándar sería un 22% más pequeño.

  • Intel Sapphire Rapids-SP Xeon (paquete estándar) – 4446 mm2
  • Intel Sapphire Rapids-SP Xeon (paquete HBM2E) – 5700mm2
  • AMD EPYC Genova (paquete 12 CCD) – 5428 mm2

Intel también afirma que el enlace EMIB ofrece el doble de mejora en la densidad de ancho de banda y cuatro veces la eficiencia energética de los diseños de bahía estándar. Curiosamente, Intel llama a la última gama Xeon Logically Monolytic, lo que significa que se refieren a la interconexión que brindará la misma funcionalidad que un solo chip, pero técnicamente hay cuatro chips que estarán interconectados. Puede leer todos los detalles sobre los procesadores de hilo estándar Sapphire Rapids-SP Xeon 56 y 112 aquí.

Familias de Intel Xeon SP:

Imagen de marca familiarSkylake-SPCascade Lake-SP / APCooper Lake-SPLago de hielo-SPRápidos de zafiroRápidos esmeraldaGranito RapidsRápidos de diamantes
Nodo de proceso14 nm +14 nm ++14 nm ++10 nm +Intel 7Intel 7Intel 4Intel3?
Nombre de la plataformaIntel purleyIntel purleyIntel Cedar IslandIntel WhitleyIntel Eagle StreamIntel Eagle StreamIntel Mountain Stream Intel Birch StreamIntel Mountain Stream Intel Birch Stream
MCP SKU (paquete de varios chips)NoNoNoSer determinadoPor definir (tal vez si)Por definir (tal vez si)
JacoboLGA 3647LGA 3647LGA 4189LGA 4189LGA 4677LGA 4677LGA 4677Ser determinado
Número máximo de núcleosHasta 28Hasta 28Hasta 28Hasta 40Hasta 56¿Hasta 64?¿Hasta 120?Ser determinado
Número máximo de subprocesosHasta 56Hasta 56Hasta 56Hasta 80Hasta 112¿Hasta 128?¿Hasta 240?Ser determinado
Caché L3 máximo38,5 MB L338,5 MB L338,5 MB L360 MB L3105 MB L3120 MB L3?Ser determinadoSer determinado
Soporte de memoriaDDR4-2666 de 6 canalesDDR4-2933 de 6 canalesHasta 6 canales DDR4-3200Hasta 8 canales DDR4-3200Hasta 8 canales DDR5-4800¿Hasta 8 canales DDR5-5600?Ser determinadoSer determinado
Soporte para generación PCIePCIe 3.0 (48 carriles)PCIe 3.0 (48 carriles)PCIe 3.0 (48 carriles)PCIe 4.0 (64 carriles)PCIe 5.0 (80 carriles)PCIe 5.0PCIe 6.0?PCIe 6.0?
Gama TDP140W-205W165W-205W150W-250W105-270WHasta 350WHasta 350WSer determinadoSer determinado
DIMM Xpoint Optane 3DN / APase ApachePaso de BarlowPaso de BarlowPaso de cuervo¿Paso del cuervo?Paso Donahue?Paso Donahue?
CompetenciaAMD EPYC Nápoles 14 nmAMD EPYC Roma de 7 nmAMD EPYC Roma de 7 nmAMD EPYC Milán 7nm +AMD EPYC Génova ~ 5 nmAMD EPYC de próxima generación (después de Génova)AMD EPYC de próxima generación (después de Génova)AMD EPYC de próxima generación (después de Génova)
Tirar201720182020202120222023?2024?2025?
Leer más:  ¿Un remake 4K de Mortal Kombat? El estudio independiente pide permiso a Warner para rehacer la trilogía

Procesadores gráficos en el centro de datos Intel Ponte Vecchio

Pasando a Ponte Vecchio, Intel mostró algunas características clave de su GPU de centro de datos insignia, como 128 núcleos Xe, 128 unidades RT, memoria HBM2e y un total de 8 GPU Xe-HPC que se vincularán entre sí. El chip tendrá hasta 408 MB de caché L2 en dos pilas separadas que se conectarán a través de la interconexión EMIB. El chip tendrá múltiples matrices basadas en el proceso «Intel 7» de Intel y los nodos de proceso N7 / N5 de TSMC.

Intel también ha detallado anteriormente el paquete y las dimensiones de la matriz de su GPU insignia Ponte Vecchio basada en la arquitectura Xe-HPC. La ficha constará de 2 fichas con 16 dados activos por pila. El tamaño máximo de la matriz superior activa será de 41 mm2, mientras que el tamaño de la matriz base, también conocido como «mosaico de cálculo», es de 650 mm2.

La GPU Ponte Vecchio utiliza 8 baterías HBM 8-Hi y contiene un total de 11 interconexiones EMIB. Toda la carcasa del Intel Ponte Vecchio mediría 4843,75 mm2. También se dice que el tono de golpe para los procesadores Meteor Lake que utilizan empaques Forveros 3D de alta densidad será de 36u.

Además de esto, Intel también ha lanzado una hoja de ruta en la que confirman que la familia Xeon Sapphire Rapids-SP de próxima generación y las GPU Ponte Vecchio estarán disponibles en 2022, pero también existe la línea de productos de próxima generación. para 2023 y más allá. . Intel no ha dicho explícitamente lo que pretende traer, pero sí sabemos que el sucesor de Sapphire Rapids se conocerá como Emerald y Granite Rapids y el sucesor se conocerá como Diamond Rapids.

Leer más:  El jugador de Monster Hunter Rise pasa 6 meses haciendo hachas de origami para desear patos

Por el lado de la GPU, no sabemos cuál será el sucesor del Ponte Vecchio, pero esperamos que compita con las GPU de próxima generación de NVIDIA y AMD para el mercado de centros de datos.

En el futuro, Intel ofrecerá varias soluciones de próxima generación para diseños de empaque avanzados, como Forveros Omni y Forveros Direct, a medida que ingresan a la era Angstrom del desarrollo de transistores.

Aceleradores de GPU para centros de datos de próxima generación

Nombre de la GPUAMD Instinct MI200Tolva NVIDIA GH100Intel Xe HPC
El producto estrellaAMD Instinct MI250XNVIDIA H100Intel Ponte Vecchio
Diseño de envasesMCM (tejido infinito)MCM (NVLINK)MCM (EMIB + Forveros)
Arquitectura de GPUAldebarán (CDNA 2)Tolva GH100Xe-HPC
Nodo de proceso de GPU6 nm5nm?7 nm (Intel 4)
núcleo de GPU14.08018.432?32 768?
Velocidad de reloj de la GPU1700 MHzSer determinadoSer determinado
Cobertura L2 / L32 x 8 MBSer determinado2 x 204 MB
FP16 Calcular383 ARRIBASer determinadoSer determinado
Cálculo FP3295,7 TFLOPSer determinado~ 45 TFLOP (Silicio A0)
Cálculo FP6447,9 TFLOPSer determinadoSer determinado
Capacidad de memoria128 GB HBM2E128GB HBM2E?Ser determinado
Reloj de la memoria3,2 Gbit / sSer determinadoSer determinado
Bus de memoria8192 bits8192 bits?8192 bits
Banda de memoria3,2 TB / seg~ 2,5 TB / seg.5 TB / seg
Factor de formaDoble hendidura, longitud completa / OAMDoble hendidura, longitud completa / OAMOAM
EnfriándoseRefrigeración pasiva Refrigeración líquidaRefrigeración pasiva Refrigeración líquidaRefrigeración pasiva Refrigeración líquida
TDPCuarto trimestre de 20212S 20222022-2023?

Deja un comentario

Armada Gamer