AMD ha presentado Helios, un nuevo sistema con arquitectura basada en la nueva especificación 'Open Rack Wide' (ORW) desarrollada por Meta, diseñado para satisfacer las exigencias de potencia, refrigeración e interoperabilidad de los centros de datos orientados a cargas de trabajo de inteligencia artificial (IA) avanzada.
Enmarcado en el Open Compute Project (OCP) Global Summit, celebrado este martes en San José (California, Estados Unidos), Meta ha presentado las especificaciones de un formato ORW para inteligencia artificial.
En este sentido, ambas compañías han dado a conocer Helio, un nuevo sistema que incorpora el formato ORW de Meta para ampliar la filosofía de 'hardware' abierto de AMD, que va "desde el silicio hasta el sistema y el 'rack'".
En concreto, Helios ha sido diseñado para centros de datos de escala gigavatio y, con el estándar ORW, se trata de un rack abierto de doble ancho optimizado para las necesidades de potencia, refrigeración y mantenimiento de los sistemas de IA de próxima generación, como ha explicado AMD en un comunicado.
Esto se debe a que combina GPUs AMD Instinct, CPUs EPYC y arquitecturas abiertas para ofrecer al sector una plataforma flexible, como son los estándares abiertos de computación OCP DC- MHS, UALink y arquitecturas del Ultra Ethernet Consortium (UEC). Todo ello, es compatible tanto con tejidos abiertos como con escalado vertical y horizontal.
Por su parte, el 'rack' incorpora refrigeración líquida de desconexión rápida para "un rendimiento térmico sostenido". Además, el diseño de doble ancho mejora la capacidad de mantenimiento. También integra Ethernet basado en estándares para una "resiliencia multivía".
Como resultado, AMD ha asegurado que Helios ofrece hasta 1,4 exaFLOPS de rendimiento FP8 y 31 TB de memoria HBM4 en un solo 'rack'.
Tal y como ha manifestado al respecto el vicepresidente ejecutivo y director general de Data Center Solutions Group en AMD, Forrest Norrod, "la colaboración abierta es clave para escalar la IA de forma eficiente". Así, ha matizado que, con Helios, transforman los estándares abiertos en "sistemas reales y desplegables".
Además de todo ello, AMD ha subrayado el diseño de Helios, que permite a fabricantes y desarrolladores de equipos originales OEMs y ODMs, y a operadores de hiperescala, "adoptar, ampliar y personalizar sistemas de IA abiertos de forma ágil".
Eso se traduce en reducir los tiempos de despliegue, mejoras de interoperabiliad y facilitar la escalabilidad eficiente para cargas de trabajo de IA y HPC, como ha concluido la tecnológica.