DESTACADOS
- Intel lanza Xeon 6 con núcleos de rendimiento (P-cores), duplicando el rendimiento para cargas de trabajo de IA y HPC.
- Los nuevos aceleradores de IA Gaudi 3 ofrecen hasta un 20% más de rendimiento y el doble de precio/rendimiento frente al H100 para la inferencia de LLaMa 2 70B1.
A medida que la IA sigue revolucionando las industrias, las empresas necesitan cada vez más una infraestructura rentable y disponible que pueda soportar el desarrollo rápido y eficiente de soluciones basadas en IA. Para satisfacer esta demanda de manera frontal, Intel lanzó hoy Xeon 6, con núcleos de rendimiento (P-cores) y aceleradores de IA Gaudi 3, fortaleciendo el compromiso de la compañía de ofrecer sistemas de IA potentes con un rendimiento óptimo por vatio y un menor costo total de propiedad (TCO).
«La demanda de IA está llevando a una transformación masiva en el centro de datos, y la industria está pidiendo opciones en hardware, software y herramientas para desarrolladores», dijo Justin Hotard, vicepresidente ejecutivo y gerente general del Grupo de Centros de Datos e Inteligencia Artificial de Intel. «Con nuestro lanzamiento de Xeon 6, con P-cores y los aceleradores de IA Gaudi 3, Intel está habilitando un ecosistema abierto que permite a nuestros clientes implementar todas sus cargas de trabajo con mayor rendimiento, eficiencia y seguridad».
Presentación del Intel Xeon 6 con núcleos de rendimiento (P-cores) y aceleradores de IA Gaudi 3
Los últimos avances de Intel en infraestructura de IA incluyen dos actualizaciones importantes en su cartera de centros de datos:
- Intel Xeon 6 con P-cores. Diseñado para manejar cargas de trabajo intensivas en computación con una eficiencia excepcional, Xeon 6 ofrece el doble de rendimiento que su predecesor. Cuenta con un mayor número de núcleos, el doble de ancho de banda de memoria y capacidades de aceleración de IA integradas en cada núcleo. Este procesador está diseñado para satisfacer las exigencias de rendimiento de la IA, desde el edge hasta los centros de datos y entornos en la nube.
- Acelerador de IA Intel Gaudi 3. Específicamente optimizado para IA generativa a gran escala, Gaudi 3 cuenta con 64 núcleos de procesamiento Tensor (TPC) y ocho motores de multiplicación de matrices (MME) para acelerar los cálculos de redes neuronales profundas. Incluye 128 GB de memoria HBMe2 para entrenamiento e inferencia, y 24 puertos Ethernet de 200 Gb para redes escalables. Gaudi 3 también ofrece una compatibilidad perfecta con el marco de PyTorch y los avanzados modelos transformers y diffusers de Hugging Face. Intel anunció recientemente una colaboración con IBM para desplegar aceleradores de IA Intel Gaudi 3 como servicio en IBM Cloud. Mediante esta colaboración, Intel e IBM pretenden reducir el coste total de propiedad para aprovechar y escalar la IA, al tiempo que mejoran el rendimiento.
Mejorando los sistemas de IA con beneficios de TCO
El despliegue de IA a gran escala implica considerar opciones de implementación flexibles, relaciones competitivas entre precio y rendimiento, y tecnologías de IA accesibles. La sólida infraestructura x86 de Intel y su extenso ecosistema abierto lo posicionan para ayudar a las empresas a construir sistemas de IA de alto valor con un costo total de propiedad (TCO) y rendimiento por vatio óptimos. Cabe destacar que el 73 % de los servidores acelerados por GPU utilizan Intel Xeon como CPU anfitrión.
Intel colabora con los principales fabricantes de equipos originales (OEM), incluidos Dell Technologies y Supermicro, para desarrollar sistemas co-diseñados que se adapten a las necesidades específicas de los clientes para implementaciones de IA efectivas. Actualmente, Dell Technologies está diseñando conjuntamente soluciones basadas en RAG que aprovechan Gaudí 3 y Xeon 6.
Cerrando la brecha entre prototipos y producción con esfuerzos de co-ingeniería
La transición de soluciones de IA generativa (Gen AI) desde prototipos a sistemas listos para producción presenta desafíos en cuanto a monitoreo en tiempo real, manejo de errores, registro, seguridad y escalabilidad. Intel aborda estos desafíos mediante esfuerzos de co-ingeniería con OEM y socios para ofrecer soluciones de generación aumentada por recuperación (RAG) listas para producción.
Estas soluciones, construidas sobre la plataforma Open Platform Enterprise AI (OPEA), integran microservicios basados en OPEA en un sistema RAG escalable, optimizado para sistemas Xeon y Gaudi AI, diseñado para permitir a los clientes integrar fácilmente aplicaciones de Kubernetes, Red Hat OpenShift AI y Red Hat Enterprise Linux AI.
Ampliando el Acceso a Aplicaciones de IA Empresarial
El portafolio Tiber de Intel ofrece soluciones empresariales para abordar desafíos como acceso, costo, complejidad, seguridad, eficiencia y escalabilidad en entornos de IA, nube y edge. La Intel Tiber Developer Cloud ahora proporciona sistemas de vista previa de Intel Xeon 6 para evaluación y pruebas tecnológicas. Además, algunos clientes seleccionados tendrán acceso anticipado a Intel Gaudi 3 para validar despliegues de modelos de IA, con clústeres de Gaudi 3 que comenzarán a implementarse el próximo trimestre para despliegues de producción a gran escala.
Las nuevas ofertas de servicios incluyen SeekrFlow, una plataforma de IA integral de Seekr para desarrollar aplicaciones de IA fiables. Las últimas actualizaciones incluyen la versión más reciente del software Intel Gaudi y Jupyter notebooks cargados con PyTorch 2.4 e Intel oneAPI y herramientas de IA 2024.2, que incluyen nuevas capacidades de aceleración de IA y compatibilidad con procesadores Xeon 6.
Más historias
Computex 2024: Intel acelera la IA en todas partes, redefiniendo la potencia de cómputo, el rendimiento y la asequibilidad con los nuevos Xeon 6, los aceleradores Gaudí y la arquitectura Lunar Lake