DEV Community

Cover image for re:Invent 2024 Keynotes
Guillermo Ruiz for AWS Español

Posted on

re:Invent 2024 Keynotes

¡Bienvenidos al resumen de re:Invent 2024! Aquí encontrarás las principales novedades de las keynotes que se irán desvelando durante el evento. Este blog se actualizará a lo largo de la semana conforme se presenten más anuncios, así que estaros atentos!

Lunes: Keynote Peter Desantis

Peter Desantis

Evolución de AWS Graviton

David Brown, VP de Compute & Networking, compartió cómo los procesadores Graviton han evolucionado con cada generación, destacando que Graviton3 ofrece un 60% más de rendimiento que Graviton2 en cargas como NGINX, mientras que Graviton4 eleva este avance con un 40% más de rendimiento sobre Graviton3. Estos procesadores no solo representan un salto en eficiencia, sino que también son el motor detrás de muchos de los servicios más utilizados en AWS, consolidándose como un pilar clave en rendimiento y sostenibilidad.

Evolución de AWS Graviton

Trainium2: Optimización para Machine Learning

⁣AWS continúa liderando en la creación de chips personalizados con Trainium2, diseñado específicamente para el entrenamiento de modelos de ML. Este chip ofrece un mejor rendimiento con el menor coste y uso energético, e integra tecnologías avanzadas como:⁣
⁣- 𝗦𝘆𝘀𝘁𝗼𝗹𝗶𝗰 𝗔𝗿𝗿𝗮𝘆, diseñada para acelerar operaciones como multiplicaciones de matrices y convoluciones.⁣⁣

𝗦𝘆𝘀𝘁𝗼𝗹𝗶𝗰 𝗔𝗿𝗿𝗮𝘆
⁣- 𝗡𝗲𝘂𝗿𝗼𝗻 𝗞𝗲𝗿𝗻𝗲𝗹 𝗜𝗻𝘁𝗲𝗿𝗳𝗮𝗰𝗲 (𝗡𝗞𝗜), una interfaz para optimizar kernels de cómputo en los chips Trainium e Inferentia.⁣

𝗡𝗲𝘂𝗿𝗼𝗻 𝗞𝗲𝗿𝗻𝗲𝗹 𝗜𝗻𝘁𝗲𝗿𝗳𝗮𝗰𝗲 (𝗡𝗞𝗜)

Inferencia optimizada para Amazon Bedrock

La nueva opción de inferencia optimizada para baja latencia en Bedrock (en preview).⁣ Compatible con modelos como Claude 3.5 Haiku y Llama 3.1 (405B/70B), reduce la latencia sin sacrificar precisión.⁣ Es ideal para aplicaciones sensibles a la latencia como chatbots en tiempo real o asistentes de programación interactivos.
Inferencia optimizada para Amazon Bedrock

Proyecto Rainier: el futuro del cómputo a gran escala

AWS y Anthropic están llevando la potencia al siguiente nivel con un UltraCluster EC2, respaldado por la red 10p10u, y compuesto por cientos de miles de chips Trainium2, logrando más de 5 veces el rendimiento en exaflops que las generaciones anteriores. ¿El objetivo? Entrenar modelos de IA de última generación con eficiencia y escalabilidad sin precedentes.⁣

red 10p10u

Conclusiones

Desde una arquitectura más resiliente hasta chips diseñados para la próxima generación de IA, AWS está trazando el camino hacia un futuro más eficiente y sostenible. Estos avances son una invitación a pensar en cómo podemos construir sistemas más escalables y preparados para los retos del mañana.⁣

Podéis ver la Keynote completa en: https://www.youtube.com/watch?v=vx36tyJ47ps

Top comments (0)