¡Descubre los revolucionarios chips de Amazon para domar y potenciar tus modelos de IA!

Escasez de GPU: Amazon presenta nuevos chips para IA

La creciente demanda de inteligencia artificial generativa, a menudo entrenada y ejecutada en GPU, ha creado una escasez de GPU. Al parecer, los mejores chips de Nvidia estarán agotados hasta 2024. El consejero delegado del fabricante de chips TSMC se mostró menos optimista recientemente, sugiriendo que la escasez de GPU de Nvidia, así como la de sus competidores, podría prolongarse hasta 2025.

Chips personalizados para la IA

Para reducir su dependencia de las GPU, las principales empresas tecnológicas están desarrollando -y en algunos casos poniendo a disposición de los clientes- chips personalizados adaptados a la creación, iteración y lanzamiento en producción de modelos de IA. Amazon es una de estas empresas y hoy, en su conferencia anual AWS re:Invent, ha presentado la última generación de sus chips para entrenar e inferir modelos de IA.

AWS Trainium2: rendimiento mejorado

El primer chip, AWS Trainium2, está diseñado para ofrecer hasta cuatro veces más rendimiento y hasta dos veces más eficiencia energética que la primera generación de Trainium, presentada en diciembre de 2020, según Amazon. Disponible en instancias EC Trn2 en clústeres de 16 chips en la nube de AWS, Tranium2 puede escalar hasta 100.000 chips en el producto AWS EC2 UltraCluster.

Amazon afirma que 100.000 chips Trainium ofrecen 65 exaflops de potencia de cálculo, o 650 teraflops por chip ("exaflops" y "teraflops" miden el número de operaciones de cálculo por segundo que puede realizar un chip). Probablemente hay factores complejos que hacen que este sea un cálculo aproximado, pero suponiendo que un solo chip Tranium2 pueda ofrecer alrededor de 200 teraflops de rendimiento, eso lo sitúa muy por encima de la capacidad de los chips de entrenamiento de IA personalizados de Google en torno a 2017.

Según Amazon, un clúster de 100.000 chips Trainium puede entrenar un modelo lingüístico de IA con 300.000 millones de parámetros en semanas en lugar de meses. ("Parámetros" son las partes de un modelo aprendidas a partir de datos de entrenamiento y que definen esencialmente las habilidades del modelo en un problema, como generar texto o código). Esto es aproximadamente 1,75 veces el tamaño del GPT-3 de OpenAI, el predecesor del generador de texto GPT-4.

"El silicio sustenta todas las cargas de trabajo de los clientes, por lo que es un área crítica de innovación para AWS", dijo David Brown, vicepresidente de computación y redes de AWS, en un comunicado de prensa. "Con la creciente popularidad de la IA generativa, Tranium2 ayudará a los clientes a entrenar sus modelos de aprendizaje automático más rápido, a menor coste y con mayor eficiencia energética."

Amazon no ha dicho cuándo estarán disponibles las instancias Trainium2 para los clientes de AWS, pero ha anunciado que lo estarán "el año que viene". Estaremos atentos a cualquier información adicional al respecto.

Graviton4: un chip Arm para la inferencia

El segundo chip anunciado por Amazon esta mañana es el Graviton4, basado en Arm y diseñado para la inferencia. Se trata de la cuarta generación de la familia de chips Graviton de Amazon (como indica el "4" añadido a "Graviton"), y es distinto del otro chip de inferencia de Amazon, Inferentia.

Amazon afirma que el Graviton4 ofrece hasta 30% más de rendimiento informático, 50% más de núcleos y 75% más de ancho de banda de memoria que un procesador Graviton3 de la generación anterior (pero no el Graviton3E más reciente), ejecutado en Amazon EC2. En comparación con el Graviton3, todas las interfaces de hardware físicas del Graviton4 están "cifradas", lo que permite que las cargas de trabajo de IA y los datos de entrenamiento estén mejor protegidos para los clientes con mayores requisitos de cifrado.

"Graviton4 marca la cuarta generación que hemos entregado en sólo cinco años y es el chip más potente y eficiente energéticamente que hemos construido para una amplia gama de cargas de trabajo", añadió David Brown en un comunicado. "Al centrarnos en diseños de chips adaptados a las cargas de trabajo del mundo real que son importantes para nuestros clientes, podemos ofrecer la infraestructura de nube más avanzada."

Graviton4 estará disponible en instancias Amazon EC2 R8g, que están disponibles hoy para su previsualización y se ofrecerán de forma generalizada en los próximos meses.

Comparta su opinión

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.