Une nouvelle solution pour accéder aux GPU avec Amazon EC2 Capacity Blocks for ML
De plus en plus d’entreprises utilisent de grands modèles de langage qui nécessitent l’accès à des GPU. Les plus populaires sont ceux de Nvidia, ce qui les rend chers et souvent en rupture de stock. Il n’a pas toujours de sens de louer une instance à long terme auprès d’un fournisseur de cloud lorsque vous n’avez besoin d’accéder à ces ressources coûteuses que pour une seule tâche.
Pour résoudre ce problème, AWS a lancé aujourd’hui Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML, permettant aux clients d’acheter l’accès à ces GPU pour une durée déterminée, généralement pour exécuter une tâche liée à l’IA telle que la formation d’un modèle d’apprentissage automatique ou l’exécution d’une expérience avec un modèle existant.
« Il s’agit d’une nouvelle façon innovante de planifier les instances GPU, où vous pouvez réserver le nombre d’instances dont vous avez besoin pour une date future, pour la durée exacte dont vous avez besoin », a écrit Channy Yun dans un article de blog annonçant cette nouvelle fonctionnalité.
Le produit permet aux clients d’accéder aux instances Nvidia H100 Tensor Core GPUs en clusters allant d’une à 64 instances, avec 8 GPU par instance. Ils peuvent réserver du temps jusqu’à 14 jours, par incréments d’une journée, jusqu’à huit semaines à l’avance. Une fois la période terminée, les instances s’éteindront automatiquement.
Cette nouvelle solution permet aux utilisateurs de s’inscrire pour le nombre d’instances dont ils ont besoin pendant une durée déterminée, tout comme la réservation d’une chambre d’hôtel pour un certain nombre de jours (comme l’a expliqué l’entreprise). Du point de vue du client, il saura exactement combien de temps la tâche durera, combien de GPU il utilisera et combien cela coûtera, ce qui lui donnera une certitude quant aux coûts.
Pour Amazon, cela leur permet de mettre ces ressources très demandées au travail dans un environnement presque similaire à une vente aux enchères, leur assurant des revenus (sous réserve de l’arrivée des clients, bien sûr). Le prix d’accès à ces ressources sera vraiment dynamique, variant en fonction de l’offre et de la demande, selon l’entreprise.
Lorsqu’un utilisateur s’inscrit au service, celui-ci affiche le coût total pour la période et les ressources. Les utilisateurs peuvent ajuster cela à la hausse ou à la baisse, en fonction de leurs besoins en ressources et de leur budget, avant d’accepter l’achat.
Cette nouvelle fonctionnalité est désormais disponible en général dans la région AWS US East (Ohio).