{"id":8254,"date":"2023-11-30T10:17:44","date_gmt":"2023-11-30T08:17:44","guid":{"rendered":"https:\/\/toukiela.com\/decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia\/"},"modified":"2023-11-30T10:17:46","modified_gmt":"2023-11-30T08:17:46","slug":"decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia","status":"publish","type":"post","link":"https:\/\/toukiela.com\/de\/decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia\/","title":{"rendered":"D\u00e9couvrez les puces r\u00e9volutionnaires d&rsquo;Amazon pour dompter et propulser vos mod\u00e8les d&rsquo;IA !"},"content":{"rendered":"<p><em><\/em><\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhaltsverzeichnis<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69f1e3826b649\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69f1e3826b649\"  aria-label=\"Toggle\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/toukiela.com\/de\/decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia\/#Penurie_de_GPU_Amazon_devoile_de_nouvelles_puces_pour_lIA\" >P\u00e9nurie de GPU : Amazon d\u00e9voile de nouvelles puces pour l\u2019IA<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/toukiela.com\/de\/decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia\/#Des_puces_personnalisees_pour_lIA\" >Des puces personnalis\u00e9es pour l\u2019IA<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/toukiela.com\/de\/decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia\/#AWS_Trainium2_des_performances_ameliorees\" >AWS Trainium2 : des performances am\u00e9lior\u00e9es<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/toukiela.com\/de\/decouvrez-les-puces-revolutionnaires-damazon-pour-dompter-et-propulser-vos-modeles-dia\/#Graviton4_une_puce_Arm_pour_linference\" >Graviton4 : une puce Arm pour l\u2019inf\u00e9rence<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Penurie_de_GPU_Amazon_devoile_de_nouvelles_puces_pour_lIA\"><\/span>P\u00e9nurie de GPU : Amazon d\u00e9voile de nouvelles puces pour l\u2019IA<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La demande croissante pour l\u2019intelligence artificielle g\u00e9n\u00e9rative, souvent entra\u00een\u00e9e et ex\u00e9cut\u00e9e sur des GPU, a cr\u00e9\u00e9 une p\u00e9nurie de ces derniers. Les meilleures puces de Nvidia sont apparemment en rupture de stock jusqu\u2019en 2024. Le PDG de TSMC, fabricant de puces, a r\u00e9cemment \u00e9t\u00e9 moins optimiste, sugg\u00e9rant que la p\u00e9nurie de GPU de Nvidia, ainsi que celle de ses concurrents, pourrait se prolonger jusqu\u2019en 2025.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Des_puces_personnalisees_pour_lIA\"><\/span>Des puces personnalis\u00e9es pour l\u2019IA<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Pour r\u00e9duire leur d\u00e9pendance aux GPU, les grandes entreprises technologiques d\u00e9veloppent \u2013 et dans certains cas, rendent disponibles pour les clients \u2013 des puces personnalis\u00e9es adapt\u00e9es \u00e0 la cr\u00e9ation, \u00e0 l\u2019it\u00e9ration et \u00e0 la mise en production de mod\u00e8les d\u2019IA. Amazon fait partie de ces entreprises et a d\u00e9voil\u00e9 aujourd\u2019hui, lors de sa conf\u00e9rence annuelle AWS re:Invent, la derni\u00e8re g\u00e9n\u00e9ration de ses puces pour l\u2019entra\u00eenement et l\u2019inf\u00e9rence des mod\u00e8les d\u2019IA.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"AWS_Trainium2_des_performances_ameliorees\"><\/span>AWS Trainium2 : des performances am\u00e9lior\u00e9es<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La premi\u00e8re puce, AWS Trainium2, est con\u00e7ue pour offrir des performances jusqu\u2019\u00e0 4 fois sup\u00e9rieures et une efficacit\u00e9 \u00e9nerg\u00e9tique jusqu\u2019\u00e0 2 fois meilleure que la premi\u00e8re g\u00e9n\u00e9ration de Trainium, d\u00e9voil\u00e9e en d\u00e9cembre 2020, selon Amazon. Disponible dans les instances EC Trn2 en clusters de 16 puces dans le cloud AWS, Tranium2 peut atteindre une \u00e9chelle de 100 000 puces dans le produit EC2 UltraCluster d\u2019AWS.<\/p>\n<p>Amazon affirme que 100 000 puces Trainium offrent une puissance de calcul de 65 exaflops, soit 650 t\u00e9raflops par puce. (\u00ab\u00a0Exaflops\u00a0\u00bb et \u00ab\u00a0teraflops\u00a0\u00bb mesurent le nombre d\u2019op\u00e9rations de calcul par seconde qu\u2019une puce peut effectuer.) Il y a probablement des facteurs complexes rendant ce calcul approximatif, mais en supposant qu\u2019une seule puce Tranium2 puisse d\u00e9livrer environ 200 t\u00e9raflops de performances, cela la place bien au-dessus de la capacit\u00e9 des puces d\u2019entra\u00eenement d\u2019IA personnalis\u00e9es de Google vers 2017.<\/p>\n<p>Un cluster de 100 000 puces Trainium peut entra\u00eener un mod\u00e8le de langage IA de 300 milliards de param\u00e8tres en semaines au lieu de mois, affirme Amazon. (\u00ab\u00a0Les param\u00e8tres\u00a0\u00bb sont les parties d\u2019un mod\u00e8le apprises \u00e0 partir des donn\u00e9es d\u2019entra\u00eenement et d\u00e9finissent essentiellement les comp\u00e9tences du mod\u00e8le sur un probl\u00e8me, comme la g\u00e9n\u00e9ration de texte ou de code.) Cela repr\u00e9sente environ 1,75 fois la taille du GPT-3 d\u2019OpenAI, pr\u00e9d\u00e9cesseur du g\u00e9n\u00e9rateur de texte GPT-4.<\/p>\n<p>\u00ab\u00a0Le silicium est \u00e0 la base de chaque charge de travail client, ce qui en fait un domaine d\u2019innovation critique pour AWS\u00a0\u00bb, a d\u00e9clar\u00e9 David Brown, vice-pr\u00e9sident du calcul et des r\u00e9seaux d\u2019AWS, dans un communiqu\u00e9 de presse. \u00ab\u00a0Avec l\u2019engouement croissant pour l\u2019IA g\u00e9n\u00e9rative, Tranium2 aidera les clients \u00e0 former leurs mod\u00e8les d\u2019apprentissage automatique plus rapidement, \u00e0 moindre co\u00fbt et avec une meilleure efficacit\u00e9 \u00e9nerg\u00e9tique.\u00a0\u00bb<\/p>\n<p>Amazon n\u2019a pas pr\u00e9cis\u00e9 quand les instances Trainium2 seront disponibles pour les clients d\u2019AWS, mais a annonc\u00e9 qu\u2019elles le seraient \u00ab\u00a0l\u2019ann\u00e9e prochaine\u00a0\u00bb. Nous resterons attentifs \u00e0 toute information suppl\u00e9mentaire \u00e0 ce sujet.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Graviton4_une_puce_Arm_pour_linference\"><\/span>Graviton4 : une puce Arm pour l\u2019inf\u00e9rence<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La deuxi\u00e8me puce annonc\u00e9e par Amazon ce matin est le Graviton4 bas\u00e9 sur Arm, destin\u00e9 \u00e0 l\u2019inf\u00e9rence. Il s\u2019agit de la quatri\u00e8me g\u00e9n\u00e9ration de la famille de puces Graviton d\u2019Amazon (comme l\u2019indique le \u00ab\u00a04\u00a0\u00bb ajout\u00e9 \u00e0 \u00ab\u00a0Graviton\u00a0\u00bb), et elle se distingue de l\u2019autre puce d\u2019inf\u00e9rence d\u2019Amazon, Inferentia.<\/p>\n<p>Amazon affirme que le Graviton4 offre jusqu\u2019\u00e0 30% de meilleures performances de calcul, 50% de c\u0153urs en plus et 75% de bande passante m\u00e9moire en plus qu\u2019un processeur Graviton3 de g\u00e9n\u00e9ration pr\u00e9c\u00e9dente (mais pas le plus r\u00e9cent Graviton3E), fonctionnant sur Amazon EC2. Par rapport au Graviton3, toutes les interfaces mat\u00e9rielles physiques du Graviton4 sont \u00ab\u00a0crypt\u00e9es\u00a0\u00bb, ce qui permet de mieux s\u00e9curiser les charges de travail et les donn\u00e9es d\u2019entra\u00eenement de l\u2019IA pour les clients ayant des exigences accrues en mati\u00e8re de chiffrement.<\/p>\n<p>\u00ab\u00a0Graviton4 marque la quatri\u00e8me g\u00e9n\u00e9ration que nous avons livr\u00e9e en seulement cinq ans et c\u2019est la puce la plus puissante et la plus \u00e9conome en \u00e9nergie que nous ayons jamais construite pour un large \u00e9ventail de charges de travail\u00a0\u00bb, a ajout\u00e9 David Brown dans une d\u00e9claration. \u00ab\u00a0En nous concentrant sur les conceptions de puces adapt\u00e9es aux charges de travail r\u00e9elles qui sont importantes pour nos clients, nous sommes en mesure de fournir l\u2019infrastructure cloud la plus avanc\u00e9e.\u00a0\u00bb<\/p>\n<p>Le Graviton4 sera disponible dans les instances Amazon EC2 R8g, qui sont disponibles en pr\u00e9visualisation d\u00e8s aujourd\u2019hui et seront propos\u00e9es en g\u00e9n\u00e9ral dans les prochains mois.<\/p>","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":8256,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"categories":[608],"tags":[],"class_list":["post-8254","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualite-intelligence-artificielle","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50"],"_links":{"self":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/8254","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/comments?post=8254"}],"version-history":[{"count":1,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/8254\/revisions"}],"predecessor-version":[{"id":8255,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/8254\/revisions\/8255"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media\/8256"}],"wp:attachment":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media?parent=8254"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/categories?post=8254"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/tags?post=8254"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}