{"id":11957,"date":"2024-03-31T12:39:29","date_gmt":"2024-03-31T10:39:29","guid":{"rendered":"https:\/\/toukiela.com\/databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche\/"},"modified":"2024-03-31T12:39:30","modified_gmt":"2024-03-31T10:39:30","slug":"databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche","status":"publish","type":"post","link":"https:\/\/toukiela.com\/de\/databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche\/","title":{"rendered":"Databricks investit 10 millions de dollars dans un tout nouveau mod\u00e8le d&rsquo;IA g\u00e9n\u00e9rative DBRX &#8211; Une r\u00e9volution en marche !"},"content":{"rendered":"<p><em><\/em><\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhaltsverzeichnis<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69f5ea27bdbea\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69f5ea27bdbea\"  aria-label=\"Toggle\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/toukiela.com\/de\/databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche\/#Une_solution_de_generation_dIA_de_Databricks\" >Une solution de g\u00e9n\u00e9ration d\u2019IA de Databricks<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/toukiela.com\/de\/databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche\/#Un_modele_%C2%AB_open_source_%C2%BB_avec_des_restrictions\" >Un mod\u00e8le \u00ab\u00a0open source\u00a0\u00bb avec des restrictions<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/toukiela.com\/de\/databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche\/#Une_solution_de_gestion_pour_contourner_les_obstacles\" >Une solution de gestion pour contourner les obstacles<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/toukiela.com\/de\/databricks-investit-10-millions-de-dollars-dans-un-tout-nouveau-modele-dia-generative-dbrx-une-revolution-en-marche\/#DBRX_vs_les_autres_modeles\" >DBRX vs. les autres mod\u00e8les<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Une_solution_de_generation_dIA_de_Databricks\"><\/span>Une solution de g\u00e9n\u00e9ration d\u2019IA de Databricks<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Si vous vouliez augmenter la visibilit\u00e9 de votre grande entreprise technologique et que vous disposiez de 10 millions de dollars \u00e0 d\u00e9penser, comment les d\u00e9penseriez-vous ? Dans une publicit\u00e9 du Super Bowl ? Un partenariat avec la F1 ?<\/p>\n<p><\/p>\n<p>Une autre option serait de d\u00e9penser cet argent pour former un mod\u00e8le d\u2019IA g\u00e9n\u00e9ratif. Bien que cela ne rel\u00e8ve pas du marketing au sens traditionnel, les mod\u00e8les g\u00e9n\u00e9ratifs attirent l\u2019attention et sont de plus en plus utilis\u00e9s pour promouvoir les produits et services des fournisseurs.<\/p>\n<p><\/p>\n<p>C\u2019est exactement ce que propose Databricks avec son mod\u00e8le d\u2019IA g\u00e9n\u00e9ratif DBRX, annonc\u00e9 aujourd\u2019hui et similaire \u00e0 la s\u00e9rie GPT d\u2019OpenAI et \u00e0 Gemini de Google. Disponible sur GitHub et la plateforme de d\u00e9veloppement d\u2019IA Hugging Face, les versions de base (DBRX Base) et adapt\u00e9es (DBRX Instruct) de DBRX peuvent \u00eatre ex\u00e9cut\u00e9es et ajust\u00e9es sur des donn\u00e9es publiques, personnalis\u00e9es ou propri\u00e9taires.<\/p>\n<p><\/p>\n<p>\u00ab DBRX a \u00e9t\u00e9 form\u00e9 pour \u00eatre utile et fournir des informations sur une grande vari\u00e9t\u00e9 de sujets \u00bb, explique Naveen Rao, vice-pr\u00e9sident de l\u2019IA g\u00e9n\u00e9rative chez Databricks, dans une interview accord\u00e9e \u00e0 Toukiela. \u00ab DBRX a \u00e9t\u00e9 optimis\u00e9 et ajust\u00e9 pour une utilisation en anglais, mais il est capable de converser et de traduire dans une grande vari\u00e9t\u00e9 de langues, comme le fran\u00e7ais, l\u2019espagnol et l\u2019allemand. \u00bb<\/p>\n<p><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Un_modele_%C2%AB_open_source_%C2%BB_avec_des_restrictions\"><\/span>Un mod\u00e8le \u00ab\u00a0open source\u00a0\u00bb avec des restrictions<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Databricks d\u00e9crit DBRX comme un mod\u00e8le \u00ab open source \u00bb similaire \u00e0 des mod\u00e8les comme Llama 2 de Meta et les mod\u00e8les de la startup Mistral. Cependant, il existe un d\u00e9bat sur la question de savoir si ces mod\u00e8les r\u00e9pondent vraiment \u00e0 la d\u00e9finition de l\u2019open source.<\/p>\n<p><\/p>\n<p>Databricks affirme avoir d\u00e9pens\u00e9 environ 10 millions de dollars et deux mois pour former DBRX, qui, selon eux (citant un communiqu\u00e9 de presse), \u00ab surpasse tous les mod\u00e8les open source existants sur les benchmarks standard \u00bb.<\/p>\n<p><\/p>\n<p>Cependant, il est extr\u00eamement difficile d\u2019utiliser DBRX si vous n\u2019\u00eates pas client de Databricks.<\/p>\n<p><\/p>\n<p>En effet, pour ex\u00e9cuter DBRX dans sa configuration standard, vous avez besoin d\u2019un serveur ou d\u2019un ordinateur avec au moins quatre GPU Nvidia H100 (ou toute autre configuration de GPU totalisant environ 320 Go de m\u00e9moire). Un seul H100 co\u00fbte des milliers de dollars, ce qui est bien au-del\u00e0 des moyens de nombreux d\u00e9veloppeurs et entrepreneurs individuels.<\/p>\n<p><\/p>\n<p>Il est possible d\u2019ex\u00e9cuter le mod\u00e8le sur un cloud tiers, mais les exigences mat\u00e9rielles sont toujours assez \u00e9lev\u00e9es. Par exemple, il n\u2019y a qu\u2019un seul type d\u2019instance sur Google Cloud qui int\u00e8gre des puces H100. Les autres clouds peuvent co\u00fbter moins cher, mais en g\u00e9n\u00e9ral, ex\u00e9cuter de grands mod\u00e8les comme celui-ci n\u2019est pas bon march\u00e9 aujourd\u2019hui.<\/p>\n<p><\/p>\n<p>De plus, il y a des conditions g\u00e9n\u00e9rales \u00e0 respecter. Databricks affirme que les entreprises ayant plus de 700 millions d\u2019utilisateurs actifs seront soumises \u00e0 certaines restrictions comparables \u00e0 celles de Meta pour Llama 2, et que tous les utilisateurs devront accepter des conditions garantissant une utilisation responsable de DBRX. (Databricks n\u2019a pas sp\u00e9cifi\u00e9 ces conditions au moment de la publication.)<\/p>\n<p><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Une_solution_de_gestion_pour_contourner_les_obstacles\"><\/span>Une solution de gestion pour contourner les obstacles<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Face \u00e0 ces obstacles, Databricks pr\u00e9sente son produit Mosaic AI Foundation Model comme la solution de gestion qui permet de contourner ces probl\u00e8mes. En plus d\u2019ex\u00e9cuter DBRX et d\u2019autres mod\u00e8les, Mosaic AI Foundation Model offre une pile de formation permettant d\u2019ajuster DBRX sur des donn\u00e9es personnalis\u00e9es. Les clients peuvent h\u00e9berger DBRX en priv\u00e9 en utilisant l\u2019offre de mise en service de mod\u00e8le de Databricks, ou travailler avec Databricks pour d\u00e9ployer DBRX sur le mat\u00e9riel de leur choix.<\/p>\n<p><\/p>\n<p>\u00ab Nous nous concentrons sur le fait de faire de la plateforme Databricks le meilleur choix pour la cr\u00e9ation de mod\u00e8les personnalis\u00e9s, afin d\u2019attirer davantage d\u2019utilisateurs sur notre plateforme. DBRX est une d\u00e9monstration de notre plateforme de pr\u00e9-formation et d\u2019ajustement de pointe, que les clients peuvent utiliser pour cr\u00e9er leurs propres mod\u00e8les \u00e0 partir de z\u00e9ro. C\u2019est un moyen facile pour les clients de commencer avec les outils d\u2019IA g\u00e9n\u00e9rative Mosaic AI de Databricks. Et DBRX est tr\u00e8s performant d\u00e8s le d\u00e9part et peut \u00eatre ajust\u00e9 pour obtenir d\u2019excellentes performances sur des t\u00e2ches sp\u00e9cifiques \u00e0 un meilleur co\u00fbt que les grands mod\u00e8les ferm\u00e9s \u00bb, explique Rao.<\/p>\n<p><\/p>\n<h2><span class=\"ez-toc-section\" id=\"DBRX_vs_les_autres_modeles\"><\/span>DBRX vs. les autres mod\u00e8les<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Databricks affirme que DBRX fonctionne jusqu\u2019\u00e0 2 fois plus rapidement que Llama 2, gr\u00e2ce \u00e0 son architecture MoE (Mixture of Experts). Contrairement \u00e0 la plupart des mod\u00e8les MoE qui ont huit experts, DBRX en compte 16, ce qui, selon Databricks, am\u00e9liore la qualit\u00e9.<\/p>\n<p><\/p>\n<p>Cependant, malgr\u00e9 ces am\u00e9liorations, DBRX ne rivalise pas avec le mod\u00e8le d\u2019IA g\u00e9n\u00e9ratif leader, GPT-4 d\u2019OpenAI, dans la plupart des domaines en dehors des cas d\u2019utilisation sp\u00e9cifiques. De plus, DBRX pr\u00e9sente d\u2019autres limitations, notamment le fait de ne pas \u00eatre multimodal et de ne pas pouvoir traiter les images.<\/p>\n<p><\/p>\n<p>En ce qui concerne les donn\u00e9es d\u2019entra\u00eenement de DBRX, Rao r\u00e9v\u00e8le qu\u2019aucune donn\u00e9e client de Databricks n\u2019a \u00e9t\u00e9 utilis\u00e9e. Databricks a utilis\u00e9 un large ensemble de donn\u00e9es provenant de diff\u00e9rentes sources ouvertes.<\/p>\n<p><\/p>\n<p>Toutefois, il est important de noter que DBRX pr\u00e9sente \u00e9galement des limites, comme tous les autres mod\u00e8les d\u2019IA g\u00e9n\u00e9rative. Par exemple, le mod\u00e8le peut donner des r\u00e9ponses erron\u00e9es ou \u00ab hallucin\u00e9es \u00bb en fonction de ses associations de mots ou de phrases, ce qui peut entra\u00eener des r\u00e9ponses inexactes.<\/p>\n<p><\/p>\n<p>En fin de compte, DBRX semble \u00eatre une option difficile \u00e0 vendre \u00e0 quiconque n\u2019est pas d\u00e9j\u00e0 client ou futur client de Databricks. Les concurrents de Databricks dans le domaine de l\u2019IA g\u00e9n\u00e9rative, dont OpenAI, proposent des technologies tout aussi int\u00e9ressantes \u00e0 des prix tr\u00e8s comp\u00e9titifs. De plus, de nombreux mod\u00e8les d\u2019IA g\u00e9n\u00e9rative se rapprochent davantage de la d\u00e9finition couramment admise de l\u2019open source que DBRX.<\/p>\n<p><\/p>\n<p>Malgr\u00e9 cela, Databricks promet de continuer \u00e0 am\u00e9liorer DBRX et de publier de nouvelles versions \u00e0 mesure que l\u2019\u00e9quipe de recherche et d\u00e9veloppement de Mosaic Labs de l\u2019entreprise explore de nouvelles voies en mati\u00e8re d\u2019IA g\u00e9n\u00e9rative.<\/p>\n<p><\/p>\n<p>Il semble donc que DBRX ait encore un long chemin \u00e0 parcourir avant de rivaliser avec ses concurrents.<\/p>","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":11959,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"categories":[608],"tags":[],"class_list":["post-11957","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualite-intelligence-artificielle","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50"],"_links":{"self":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/11957","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/comments?post=11957"}],"version-history":[{"count":1,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/11957\/revisions"}],"predecessor-version":[{"id":11958,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/11957\/revisions\/11958"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media\/11959"}],"wp:attachment":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media?parent=11957"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/categories?post=11957"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/tags?post=11957"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}