{"id":7752,"date":"2023-11-13T15:57:41","date_gmt":"2023-11-13T13:57:41","guid":{"rendered":"https:\/\/toukiela.com\/decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement\/"},"modified":"2023-11-13T15:57:42","modified_gmt":"2023-11-13T13:57:42","slug":"decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement","status":"publish","type":"post","link":"https:\/\/toukiela.com\/fr_be\/decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement\/","title":{"rendered":"D\u00e9couvrez l&rsquo;\u00e9quipe de choc de Hugging Face qui d\u00e9veloppe des mod\u00e8les d&rsquo;IA ChatGPT-like \u00e0 deux personnes seulement !"},"content":{"rendered":"<p><em><\/em><\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Sommaire<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69f1f1356b3a4\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69f1f1356b3a4\"  aria-label=\"Toggle\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/toukiela.com\/fr_be\/decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement\/#H4_lequipe_dediee_au_developpement_de_chatbots_AI\" >H4 : l\u2019\u00e9quipe d\u00e9di\u00e9e au d\u00e9veloppement de chatbots AI<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/toukiela.com\/fr_be\/decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement\/#Le_role_des_modeles_de_H4\" >Le r\u00f4le des mod\u00e8les de H4<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/toukiela.com\/fr_be\/decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement\/#La_commercialisation_du_travail_de_H4\" >La commercialisation du travail de H4<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/toukiela.com\/fr_be\/decouvrez-lequipe-de-choc-de-hugging-face-qui-developpe-des-modeles-dia-chatgpt-like-a-deux-personnes-seulement\/#La_contribution_de_H4_a_la_communaute_de_lIA\" >La contribution de H4 \u00e0 la communaut\u00e9 de l\u2019IA<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"H4_lequipe_dediee_au_developpement_de_chatbots_AI\"><\/span>H4 : l\u2019\u00e9quipe d\u00e9di\u00e9e au d\u00e9veloppement de chatbots AI<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>L\u2019entreprise de d\u00e9marrage en intelligence artificielle Hugging Face propose une large gamme d\u2019outils de d\u00e9veloppement et d\u2019h\u00e9bergement en science des donn\u00e9es, notamment un portail similaire \u00e0 GitHub pour les d\u00e9p\u00f4ts de code AI, les mod\u00e8les et les jeux de donn\u00e9es, ainsi que des tableaux de bord Web pour pr\u00e9senter des applications aliment\u00e9es par l\u2019IA.<\/p>\n<p>Cependant, certaines des meilleures et des plus performantes fonctionnalit\u00e9s de Hugging Face proviennent d\u2019une \u00e9quipe de deux personnes form\u00e9e en janvier dernier.<\/p>\n<p>Baptis\u00e9e H4, qui signifie \u00ab\u00a0helpful, honest, harmless and huggy\u00a0\u00bb (serviable, honn\u00eate, inoffensif et c\u00e2lin), cette \u00e9quipe vise \u00e0 d\u00e9velopper des outils et des \u00ab\u00a0recettes\u00a0\u00bb permettant \u00e0 la communaut\u00e9 de l\u2019IA de cr\u00e9er des chatbots aliment\u00e9s par l\u2019IA, similaires \u00e0 ChatGPT. En fait, la sortie de ChatGPT a \u00e9t\u00e9 le catalyseur de la cr\u00e9ation de H4, selon Lewis Tunstall, ing\u00e9nieur en apprentissage automatique chez Hugging Face et l\u2019un des deux membres de H4.<\/p>\n<p>\u00ab\u00a0Lorsque ChatGPT a \u00e9t\u00e9 lanc\u00e9 par OpenAI fin 2022, nous avons commenc\u00e9 \u00e0 r\u00e9fl\u00e9chir \u00e0 ce qu\u2019il faudrait pour reproduire ses capacit\u00e9s avec des biblioth\u00e8ques et des mod\u00e8les open source\u00a0\u00bb, a d\u00e9clar\u00e9 Tunstall dans une interview par e-mail accord\u00e9e \u00e0 nous. \u00ab\u00a0La recherche principale de H4 porte sur l\u2019alignement, qui consiste essentiellement \u00e0 apprendre aux LLM \u00e0 se comporter en fonction des commentaires des humains (ou m\u00eame d\u2019autres IA).\u00a0\u00bb<\/p>\n<p>H4 est \u00e0 l\u2019origine d\u2019un nombre croissant de mod\u00e8les de langage open source, dont Zephyr-7B-\u03b1, une version ax\u00e9e sur les chats du mod\u00e8le Mistral 7B r\u00e9cemment publi\u00e9 par la start-up fran\u00e7aise d\u2019IA Mistral. H4 a \u00e9galement fork\u00e9 Falcon-40B, un mod\u00e8le de l\u2019Institut d\u2019innovation technologique d\u2019Abu Dhabi, en modifiant le mod\u00e8le pour qu\u2019il r\u00e9ponde de mani\u00e8re plus serviable aux demandes formul\u00e9es en langage naturel.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Le_role_des_modeles_de_H4\"><\/span>Le r\u00f4le des mod\u00e8les de H4<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Pour former ses mod\u00e8les, H4 s\u2019appuie, comme d\u2019autres \u00e9quipes de recherche chez Hugging Face, sur un cluster d\u00e9di\u00e9 de plus de 1 000 GPU Nvidia A100. Tunstall et son coll\u00e8gue de H4, Ed Beeching, travaillent \u00e0 distance en Europe, mais b\u00e9n\u00e9ficient du soutien de plusieurs \u00e9quipes internes de Hugging Face, notamment l\u2019\u00e9quipe de test et d\u2019\u00e9valuation des mod\u00e8les.<\/p>\n<p>\u00ab\u00a0La petite taille de H4 est un choix d\u00e9lib\u00e9r\u00e9, car cela nous permet d\u2019\u00eatre plus agiles et de nous adapter \u00e0 un paysage de recherche en constante \u00e9volution\u00a0\u00bb, a d\u00e9clar\u00e9 Beeching dans un e-mail adress\u00e9 \u00e0 nous. \u00ab\u00a0Nous avons \u00e9galement plusieurs collaborations externes avec des groupes tels que LMSYS et LlamaIndex, avec lesquels nous travaillons sur des publications conjointes.\u00a0\u00bb<\/p>\n<p>R\u00e9cemment, H4 a \u00e9tudi\u00e9 diff\u00e9rentes techniques d\u2019alignement et a d\u00e9velopp\u00e9 des outils pour tester l\u2019efficacit\u00e9 des techniques propos\u00e9es par la communaut\u00e9 et l\u2019industrie. Ce mois-ci, l\u2019\u00e9quipe a publi\u00e9 un manuel contenant l\u2019ensemble du code source et des jeux de donn\u00e9es utilis\u00e9s pour construire Zephyr, et H4 pr\u00e9voit de mettre \u00e0 jour ce manuel avec le code de ses futurs mod\u00e8les IA lors de leur sortie.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"La_commercialisation_du_travail_de_H4\"><\/span>La commercialisation du travail de H4<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>J\u2019ai demand\u00e9 \u00e0 Tunstall si H4 subissait une pression de la part de la direction de Hugging Face pour commercialiser son travail. Apr\u00e8s tout, l\u2019entreprise a lev\u00e9 des centaines de millions de dollars aupr\u00e8s d\u2019un groupe d\u2019investisseurs prestigieux, parmi lesquels Salesforce, IBM, AMD, Google, Amazon Intel et Nvidia. La derni\u00e8re lev\u00e9e de fonds de Hugging Face l\u2019a valoris\u00e9e \u00e0 4,5 milliards de dollars, soit plus de 100 fois son chiffre d\u2019affaires annuel, selon les rapports.<\/p>\n<p>Tunstall a d\u00e9clar\u00e9 que H4 ne mon\u00e9tisait pas directement ses outils. Cependant, il a reconnu que les outils contribuaient au programme Expert Acceleration de Hugging Face, une offre ax\u00e9e sur les entreprises qui propose des conseils des \u00e9quipes de Hugging Face pour construire des solutions IA personnalis\u00e9es.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"La_contribution_de_H4_a_la_communaute_de_lIA\"><\/span>La contribution de H4 \u00e0 la communaut\u00e9 de l\u2019IA<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Interrog\u00e9 sur la concurrence entre H4 et d\u2019autres initiatives d\u2019IA open source, comme EleutherAI et LAION, Beeching a d\u00e9clar\u00e9 que ce n\u2019\u00e9tait pas l\u2019objectif de H4. Au contraire, il a affirm\u00e9 que l\u2019intention \u00e9tait d'\u00a0\u00bbautonomiser\u00a0\u00bb la communaut\u00e9 open AI en publiant le code d\u2019entra\u00eenement et les jeux de donn\u00e9es associ\u00e9s aux mod\u00e8les de chat de H4.<\/p>\n<p>\u00ab\u00a0Notre travail ne serait pas possible sans les nombreuses contributions de la communaut\u00e9\u00a0\u00bb, a d\u00e9clar\u00e9 Beeching.<\/p>","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":7754,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"categories":[608],"tags":[],"class_list":["post-7752","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualite-intelligence-artificielle","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50"],"_links":{"self":[{"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/posts\/7752","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/comments?post=7752"}],"version-history":[{"count":1,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/posts\/7752\/revisions"}],"predecessor-version":[{"id":7753,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/posts\/7752\/revisions\/7753"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/media\/7754"}],"wp:attachment":[{"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/media?parent=7752"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/categories?post=7752"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/toukiela.com\/fr_be\/wp-json\/wp\/v2\/tags?post=7752"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}