{"id":10796,"date":"2024-02-20T15:14:46","date_gmt":"2024-02-20T13:14:46","guid":{"rendered":"https:\/\/toukiela.com\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/"},"modified":"2024-02-20T15:14:47","modified_gmt":"2024-02-20T13:14:47","slug":"decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous","status":"publish","type":"post","link":"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/","title":{"rendered":"D\u00e9couvrez cet incroyable assistant vocal ouvert, cr\u00e9\u00e9 par une association allemande, accessible \u00e0 tous !"},"content":{"rendered":"<p><em><\/em><\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhaltsverzeichnis<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69f1e3a762476\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69f1e3a762476\"  aria-label=\"Toggle\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Un_nouvel_assistant_vocal_open_source_en_developpement\" >Un nouvel assistant vocal open source en d\u00e9veloppement<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Linitiative_BUD-E\" >L\u2019initiative BUD-E<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Une_architecture_extensible\" >Une architecture extensible<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Collaboration_et_roadmap_ambitieuse\" >Collaboration et roadmap ambitieuse<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Un_modele_preliminaire_disponible\" >Un mod\u00e8le pr\u00e9liminaire disponible<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Objectifs_futurs\" >Objectifs futurs<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/toukiela.com\/de\/decouvrez-cet-incroyable-assistant-vocal-ouvert-cree-par-une-association-allemande-accessible-a-tous\/#Accessibilite_et_idees_innovantes\" >Accessibilit\u00e9 et id\u00e9es innovantes<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Un_nouvel_assistant_vocal_open_source_en_developpement\"><\/span>Un nouvel assistant vocal open source en d\u00e9veloppement<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>De nombreuses tentatives ont \u00e9t\u00e9 faites pour cr\u00e9er des assistants vocaux open source aliment\u00e9s par l\u2019IA (voir Rhasspy, Mycroft et Jasper, pour n\u2019en citer que quelques-uns) \u2013 tous \u00e9tablis dans le but de cr\u00e9er des exp\u00e9riences hors ligne respectueuses de la vie priv\u00e9e sans compromis sur la fonctionnalit\u00e9. Mais le d\u00e9veloppement s\u2019est r\u00e9v\u00e9l\u00e9 extr\u00eamement lent. En plus des d\u00e9fis habituels li\u00e9s aux projets open source, la programmation d\u2019un assistant vocal est difficile. Des technologies comme Google Assistant, Siri et Alexa ont derri\u00e8re elles des ann\u00e9es, voire des d\u00e9cennies, de recherche et d\u00e9veloppement \u2013 ainsi qu\u2019une infrastructure \u00e9norme.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Linitiative_BUD-E\"><\/span>L\u2019initiative BUD-E<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Cependant, cela n\u2019a pas d\u00e9courag\u00e9 les personnes de Large-scale Artificial Intelligence Open Network (LAION), l\u2019organisation allemande \u00e0 but non lucratif charg\u00e9e de la maintenance de certaines des bases de donn\u00e9es d\u2019entra\u00eenement \u00e0 l\u2019IA les plus populaires au monde. Ce mois-ci, LAION a annonc\u00e9 une nouvelle initiative, BUD-E, qui vise \u00e0 construire un assistant vocal enti\u00e8rement ouvert capable de fonctionner sur du mat\u00e9riel grand public.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Une_architecture_extensible\"><\/span>Une architecture extensible<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Pourquoi lancer un tout nouveau projet d\u2019assistant vocal alors qu\u2019il en existe d\u00e9j\u00e0 de nombreux autres \u00e0 diff\u00e9rents stades d\u2019abandon ? Wieland Brendel, membre de l\u2019Institut Ellis et contributeur de BUD-E, estime qu\u2019il n\u2019existe pas d\u2019assistant ouvert dot\u00e9 d\u2019une architecture suffisamment extensible pour tirer pleinement parti des technologies \u00e9mergentes de l\u2019IA g\u00e9n\u00e9rative, en particulier des mod\u00e8les de langage volumineux (LLM) tels que ChatGPT d\u2019OpenAI.<\/p>\n<p>Brendel a ajout\u00e9 que LAION souhaite \u00e9galement garantir que chaque composant de BUD-E puisse \u00e9ventuellement \u00eatre int\u00e9gr\u00e9 \u00e0 des applications et services sans licence, m\u00eame \u00e0 des fins commerciales \u2013 ce qui n\u2019est pas n\u00e9cessairement le cas pour d\u2019autres initiatives d\u2019assistants ouverts.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Collaboration_et_roadmap_ambitieuse\"><\/span>Collaboration et roadmap ambitieuse<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>En collaboration avec l\u2019Institut Ellis \u00e0 T\u00fcbingen, le cabinet de conseil technologique Collabora et le T\u00fcbingen AI Center, BUD-E (abr\u00e9g\u00e9 de Buddy for Understanding and Digital Empathy) a une feuille de route ambitieuse. Dans un article de blog, l\u2019\u00e9quipe de LAION expose ce qu\u2019elle esp\u00e8re r\u00e9aliser dans les prochains mois, notamment l\u2019int\u00e9gration d\u2019une \u00ab\u00a0intelligence \u00e9motionnelle\u00a0\u00bb dans BUD-E et la capacit\u00e9 \u00e0 g\u00e9rer des conversations impliquant plusieurs interlocuteurs simultan\u00e9ment.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Un_modele_preliminaire_disponible\"><\/span>Un mod\u00e8le pr\u00e9liminaire disponible<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>BUD-E est d\u00e9j\u00e0 op\u00e9rationnel \u2013 vous pouvez le t\u00e9l\u00e9charger et l\u2019installer d\u00e8s aujourd\u2019hui depuis GitHub sur Ubuntu ou Windows PC (macOS est \u00e0 venir) \u2013 mais il est clairement encore \u00e0 un stade pr\u00e9liminaire. LAION a assembl\u00e9 plusieurs mod\u00e8les ouverts pour cr\u00e9er un mod\u00e8le MVP, dont le mod\u00e8le Phi-2 LLM de Microsoft, le syst\u00e8me de synth\u00e8se vocale StyleTTS2 de Columbia et le syst\u00e8me de reconnaissance vocale FastConformer de Nvidia. Par cons\u00e9quent, l\u2019exp\u00e9rience n\u2019est pas encore optimis\u00e9e. Pour que BUD-E puisse r\u00e9pondre aux commandes en environ 500 millisecondes \u2013 dans la plage des assistants vocaux commerciaux tels que Google Assistant et Alexa \u2013 il faut une carte graphique puissante comme la Nvidia RTX 4090.<\/p>\n<p>Collabora travaille b\u00e9n\u00e9volement pour adapter ses mod\u00e8les de reconnaissance vocale et de synth\u00e8se vocale open source, WhisperLive et WhisperSpeech, pour BUD-E.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Objectifs_futurs\"><\/span>Objectifs futurs<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Dans un avenir proche, LAION pr\u00e9voit de rendre les exigences mat\u00e9rielles de BUD-E moins contraignantes et de r\u00e9duire la latence de l\u2019assistant. Un objectif \u00e0 plus long terme est de constituer un ensemble de donn\u00e9es de dialogues pour affiner BUD-E, ainsi que de d\u00e9velopper un m\u00e9canisme de m\u00e9moire permettant \u00e0 BUD-E de stocker des informations provenant de conversations pr\u00e9c\u00e9dentes et un pipeline de traitement vocal capable de suivre plusieurs personnes parlant en m\u00eame temps.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Accessibilite_et_idees_innovantes\"><\/span>Accessibilit\u00e9 et id\u00e9es innovantes<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>J\u2019ai demand\u00e9 \u00e0 l\u2019\u00e9quipe si l\u2019accessibilit\u00e9 \u00e9tait une priorit\u00e9, \u00e9tant donn\u00e9 que les syst\u00e8mes de reconnaissance vocale n\u2019ont historiquement pas bien fonctionn\u00e9 avec les langues autres que l\u2019anglais et les accents autres que transatlantiques. Une \u00e9tude de Stanford a r\u00e9v\u00e9l\u00e9 que les syst\u00e8mes de reconnaissance vocale d\u2019Amazon, IBM, Google, Microsoft et Apple avaient presque deux fois plus de chances de mal comprendre les locuteurs noirs par rapport aux locuteurs blancs du m\u00eame \u00e2ge et du m\u00eame sexe.<\/p>\n<p>Brendel a d\u00e9clar\u00e9 que LAION ne n\u00e9gligeait pas l\u2019accessibilit\u00e9, mais que ce n\u2019\u00e9tait pas une priorit\u00e9 imm\u00e9diate pour BUD-E.<\/p>\n<p>Pour conclure, LAION a des id\u00e9es assez innovantes pour BUD-E, allant d\u2019un avatar anim\u00e9 \u00e0 la personnification de l\u2019assistant, en passant par la prise en charge de l\u2019analyse des visages des utilisateurs via des webcams pour prendre en compte leur \u00e9tat \u00e9motionnel. L\u2019\u00e9thique de cette derni\u00e8re fonctionnalit\u00e9 \u2013 l\u2019analyse faciale \u2013 est discutable, il est donc essentiel que LAION reste attach\u00e9 \u00e0 la s\u00e9curit\u00e9.<\/p>\n<p>LAION a r\u00e9alis\u00e9 des travaux pr\u00e9c\u00e9dents qui n\u2019\u00e9taient pas irr\u00e9prochables sur le plan \u00e9thique et poursuit actuellement un projet s\u00e9par\u00e9 assez controvers\u00e9 sur la d\u00e9tection des \u00e9motions. Mais peut-\u00eatre que BUD-E sera diff\u00e9rent ; il faudra attendre pour le savoir.<\/p>","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":10798,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"categories":[608],"tags":[],"class_list":["post-10796","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualite-intelligence-artificielle","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50"],"_links":{"self":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/10796","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/comments?post=10796"}],"version-history":[{"count":1,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/10796\/revisions"}],"predecessor-version":[{"id":10797,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/10796\/revisions\/10797"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media\/10798"}],"wp:attachment":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media?parent=10796"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/categories?post=10796"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/tags?post=10796"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}