{"id":11586,"date":"2024-03-16T19:40:48","date_gmt":"2024-03-16T17:40:48","guid":{"rendered":"https:\/\/toukiela.com\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/"},"modified":"2024-03-16T19:40:49","modified_gmt":"2024-03-16T17:40:49","slug":"decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime","status":"publish","type":"post","link":"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/","title":{"rendered":"D\u00e9couvrez comment Google DeepMind entra\u00eene une IA de jeu vid\u00e9o r\u00e9volutionnaire pour devenir votre partenaire de jeu ultime !"},"content":{"rendered":"<p><em><\/em><\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhaltsverzeichnis<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69f1d78eb62e4\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69f1d78eb62e4\"  aria-label=\"Toggle\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/#Des_modeles_dIA_qui_jouent_a_des_jeux_video_comme_des_humains\" >Des mod\u00e8les d\u2019IA qui jouent \u00e0 des jeux vid\u00e9o comme des humains<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/#Un_modele_entraine_sur_des_heures_de_videos\" >Un mod\u00e8le entra\u00een\u00e9 sur des heures de vid\u00e9os<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/#Un_modele_capable_de_generaliser\" >Un mod\u00e8le capable de g\u00e9n\u00e9raliser<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/#Un_compagnon_de_jeu_plus_naturel\" >Un compagnon de jeu plus naturel<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/#Une_approche_differente_des_simulateurs\" >Une approche diff\u00e9rente des simulateurs<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/toukiela.com\/de\/decouvrez-comment-google-deepmind-entraine-une-ia-de-jeu-video-revolutionnaire-pour-devenir-votre-partenaire-de-jeu-ultime\/#De_nombreuses_possibilites_pour_lavenir\" >De nombreuses possibilit\u00e9s pour l\u2019avenir<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Des_modeles_dIA_qui_jouent_a_des_jeux_video_comme_des_humains\"><\/span>Des mod\u00e8les d\u2019IA qui jouent \u00e0 des jeux vid\u00e9o comme des humains<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Depuis des d\u00e9cennies, il existe des mod\u00e8les d\u2019IA qui jouent \u00e0 des jeux, mais ils se sp\u00e9cialisent g\u00e9n\u00e9ralement dans un seul jeu et jouent toujours pour gagner. Les chercheurs de Google DeepMind ont un objectif diff\u00e9rent avec leur derni\u00e8re cr\u00e9ation : un mod\u00e8le qui a appris \u00e0 jouer \u00e0 plusieurs jeux 3D comme un humain, mais qui fait \u00e9galement de son mieux pour comprendre et agir selon vos instructions verbales.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Un_modele_entraine_sur_des_heures_de_videos\"><\/span>Un mod\u00e8le entra\u00een\u00e9 sur des heures de vid\u00e9os<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Il existe bien s\u00fbr des personnages informatiques ou des IA qui peuvent faire ce genre de choses, mais ils ressemblent davantage \u00e0 des fonctionnalit\u00e9s d\u2019un jeu : des PNJ que vous pouvez contr\u00f4ler indirectement \u00e0 l\u2019aide de commandes formelles dans le jeu.<\/p>\n<p><\/p>\n<p>L\u2019IA SIMA (scalable instructable multiworld agent) de DeepMind n\u2019a aucun acc\u00e8s au code interne ou aux r\u00e8gles du jeu ; au lieu de cela, elle a \u00e9t\u00e9 entra\u00een\u00e9e sur de nombreuses heures de vid\u00e9os montrant des parties jou\u00e9es par des humains. \u00c0 partir de ces donn\u00e9es \u2013 et des annotations fournies par les \u00e9tiqueteurs de donn\u00e9es \u2013 le mod\u00e8le apprend \u00e0 associer certaines repr\u00e9sentations visuelles d\u2019actions, d\u2019objets et d\u2019interactions. Ils ont \u00e9galement enregistr\u00e9 des vid\u00e9os de joueurs s\u2019instruisant mutuellement pour accomplir des t\u00e2ches dans le jeu.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Un_modele_capable_de_generaliser\"><\/span>Un mod\u00e8le capable de g\u00e9n\u00e9raliser<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Par exemple, il peut apprendre \u00e0 partir de la fa\u00e7on dont les pixels se d\u00e9placent selon un certain sch\u00e9ma \u00e0 l\u2019\u00e9cran que cela correspond \u00e0 une action appel\u00e9e \u00ab\u00a0avancer\u00a0\u00bb, ou lorsque le personnage s\u2019approche d\u2019un objet ressemblant \u00e0 une porte et utilise l\u2019objet ressemblant \u00e0 une poign\u00e9e de porte, cela signifie \u00ab\u00a0ouvrir\u00a0\u00bb une \u00ab\u00a0porte\u00a0\u00bb. Des choses simples comme \u00e7a, des t\u00e2ches ou des \u00e9v\u00e9nements qui prennent quelques secondes mais qui vont au-del\u00e0 de simplement appuyer sur une touche ou identifier quelque chose.<\/p>\n<p><\/p>\n<p>Les vid\u00e9os d\u2019entra\u00eenement ont \u00e9t\u00e9 r\u00e9alis\u00e9es dans plusieurs jeux, de Valheim \u00e0 Goat Simulator 3, dont les d\u00e9veloppeurs ont \u00e9t\u00e9 impliqu\u00e9s et ont donn\u00e9 leur consentement \u00e0 cette utilisation de leur logiciel. L\u2019un des principaux objectifs des chercheurs, ont-ils d\u00e9clar\u00e9 lors d\u2019un appel avec la presse, \u00e9tait de voir si l\u2019entra\u00eenement d\u2019une IA \u00e0 jouer \u00e0 un ensemble de jeux la rend capable de jouer \u00e0 d\u2019autres jeux qu\u2019elle n\u2019a pas vus, un processus appel\u00e9 g\u00e9n\u00e9ralisation.<\/p>\n<p><\/p>\n<p>La r\u00e9ponse est oui, avec quelques r\u00e9serves. Les agents d\u2019IA entra\u00een\u00e9s sur plusieurs jeux ont mieux perform\u00e9 sur des jeux auxquels ils n\u2019avaient pas \u00e9t\u00e9 expos\u00e9s. Mais bien s\u00fbr, de nombreux jeux impliquent des m\u00e9caniques ou des termes sp\u00e9cifiques et uniques qui emp\u00eacheront m\u00eame l\u2019IA la mieux pr\u00e9par\u00e9e de r\u00e9ussir. Mais rien n\u2019emp\u00eache le mod\u00e8le d\u2019apprendre ces \u00e9l\u00e9ments \u00e0 part un manque de donn\u00e9es d\u2019entra\u00eenement.<\/p>\n<p><\/p>\n<p>Cela s\u2019explique en partie par le fait que, bien qu\u2019il existe de nombreux termes propres aux jeux, les joueurs ont en r\u00e9alit\u00e9 un nombre limit\u00e9 de \u00ab\u00a0verbes\u00a0\u00bb qui affectent r\u00e9ellement le monde du jeu. Que vous construisiez une cabane, que vous montiez une tente ou que vous invoquiez un abri magique, vous \u00eates en r\u00e9alit\u00e9 en train de \u00ab\u00a0construire une maison\u00a0\u00bb, n\u2019est-ce pas ? Cette carte des plusieurs douzaines de primitives que l\u2019agent reconna\u00eet actuellement est vraiment int\u00e9ressante \u00e0 parcourir :<\/p>\n<p><\/p>\n<div id='\\\"attachment_2678439\\\"' style='\\\"width:' class='\\\"wp-caption' aligncenter>\n<p id='\\\"caption-attachment-2678439\\\"' class='\\\"wp-caption-text\\\"'>Une carte des plusieurs douzaines d\u2019actions que SIMA reconna\u00eet et peut effectuer ou combiner. <strong>Bildnachweise :<\/strong> Google DeepMind<\/p>\n<\/div>\n<h2><span class=\"ez-toc-section\" id=\"Un_compagnon_de_jeu_plus_naturel\"><\/span>Un compagnon de jeu plus naturel<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>L\u2019ambition des chercheurs, en plus de faire avancer l\u2019IA bas\u00e9e sur les agents de mani\u00e8re fondamentale, est de cr\u00e9er un compagnon de jeu plus naturel que les mod\u00e8les rigides et cod\u00e9s en dur que nous avons aujourd\u2019hui.<\/p>\n<p><\/p>\n<p>\u00ab\u00a0Plut\u00f4t que d\u2019avoir un agent surhumain contre lequel vous jouez, vous pouvez avoir des joueurs SIMA \u00e0 vos c\u00f4t\u00e9s qui sont coop\u00e9ratifs, \u00e0 qui vous pouvez donner des instructions\u00a0\u00bb, a d\u00e9clar\u00e9 Tim Harley, l\u2019un des responsables du projet.<\/p>\n<p><\/p>\n<p>Comme ils ne voient que les pixels de l\u2019\u00e9cran du jeu lorsqu\u2019ils jouent, ils doivent apprendre \u00e0 faire des choses de la m\u00eame mani\u00e8re que nous le faisons \u2013 mais cela signifie aussi qu\u2019ils peuvent s\u2019adapter et produire des comportements \u00e9mergents.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Une_approche_differente_des_simulateurs\"><\/span>Une approche diff\u00e9rente des simulateurs<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>Vous vous demandez peut-\u00eatre comment cela se compare \u00e0 une m\u00e9thode courante de cr\u00e9ation d\u2019IA de type agent, l\u2019approche des simulateurs, dans laquelle un mod\u00e8le principalement non supervis\u00e9 exp\u00e9rimente de mani\u00e8re intensive dans un monde simul\u00e9 en 3D fonctionnant beaucoup plus rapidement que le temps r\u00e9el, ce qui lui permet d\u2019apprendre intuitivement les r\u00e8gles et de concevoir des comportements autour d\u2019elles sans avoir besoin de beaucoup d\u2019annotations.<\/p>\n<p><\/p>\n<p>\u00ab\u00a0L\u2019apprentissage bas\u00e9 sur les simulateurs traditionnels utilise l\u2019apprentissage par renforcement, qui n\u00e9cessite que le jeu ou l\u2019environnement fournisse un signal de \u2018r\u00e9compense\u2019 pour que l\u2019agent puisse apprendre \u2013 par exemple, une victoire\/d\u00e9faite dans le cas de Go ou de Starcraft, ou un \u2018score\u2019 pour les jeux Atari\u00a0\u00bb, a d\u00e9clar\u00e9 Harley \u00e0 nous, notant que cette approche a \u00e9t\u00e9 utilis\u00e9e pour ces jeux et a donn\u00e9 des r\u00e9sultats ph\u00e9nom\u00e9naux.<\/p>\n<p>\u00ab\u00a0Dans les jeux que nous utilisons, tels que les jeux commerciaux de nos partenaires\u00a0\u00bb, a-t-il poursuivi, \u00ab\u00a0nous n\u2019avons pas acc\u00e8s \u00e0 un tel signal de r\u00e9compense. De plus, nous nous int\u00e9ressons aux agents capables d\u2019accomplir une grande vari\u00e9t\u00e9 de t\u00e2ches d\u00e9crites dans un texte ouvert \u2013 il n\u2019est pas possible pour chaque jeu d\u2019\u00e9valuer un signal de \u2018r\u00e9compense\u2019 pour chaque objectif possible. Au lieu de cela, nous entra\u00eenons les agents en utilisant l\u2019apprentissage par imitation du comportement humain, en leur donnant des objectifs sous forme de texte.\u00a0\u00bb<\/p>\n<p><\/p>\n<p>En d\u2019autres termes, une structure de r\u00e9compense stricte peut limiter l\u2019agent dans ses poursuites, car s\u2019il est guid\u00e9 par un score, il n\u2019essaiera jamais rien qui ne maximise pas cette valeur. Mais s\u2019il accorde de la valeur \u00e0 quelque chose de plus abstrait, comme la proximit\u00e9 de son action \u00e0 une action qu\u2019il a observ\u00e9e fonctionner auparavant, il peut \u00eatre entra\u00een\u00e9 \u00e0 \u00ab\u00a0vouloir\u00a0\u00bb faire presque n\u2019importe quoi tant que les donn\u00e9es d\u2019entra\u00eenement le repr\u00e9sentent d\u2019une mani\u00e8re ou d\u2019une autre.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"De_nombreuses_possibilites_pour_lavenir\"><\/span>De nombreuses possibilit\u00e9s pour l\u2019avenir<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><\/p>\n<p>D\u2019autres entreprises explorent \u00e9galement ce type de collaboration et de cr\u00e9ation ouverte ; les conversations avec les PNJ sont \u00e9tudi\u00e9es de pr\u00e8s comme des opportunit\u00e9s pour mettre en \u0153uvre un chatbot de type LLM, par exemple. Et des actions ou interactions improvis\u00e9es simples sont \u00e9galement simul\u00e9es et suivies par l\u2019IA dans des recherches vraiment int\u00e9ressantes sur les agents.<\/p>\n<p>Bien s\u00fbr, il y a aussi les exp\u00e9riences sur les jeux infinis comme MarioGPT, mais c\u2019est une autre affaire.<\/p>","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":11588,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"categories":[608],"tags":[],"class_list":["post-11586","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualite-intelligence-artificielle","generate-columns","tablet-grid-50","mobile-grid-100","grid-parent","grid-50"],"_links":{"self":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/11586","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/comments?post=11586"}],"version-history":[{"count":1,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/11586\/revisions"}],"predecessor-version":[{"id":11587,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/posts\/11586\/revisions\/11587"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media\/11588"}],"wp:attachment":[{"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/media?parent=11586"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/categories?post=11586"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/toukiela.com\/de\/wp-json\/wp\/v2\/tags?post=11586"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}