Sommaire
Une solution de génération d’IA de Databricks
Si vous vouliez augmenter la visibilité de votre grande entreprise technologique et que vous disposiez de 10 millions de dollars à dépenser, comment les dépenseriez-vous ? Dans une publicité du Super Bowl ? Un partenariat avec la F1 ?
Une autre option serait de dépenser cet argent pour former un modèle d’IA génératif. Bien que cela ne relève pas du marketing au sens traditionnel, les modèles génératifs attirent l’attention et sont de plus en plus utilisés pour promouvoir les produits et services des fournisseurs.
C’est exactement ce que propose Databricks avec son modèle d’IA génératif DBRX, annoncé aujourd’hui et similaire à la série GPT d’OpenAI et à Gemini de Google. Disponible sur GitHub et la plateforme de développement d’IA Hugging Face, les versions de base (DBRX Base) et adaptées (DBRX Instruct) de DBRX peuvent être exécutées et ajustées sur des données publiques, personnalisées ou propriétaires.
« DBRX a été formé pour être utile et fournir des informations sur une grande variété de sujets », explique Naveen Rao, vice-président de l’IA générative chez Databricks, dans une interview accordée à Toukiela. « DBRX a été optimisé et ajusté pour une utilisation en anglais, mais il est capable de converser et de traduire dans une grande variété de langues, comme le français, l’espagnol et l’allemand. »
Un modèle « open source » avec des restrictions
Databricks décrit DBRX comme un modèle « open source » similaire à des modèles comme Llama 2 de Meta et les modèles de la startup Mistral. Cependant, il existe un débat sur la question de savoir si ces modèles répondent vraiment à la définition de l’open source.
Databricks affirme avoir dépensé environ 10 millions de dollars et deux mois pour former DBRX, qui, selon eux (citant un communiqué de presse), « surpasse tous les modèles open source existants sur les benchmarks standard ».
Cependant, il est extrêmement difficile d’utiliser DBRX si vous n’êtes pas client de Databricks.
En effet, pour exécuter DBRX dans sa configuration standard, vous avez besoin d’un serveur ou d’un ordinateur avec au moins quatre GPU Nvidia H100 (ou toute autre configuration de GPU totalisant environ 320 Go de mémoire). Un seul H100 coûte des milliers de dollars, ce qui est bien au-delà des moyens de nombreux développeurs et entrepreneurs individuels.
Il est possible d’exécuter le modèle sur un cloud tiers, mais les exigences matérielles sont toujours assez élevées. Par exemple, il n’y a qu’un seul type d’instance sur Google Cloud qui intègre des puces H100. Les autres clouds peuvent coûter moins cher, mais en général, exécuter de grands modèles comme celui-ci n’est pas bon marché aujourd’hui.
De plus, il y a des conditions générales à respecter. Databricks affirme que les entreprises ayant plus de 700 millions d’utilisateurs actifs seront soumises à certaines restrictions comparables à celles de Meta pour Llama 2, et que tous les utilisateurs devront accepter des conditions garantissant une utilisation responsable de DBRX. (Databricks n’a pas spécifié ces conditions au moment de la publication.)
Une solution de gestion pour contourner les obstacles
Face à ces obstacles, Databricks présente son produit Mosaic AI Foundation Model comme la solution de gestion qui permet de contourner ces problèmes. En plus d’exécuter DBRX et d’autres modèles, Mosaic AI Foundation Model offre une pile de formation permettant d’ajuster DBRX sur des données personnalisées. Les clients peuvent héberger DBRX en privé en utilisant l’offre de mise en service de modèle de Databricks, ou travailler avec Databricks pour déployer DBRX sur le matériel de leur choix.
« Nous nous concentrons sur le fait de faire de la plateforme Databricks le meilleur choix pour la création de modèles personnalisés, afin d’attirer davantage d’utilisateurs sur notre plateforme. DBRX est une démonstration de notre plateforme de pré-formation et d’ajustement de pointe, que les clients peuvent utiliser pour créer leurs propres modèles à partir de zéro. C’est un moyen facile pour les clients de commencer avec les outils d’IA générative Mosaic AI de Databricks. Et DBRX est très performant dès le départ et peut être ajusté pour obtenir d’excellentes performances sur des tâches spécifiques à un meilleur coût que les grands modèles fermés », explique Rao.
DBRX vs. les autres modèles
Databricks affirme que DBRX fonctionne jusqu’à 2 fois plus rapidement que Llama 2, grâce à son architecture MoE (Mixture of Experts). Contrairement à la plupart des modèles MoE qui ont huit experts, DBRX en compte 16, ce qui, selon Databricks, améliore la qualité.
Cependant, malgré ces améliorations, DBRX ne rivalise pas avec le modèle d’IA génératif leader, GPT-4 d’OpenAI, dans la plupart des domaines en dehors des cas d’utilisation spécifiques. De plus, DBRX présente d’autres limitations, notamment le fait de ne pas être multimodal et de ne pas pouvoir traiter les images.
En ce qui concerne les données d’entraînement de DBRX, Rao révèle qu’aucune donnée client de Databricks n’a été utilisée. Databricks a utilisé un large ensemble de données provenant de différentes sources ouvertes.
Toutefois, il est important de noter que DBRX présente également des limites, comme tous les autres modèles d’IA générative. Par exemple, le modèle peut donner des réponses erronées ou « hallucinées » en fonction de ses associations de mots ou de phrases, ce qui peut entraîner des réponses inexactes.
En fin de compte, DBRX semble être une option difficile à vendre à quiconque n’est pas déjà client ou futur client de Databricks. Les concurrents de Databricks dans le domaine de l’IA générative, dont OpenAI, proposent des technologies tout aussi intéressantes à des prix très compétitifs. De plus, de nombreux modèles d’IA générative se rapprochent davantage de la définition couramment admise de l’open source que DBRX.
Malgré cela, Databricks promet de continuer à améliorer DBRX et de publier de nouvelles versions à mesure que l’équipe de recherche et développement de Mosaic Labs de l’entreprise explore de nouvelles voies en matière d’IA générative.
Il semble donc que DBRX ait encore un long chemin à parcourir avant de rivaliser avec ses concurrents.