Une levée de fonds de 28 millions de dollars pour Qdrant, la société à l’origine de la base de données vectorielle open source éponyme
Qdrant, la société basée à Berlin fondée en 2021, cherche à tirer profit de la révolution de l’IA en ciblant les développeurs avec un moteur de recherche vectorielle open source et une base de données – une partie intégrante de l’IA générative, qui nécessite l’établissement de relations entre des données non structurées (par exemple, du texte, des images ou du son non étiquetés ou autrement organisés), même lorsque ces données sont « dynamiques » dans des applications en temps réel. Selon les données de Gartner, les données non structurées représentent environ 90% de toutes les nouvelles données d’entreprise et croissent trois fois plus rapidement que leurs homologues structurées.
Un domaine en plein essor
Le domaine des bases de données vectorielles est en plein essor. Ces derniers mois, nous avons vu des entreprises telles que Weaviate lever 50 millions de dollars pour sa base de données vectorielle open source, tandis que Zilliz a obtenu 60 millions de dollars pour commercialiser la base de données vectorielle open source Milvus. Par ailleurs, Chroma a obtenu 18 millions de dollars de financement de démarrage pour une proposition similaire, tandis que Pinecone a obtenu 100 millions de dollars pour une alternative propriétaire.
Quant à Qdrant, elle a déjà levé 7,5 millions de dollars en avril dernier, ce qui témoigne de l’appétit apparemment insatiable des investisseurs pour les bases de données vectorielles, tout en annonçant une expansion prévue de Qdrant.
« Le plan était de procéder à la prochaine levée de fonds au deuxième trimestre de cette année, mais nous avons reçu une offre quelques mois plus tôt et avons décidé de gagner du temps et de commencer à développer l’entreprise maintenant », a expliqué Andre Zayarni, PDG et co-fondateur de Qdrant, à Toukiela. « La levée de fonds et le recrutement des bonnes personnes prennent toujours du temps. »
Il convient de noter que Zayarni a déclaré que la société avait en fait refusé une offre d’acquisition potentielle d’un « acteur majeur du marché des bases de données » en même temps qu’elle recevait une offre de suivi pour un investissement. « Nous avons opté pour l’investissement », a-t-il déclaré, ajoutant qu’ils utiliseraient l’injection de liquidités pour constituer leur équipe commerciale, étant donné que l’entreprise est actuellement principalement constituée d’ingénieurs.
Logique binaire
Au cours des neuf derniers mois depuis sa dernière levée de fonds, Qdrant a lancé une nouvelle technologie de compression super efficace appelée quantification binaire (BQ), axée sur l’indexation à faible latence et à haut débit, qui, selon elle, peut réduire la consommation de mémoire jusqu’à 32 fois et améliorer les vitesses de récupération d’environ 40 fois.
« La quantification binaire est un moyen de « compresser » les vecteurs pour obtenir une représentation aussi simple que possible avec uniquement des zéros et des uns », explique Zayarni. « La comparaison des vecteurs devient l’instruction CPU la plus simple, ce qui permet d’accélérer considérablement les requêtes et de réaliser des économies importantes en termes d’utilisation de la mémoire. Le concept théorique n’est pas nouveau, mais nous l’avons implémenté de manière à ce qu’il y ait très peu de perte de précision. »
Cependant, la quantification binaire ne convient pas à tous les modèles d’IA, et c’est entièrement à l’utilisateur de décider quelle option de compression conviendra le mieux à ses cas d’utilisation – mais Zayarni affirme que les meilleurs résultats ont été obtenus avec les modèles d’OpenAI, tandis que Cohere et Gemini de Google ont également bien fonctionné. La société compare actuellement ses modèles à ceux de Mistral et Stability AI.
Ce sont de tels efforts qui ont permis d’attirer des adoptants de haut niveau, notamment Deloitte, Accenture et – le plus prestigieux de tous – X (anciennement Twitter). Ou plus précisément, xAI d’Elon Musk, une entreprise qui développe Grok, un concurrent de ChatGPT, et qui a fait ses débuts sur la plateforme X le mois dernier.
Bien que Zayarni n’ait pas divulgué les détails de la façon dont X ou xAI utilise Qdrant en raison d’un accord de non-divulgation (NDA), on peut raisonnablement supposer qu’il utilise Qdrant pour traiter des données en temps réel. En effet, Grok utilise un modèle d’IA générative appelé Grok-1, formé à partir de données du web et de retours d’humains, et compte tenu de son alignement (maintenant étroit) avec X, il peut incorporer des données en temps réel provenant de publications sur les réseaux sociaux dans ses réponses – c’est ce qui est aujourd’hui connu sous le nom de génération augmentée par récupération (RAG), et Elon Musk a évoqué publiquement de tels cas d’utilisation au cours des derniers mois.
Qdrant ne révèle pas quels clients utilisent la version open source de Qdrant et lesquels utilisent ses services gérés, mais elle a mentionné un certain nombre de startups, telles que GitBook, VoiceFlow et Dust, qui utilisent « principalement » son service cloud géré – cela permet aux entreprises aux ressources limitées de ne pas avoir à gérer et déployer elles-mêmes l’ensemble du système, comme elles le feraient avec la version open source de base.
Cependant, Zayarni affirme que les références open source de l’entreprise sont l’un des principaux arguments de vente, même si une entreprise décide de payer pour des services supplémentaires.
« Lors de l’utilisation d’une solution propriétaire ou exclusivement basée sur le cloud, il y a toujours un risque de verrouillage du fournisseur », explique Zayarni. « Si le fournisseur décide d’ajuster les prix ou de modifier d’autres termes, les clients doivent accepter ou envisager une migration vers une alternative, ce qui n’est pas facile s’il s’agit d’un cas d’utilisation en production intensive. Avec l’open source, il y a toujours plus de contrôle sur vos données et il est possible de passer d’une option de déploiement à une autre. »
En plus du financement d’aujourd’hui, Qdrant lance également officiellement son édition gérée « sur site », offrant aux entreprises la possibilité d’héberger l’ensemble du système en interne tout en profitant des fonctionnalités premium et du support fournis par Qdrant. Cela fait suite à l’annonce de la semaine dernière selon laquelle l’édition cloud de Qdrant était disponible sur Microsoft Azure, en plus du support déjà disponible pour AWS et Google Cloud Platform.
Outre l’investisseur principal Spark Capital, la série A de Qdrant a également bénéficié de la participation de Unusual Ventures et 42cap.