Une startup néerlandaise soutenue par Google veut aider les entreprises à extraire des données à partir de documents complexes
Send AI, une start-up néerlandaise en pleine expansion, souhaite aider les entreprises à extraire des données à partir de volumes importants de documents complexes, où la précision et la sécurité sont primordiales – et elle vient de bénéficier du soutien de Google’s Gradient Ventures pour le faire.
Send AI s’attaque à des acteurs établis dans le domaine du traitement de documents, tels que UiPath, Abbyy, Rossum et Kofax, avec une plateforme personnalisable qui permet aux entreprises d’ajuster les modèles d’IA pour répondre à leurs besoins individuels en matière d’extraction de données.
Par exemple, une entreprise opérant dans une industrie fortement réglementée comme l’assurance devra probablement traiter une multitude de formats, des PDF et des fichiers papier aux photos prises avec des smartphones dans toutes sortes d’orientations et avec du « bruit » en arrière-plan. Ces types de données « non structurées » non standard peuvent être suffisamment complexes pour les humains, mais une approche entièrement automatisée peut entraîner des rejets erronés de demandes de remboursement ou des complications administratives ultérieures.
En effet, les logiciels de traitement de documents standard sont souvent conçus pour des types de documents plus courants qui se chevauchent avec plusieurs industries, ce qui les rend inadaptés à certains cas d’utilisation. Avec Send AI, en revanche, les entreprises peuvent former un modèle de vision par ordinateur pour reconnaître des documents spécifiques, et un modèle linguistique distinct pour extraire et valider les données pertinentes – avec la possibilité d’impliquer des humains pour contrôler et revoir chaque étape via une interface web.
« Cette validation peut consister simplement à vérifier si un nombre attendu est réellement un nombre, ou à effectuer une recherche plus complexe d’un numéro d’enregistrement dans une base de données pour voir s’il correspond », a déclaré Thom Trentelman, fondateur et PDG de Send AI, à Toukiela. « Toute incertitude sera signalée pour examen par un humain. »
Comment Send AI aide les entreprises à extraire des données à partir de documents
Les entreprises peuvent accéder au logiciel basé sur le cloud de Send AI via des API qui acheminent les données à partir de documents envoyés par e-mail. À réception, Send AI améliore visuellement les documents avant de les envoyer à ses modèles linguistiques pour classification et extraction.
En ce qui concerne le marché cible, Trentelman affirme que l’entreprise cible principalement les grandes entreprises, car elles « rencontrent le plus de difficultés avec les documents », mais en réalité toute entreprise qui traite de gros volumes de documents pourrait trouver une utilité à cette technologie.
Il va sans dire que, outre les nombreux outils de traitement de documents déjà disponibles sur le marché, Send AI se trouve confrontée à une nouvelle génération de start-ups proposant des services basés sur de puissants nouveaux modèles linguistiques, tels qu’OpenAI avec GPT-X (qui alimente ChatGPT). Cependant, si Trentelman concède que ces produits fonctionnent bien dans des situations nécessitant un score « subjectivement bon », comme la synthèse ou la réponse à des questions, lorsque des volumes importants de documents nécessitent une grande précision, c’est une autre histoire.
« Vous atteindrez rapidement des limites avec ces technologies – les grands modèles linguistiques génériques sont encore imprévisibles, lents et coûteux », a déclaré Trentelman. « Chez Send AI, nous laissons le client construire sa propre solution. »
Sous le capot, Send AI repose sur des modèles plus petits et open source que le client entraîne d’abord en traitant manuellement un petit ensemble de documents, après quoi il répète le processus avec de nouveaux documents tout en ayant des humains à disposition pour apporter des corrections.
En termes de tarification, Send AI propose un plan de base basé sur des crédits, où les clients paient par étape de traitement. « De cette façon, nous pouvons faire la différence entre le traitement d’un PDF de 50 pages ou d’un simple extrait de texte », a déclaré Trentelman. « Nos modèles sont bon marché, rapides et fiables, nous pouvons donc les déployer pour chaque client. De cette manière, les clients ont le contrôle de leurs données et de leurs performances, c’est pourquoi nous réussissons dans des secteurs réglementés tels que l’assurance santé et le gouvernement. »
Les clients contrôlent leurs données
Send AI affirme que sa technologie sera attrayante pour les industries fortement réglementées en raison du contrôle qu’elle donne aux clients sur leurs données, ce qui peut sembler contre-intuitif étant donné qu’elle est basée sur le cloud. Cependant, Trentelman souligne le fonctionnement d’un LLM typique d’OpenAI, par rapport à la façon dont il pourrait combiner les données de formation provenant de différents clients en un seul modèle, ce qui expose au risque de fuite de données sensibles. C’est précisément pourquoi nous avons vu émerger de nombreuses start-ups promettant de protéger les données privées au sein des logiciels alimentés par LLM.
Send AI tente de répondre à ces préoccupations en déployant de petits modèles de transformation open source isolés pour chaque client.
« Nous en utilisons une variété pour faire le travail – au départ, ils ne sont pas très impressionnants, mais une fois entraînés sur des données de haute qualité, ils deviennent puissants et précis », a déclaré Trentelman.
Ainsi, bien que les modèles et les données d’entraînement associées résident toujours sur le cloud de Send AI, l’utilisation de modèles isolés signifie qu’il peut localiser précisément où les données résident et les supprimer sur demande. Cela, selon Trentelman, fait de Send AI un « candidat privilégié » par rapport aux autres fournisseurs, et cela contribue à convaincre les entreprises axées sur la protection des données que les déploiements sur site ne sont pas leur seule option.
« De nos jours, de plus en plus d’entreprises réglementées autorisent les fournisseurs à utiliser le cloud public, à condition qu’ils respectent une longue liste de réglementations », a déclaré Trentelman. « Initialement, nous avons toujours reçu la question de savoir si nous pouvions déployer sur site, mais finalement, toutes les entreprises, sauf une, ont choisi notre offre sur le cloud public. »
Pour l’instant, Send AI fonctionne en mode bêta privée, bien qu’elle compte déjà d’impressionnants clients, dont le géant de l’assurance Axa. Avec une équipe de sept personnes aujourd’hui, l’entreprise prévoit d’utiliser cet apport de capital frais pour doubler ses effectifs tout au long de l’année avant un lancement commercial complet.