5. La préparation des données

la préparation des données.

Au cours de cette phase, un grand nombre de fichiers, textes, médias, extraits de systèmes et comptes rendus d’expérience deviennent pour la première fois un système de connaissances cohérent, structuré et techniquement solide.

C’est là qu’intervient Vimmera Cortex. Notre base de connaissances dotée d’une structure de données très particulière.

Les informations collectées se présentent d’abord sous des formes de qualité très différentes. Souvent, il existe plusieurs versions d’un même contenu, des déclarations contradictoires, des états obsolètes, des modes de travail informels, des termes incohérents ou des liens manquants entre des sujets connexes. Beaucoup de choses se sont développées au fil du temps, ne sont pas entretenues de manière cohérente ou sont conçues pour différents publics cibles et différentes situations.

Un élément particulièrement important de la préparation des données est l’uniformisation et la structuration du langage de votre entreprise. Les termes techniques, désignations internes, noms de produits, abréviations, noms de processus et formulations typiques sont préparés et reliés entre eux de manière à ce que l’IA comprenne et utilise correctement la « langue » de votre organisation, de vos collaborateurs et de vos clients. C’est la seule façon d’interpréter correctement les demandes, d’attribuer clairement les contenus et d’éviter les malentendus. Sans cette clarification linguistique, de nombreuses questions restent sans réponse ou reçoivent des réponses imprécises, erronées ou incomplètes.

Si une IA travaillait directement sur la matière brute non organisée (c’est-à-dire dans de simples fichiers et documents), elle pourrait certes retrouver des passages de texte et des contenus, mais elle ne pourrait pas décider de manière fiable quelles informations sont valides, à jour et techniquement correctes. Cela devient encore plus difficile pour les questions complexes, dans lesquelles plusieurs domaines de connaissances, règles, produits ou processus interagissent. Sans préparation, l’IA manque de la clarté nécessaire pour reconnaître les liens avec certitude, argumenter sans contradiction ou fournir des réponses complètes et solides.

La préparation des données est donc l’étape au cours de laquelle des informations désordonnées deviennent une base de connaissances exploitable. Une base de connaissances cohérente sur le plan métier, qui parle le langage de votre entreprise et qui crée la condition pour que l’IA ne se contente pas de trouver, mais comprenne, évalue et apporte une aide pertinente.

Du document au savoir

Un autre aspect souvent sous-estimé est la qualité des réponses ultérieures avec de grands volumes de données. Plus on ajoute d’informations dans une base de données (vectorielle) et plus l’IA doit prendre en compte de données simultanément, plus les résultats et les sorties deviennent imprécis. C’est un problème bien connu de nombreux systèmes :

À mesure que le volume de données augmente, la précision diminue, les réponses deviennent plus générales, moins exactes ou mélangent des contenus qui n’ont techniquement rien à voir entre eux.

La raison est simple : dans les systèmes classiques, des milliers de pages, PDF, procès-verbaux ou manuels sont placés côte à côte. Pour l’IA, ce sont des sources textuelles équivalentes. La pertinence, la validité, la responsabilité, le lien avec un produit ou le contexte métier n’y sont pas représentés de manière univoque.

La préparation des données pour Vimmera Cortex résout ce problème en profondeur, en traitant les informations non pas comme des documents, mais comme du savoir. Les contenus sont décomposés en leurs éléments métier : faits, règles, termes, questions, réponses, relations, dépendances, validités, variantes et liens. Le document individuel perd son rôle de conteneur de savoir ; il est « dissous ». Il ne reste que le savoir qu’il contient, sous une forme structurée et abstraite.

On peut le mieux imaginer ce processus et ce stockage comme la manière dont nous, les humains, classons nos souvenirs. Après tout, nous ne stockons pas non plus un PDF d’un mode d’emploi dans notre cerveau lorsque nous voulons nous souvenir du fonctionnement de notre téléviseur.

Le savoir précédemment collecté est attribué de manière univoque à des produits, services, processus, fonctions, catégories ou scénarios d’utilisation. Ainsi, le volume total de données ne joue plus aucun rôle. L’IA n’accède pas à une grande masse textuelle floue, mais exactement aux briques de savoir pertinentes pour la demande concernée.

Sur demande, les documents d’origine restent disponibles. Vous pouvez continuer à vérifier où quelque chose est indiqué, trouver des documents de manière ciblée ou rechercher des passages de texte.

L’essentiel est toutefois le suivant :

L’IA de Vimmera AI ne travaille pas avec des documents – elle travaille avec le savoir issu de Vimmera Cortex, donc avec votre savoir.

Connexion plutôt que classement

Dans la préparation des données, les contenus ne sont pas seulement nettoyés et uniformisés, mais surtout reliés entre eux. Différentes sources de savoir, telles que documents, processus, produits, règles, retours d’expérience et données système, sont mises en relation. Il en résulte un réseau de connaissances dans lequel l’IA ne connaît pas seulement des faits isolés, mais aussi leur signification, leur validité et leur contexte.

Il est notamment défini :

quels documents appartiennent à quels processus
quels produits, numéros d’article, variantes et règles vont ensemble
quelles fonctions sont prévues pour quoi et quand elles ne sont pas pertinentes
quelles exceptions, alternatives ou dépendances existent
quelles informations doivent être examinées ensemble dans quelles situations

Ce n’est qu’ainsi que l’IA peut ensuite non seulement trouver des informations, mais aussi les classer correctement, les combiner et les évaluer.

Logique métier plutôt que hasard

Dans la préparation des données pour Vimmera Cortex, il est également défini quelles connexions doivent être appliquées automatiquement dans quelles situations. Il en résulte une logique métier selon laquelle l’IA fonctionne.

Exemples :

Pour une demande de prix, le système reconnaît automatiquement le produit, le numéro d’article correspondant, les variantes associées, les groupes de remises valides et les conditions pertinentes.
Pour une demande concernant une fonction, il n’est pas seulement expliqué ce qu’elle fait, mais aussi si elle est pertinente dans cette situation précise, quelles restrictions s’appliquent ou quelles alternatives seraient plus appropriées.
Pour les demandes de service, l’appareil, le code d’erreur, les causes connues, les pièces de rechange adaptées et les étapes de résolution éprouvées sont automatiquement reliés entre eux.
Pour les questions de processus, les responsabilités, formulaires, directives et dépendances sont pris en compte simultanément.

De telles réponses ne sont possibles que si le savoir a été structuré, mis en réseau et modélisé sur le plan métier.

19. Documentation

Un système d’IA professionnel n’est bon que dans la mesure où il est traçable. C’est pourquoi, chez Vimmera AI, la documentation n’est pas un sous-produit, mais un élément central de chaque solution. Elle garantit que votre système d’IA fonctionne non seulement aujourd’hui, mais aussi demain, dans un an et dans un environnement organisationnel ou juridique […]