Glossaire

Petits modules entraînables insérés dans des modèles pré-entraînés gelés, permettant un fine-tuning efficace spécifique aux tâches.

Ajustement de la pertinence

Lâ€™ajustement de la pertinence est lâ€™amÃ©lioration systÃ©matique du classement en ajustant signaux, poids et rÃ¨gles Ã partir de mesures et dâ€™Ã©valuations.

Alignement

Le processus d'entraînement des systèmes IA pour qu'ils se comportent conformément aux valeurs, intentions et préférences humaines—assurant que les modèles sont utiles, inoffensifs et honnêtes.

Analyse d’erreurs

Examiner en détail où et pourquoi un modèle échoue afin d’améliorer les itérations futures.

Analyse de couverture de retrieval

L’analyse de couverture de retrieval vérifie si l’index et le pipeline peuvent retrouver les sources nécessaires pour un périmètre défini de questions et sujets.

Analytique de recherche

Lâ€™analytique de recherche mesure lâ€™usage et la performance de la recherche (requÃªtes, clics, zÃ©ro rÃ©sultat, satisfaction) pour lâ€™amÃ©liorer.

Ancrage des réponses

Faire en sorte que chaque élément clé d'une réponse soit traçable vers des sources précises.

Apprentissage Automatique

Un domaine de l'IA où les systèmes apprennent des patterns à partir de données pour faire des prédictions sans programmation explicite.

Apprentissage Non Supervisé

Une approche de machine learning où les modèles découvrent des patterns et structures dans les données sans exemples étiquetés.

Apprentissage par Renforcement

Une approche de machine learning où les agents apprennent un comportement optimal par essais-erreurs avec un environnement.

Apprentissage Profond

Un sous-ensemble du machine learning utilisant des réseaux neuronaux avec de nombreuses couches pour apprendre des représentations hiérarchiques.

Apprentissage Supervisé

Une approche de machine learning où les modèles apprennent de données d'entraînement étiquetées pour prédire des sorties.

Approximate Nearest Neighbor

Algorithmes qui trouvent rapidement des vecteurs approximativement similaires en échangeant une précision parfaite contre des améliorations massives de vitesse.

Architecture Transformer

Une architecture de réseau neuronal utilisant l'auto-attention pour traiter les données séquentielles en parallèle, à la base des LLM modernes.

Attention Multi-Têtes

Une technique exécutant plusieurs opérations d'attention en parallèle, permettant aux modèles de capturer différents types de relations simultanément.

Atténuation des biais

L’atténuation des biais regroupe les méthodes pour détecter et réduire des biais injustes dans les données, le comportement et les résultats d’un système d’IA.

Attribution

La capacité de l'IA à lier les déclarations générées à des preuves sources spécifiques, établissant quelles parties de la sortie sont soutenues par quels documents.

Auto-Attention

Un mécanisme où chaque élément d'une séquence calcule des poids d'attention avec tous les autres éléments de la même séquence.

B

Base de Données Vectorielle

Une base de données spécialisée optimisée pour stocker et rechercher des embeddings vectoriels de haute dimension avec des métriques de similarité.

Benchmarking

Le processus systématique d'évaluation des performances d'un modèle contre des datasets et métriques standardisés, permettant une comparaison équitable entre différents modèles, architectures et approches.

Bi-Encoder

Une architecture neuronale qui encode séparément requêtes et documents en vecteurs fixes, permettant une recherche de similarité efficace via embeddings pré-calculés et index de voisins approximatifs.

BM25

Best Matching 25 - l'algorithme probabiliste de classement de pointe pour la recherche textuelle basé sur les principes TF-IDF.

Byte Pair Encoding (BPE)

Algorithme de tokenisation en sous-mots qui construit un vocabulaire en fusionnant itérativement les paires de symboles fréquentes.

C

Cadre de gouvernance IA

Un cadre de gouvernance IA définit les rôles, politiques et contrôles pour gérer des systèmes d’IA sur tout leur cycle de vie.

Calibration

Aligner les scores de confiance du modèle avec la probabilité réelle de justesse.

Cartographie des dépendances juridiques

La cartographie des dépendances juridiques construit un graphe de citations et relations entre sources afin que retrieval et analyse suivent ce qui dépend de quoi.

Chain-of-Thought

Une technique de prompting qui suscite un raisonnement étape par étape des modèles de langage, améliorant les performances sur les tâches complexes en rendant le processus de raisonnement explicite et vérifiable.

Citation

La pratique de référencer explicitement les documents sources dans les réponses générées par l'IA, permettant la vérification des affirmations et construisant la confiance par la transparence.

ComprÃ©hension de requÃªte

La comprÃ©hension de requÃªte dÃ©crit comment un systÃ¨me interprÃ¨te le sens dâ€™une recherche (entitÃ©s, intention, ambiguÃ¯tÃ©) avant le retrieval et le classement.

Compression de Modèle

Techniques pour réduire la taille des modèles IA et les besoins computationnels tout en préservant les performances, pour un déploiement efficace.

Confidence scoring

L’attribution de scores indiquant à quel point les preuves ou la récupération soutiennent une réponse.

Consistance factuelle

Degré auquel une réponse générée reste alignée sur des sources fiables ou la vérité de référence.

Content indexing

La création et la maintenance d’index de recherche sur les documents, champs et embeddings.

Contrôle d’accès

Les mécanismes qui déterminent qui peut accéder à quelles données, systèmes ou actions.

Corpus

L’ensemble complet de documents dont dispose un système de recherche ou d’IA.

Couche de récupération

La partie d’un système RAG qui trouve et classe les documents ou passages pertinents avant la génération.

Couche générative

La partie d’un système RAG où le modèle de langage utilise le contexte récupéré pour produire une réponse.

Cross-Encoder

Une architecture neuronale qui encode conjointement les paires requête-document pour produire des scores de pertinence, offrant une précision supérieure aux bi-encodeurs mais à un coût computationnel plus élevé.

D

DÃ©couvrabilitÃ© du contenu

La dÃ©couvrabilitÃ© du contenu dÃ©crit la facilitÃ© avec laquelle un contenu peut Ãªtre trouvÃ©, accessible et indexÃ© par des systÃ¨mes de recherche (internes ou externes).

Data pipeline

La chaîne d’étapes qui convertit des données sources brutes en contenu indexable et exploitable.

Data preprocessing

Le prétraitement de données brutes pour supprimer le bruit et uniformiser les formats avant la recherche ou l’IA.

Data residency

L’endroit où les données sont physiquement stockées ou traitées, souvent encadré par la loi ou des politiques internes.

Décodage Glouton

Une stratégie simple de génération de texte qui sélectionne toujours le token de plus haute probabilité à chaque étape.

Découpage en fenêtre glissante

Une stratégie de découpage où des fenêtres qui se chevauchent parcourent un document pour préserver le contexte entre les chunks.

Deduplication

L’identification et la suppression de documents dupliqués ou quasi dupliqués dans un corpus.

Dérive de modèle

Dégradation des performances d’un modèle lorsque la distribution des données ou l’usage évolue.

Descente de Gradient

Un algorithme d'optimisation qui ajuste itérativement les paramètres du modèle en se déplaçant dans la direction qui réduit la fonction de perte.

Détection de dérive réglementaire

La détection de dérive réglementaire surveille les changements de lois et guidance qui peuvent rendre un système IA (retrieval, réponses, contrôles) obsolète.

Distance euclidienne

La distance en ligne droite entre deux points dans un espace vectoriel.

Distance metric

Une fonction mathématique qui quantifie la distance ou similarité entre deux embeddings.

Distillation des Connaissances

Entraîner un petit modèle élève à imiter un grand modèle enseignant, transférant les connaissances tout en réduisant drastiquement taille et coût.

Document chunk

Un petit segment de document indexé et consulté comme unité distincte.

Document ingestion

L’ingestion et le stockage de nouveaux documents dans une plateforme de recherche ou de connaissance.

Document normalization

L’uniformisation du texte et de la structure entre documents pour simplifier l’indexation et la recherche.

Document parsing

La conversion de fichiers bruts en texte structuré et métadonnées.

E

Embedding alignment

L’alignement d’embeddings provenant de modèles ou de langues différents pour les rendre comparables.

Embedding compression

Des techniques qui rendent les embeddings plus compacts en stockage ou bits par vecteur sans trop de perte de qualité.

Embedding drift

Un déplacement progressif de la signification ou de l’échelle des embeddings dû aux changements de modèle ou de données.

Embedding space

L’espace vectoriel dans lequel vivent les embeddings et où les distances approchent les relations sémantiques.

Embeddings

Représentations vectorielles denses de données (texte, images, etc.) capturant le sens sémantique dans un espace numérique continu.

Encodage positionnel

Technique des transformeurs pour injecter des informations de position de tokens dans des embeddings autrement insensibles à l'ordre.

Entity extraction

La détection automatique de noms, organisations, dates et autres entités dans un texte.

Estimation de l’incertitude

Quantifier à quel point un modèle est incertain de ses prédictions ou réponses.

EU AI Act

L'EU AI Act est le règlement européen basé sur le risque pour l'IA, imposant des obligations aux fournisseurs et déployeurs selon le niveau de risque.

Exigences de documentation IA

Les exigences de documentation IA sont les documents et enregistrements nécessaires pour justifier l'usage, la conception, les tests, les contrôles et les limites d'un système d'IA.

Expansion sÃ©mantique

Lâ€™expansion sÃ©mantique Ã©largit une requÃªte avec des termes ou sens proches (synonymes, entitÃ©s, embeddings) pour amÃ©liorer le rappel sans trahir lâ€™intention.

Explicabilité

La capacité de comprendre, interpréter et expliquer comment les modèles IA/ML font des prédictions—essentiel pour la confiance, le débogage, la conformité réglementaire et le déploiement responsable de l'IA.

F

Factualité

Le degré auquel le contenu généré par l'IA reflète avec précision la vérité vérifiable, distinguant les déclarations correctes des fabrications et hallucinations.

FAISS

Facebook AI Similarity Search - la bibliothèque open-source la plus complète pour la recherche de similarité efficace et le clustering de vecteurs denses.

Fenêtre de Contexte

La quantité maximale de texte (mesurée en tokens) qu'un modèle de langage peut traiter en une seule interaction.

Few-Shot Learning

Un paradigme d'apprentissage automatique où les modèles apprennent à effectuer des tâches à partir de quelques exemples seulement, permettant une adaptation rapide sans réentraînement extensif.

Fidélité (des explications)

Propriété selon laquelle une explication reflète réellement le raisonnement ou les preuves sous-jacents du modèle.

Fine-Tuning

Le processus d'entraînement supplémentaire d'un modèle pré-entraîné sur des données spécifiques pour améliorer les performances.

Fonction de Perte

Une fonction mathématique qui mesure à quel point les prédictions d'un modèle sont éloignées des sorties désirées pendant l'entraînement.

Framework d'évaluation

Dispositif réutilisable pour définir, exécuter et suivre des scénarios d'évaluation d'IA.

Function calling

Capacité d'un LLM à choisir et remplir des arguments structurés pour appeler des outils ou fonctions externes.

G

Génération de sorties structurées

La pratique qui consiste à contraindre les réponses des LLM à des formats bien définis comme JSON, XML ou des schémas.

Gestion des risques IA

La gestion des risques IA consiste à identifier, évaluer, réduire et surveiller les risques liés à un système d’IA sur tout son cycle de vie.

Gouvernance des données

Les rôles, processus et politiques qui garantissent une gestion responsable et conforme des données.

Graphe de Connaissances

Un réseau structuré d'entités et leurs relations permettant aux machines de comprendre et raisonner sur des concepts du monde réel.

Ground Truth

Les données de référence faisant autorité et vérifiées utilisées pour entraîner et évaluer les modèles de machine learning—les réponses 'correctes' contre lesquelles les prédictions du modèle sont mesurées.

Grounding

La technique d'ancrage des sorties de modèles IA à des sources vérifiables, faits ou documents récupérés pour réduire les hallucinations et augmenter la précision.

Guardrails

Mécanismes de sécurité et contraintes qui empêchent les systèmes IA de générer des sorties nuisibles, inappropriées ou hors sujet—offrant une protection runtime au-delà de l'alignement lors de l'entraînement.

H

Hallucination

Lorsqu'un modèle d'IA génère des informations fausses, fabriquées ou non étayées présentées comme des faits.

HNSW

Graphes Hierarchical Navigable Small World - l'algorithme état de l'art pour la recherche rapide de plus proches voisins approximatifs en espaces de haute dimension.

Hybrid indexing

La combinaison d’index vectoriels et lexicaux pour supporter à la fois la correspondance sémantique et par mots‑clés.

I

IA responsable

L’IA responsable est la conception, le déploiement et l’exploitation de systèmes d’IA de manière légale, éthique et sûre, avec une responsabilité claire.

In-Context Learning

La capacité des grands modèles de langage à apprendre de nouvelles tâches lors de l'inférence en se conditionnant sur des exemples ou instructions fournis dans le prompt, sans mises à jour de paramètres.

Index Inversé

Une structure de données associant les termes aux emplacements de documents, permettant une recherche plein texte rapide sur de grandes collections.

Index refresh

La mise à jour périodique d’un index vectoriel pour refléter de nouvelles données ou des changements de modèle.

Index sharding

La division d’un index volumineux en plusieurs shards répartis sur des machines ou partitions.

Indexation multi-juridictionnelle

L’indexation multi-juridictionnelle structure l’index sur plusieurs pays/régions afin que le retrieval respecte juridiction, langue et applicabilité.

Indexation vectorielle

La construction de structures de données permettant une recherche rapide de similarité sur des embeddings.

Inférence

Le processus d'utilisation d'un modèle entraîné pour générer des prédictions ou sorties sur de nouvelles données.

Information retrieval system

Un logiciel qui indexe des documents et traite des requêtes pour retrouver des informations pertinentes.

Injection de contexte

Le fait d’ajouter des informations récupérées ou auxiliaires dans un prompt LLM pour guider la génération.

Injection de Prompt

Une technique d'attaque où des instructions malveillantes sont insérées dans les entrées LLM pour contourner les prompts système, éviter les guardrails ou manipuler le comportement du modèle de manière inattendue.

Instruction Tuning

Une méthode de fine-tuning qui entraîne les modèles de langage à suivre des instructions en langage naturel sur diverses tâches.

Intention de requÃªte

Lâ€™intention de requÃªte est lâ€™objectif derriÃ¨re une recherche (ce que lâ€™utilisateur veut accomplir) et elle guide le classement des rÃ©sultats.

Interprétabilité du modèle

La mesure dans laquelle les humains peuvent comprendre comment un modèle produit ses prédictions.

Intervalle de confiance

Plage de valeurs dans laquelle une quantité est supposée se situer avec une probabilité donnée.

Iterative retrieval

Une stratégie de récupération qui affine de façon répétée les requêtes et le contexte à partir de résultats intermédiaires.

J

Jailbreaking

La pratique consistant à concevoir des prompts ou entrées pour contourner les garde-fous et politiques d'un système d'IA.

Jeu de données d'évaluation

Ensemble d'exemples avec réponses de référence pour mesurer les performances d'un modèle.

K

Knowledge base

Un ensemble structuré de documents et de faits consultés par les systèmes de recherche ou d’IA.

Knowledge retrieval strategy

Les choix de conception de haut niveau sur la façon dont un système récupère et structure la connaissance pour les LLM.

L

Latence de récupération

Le temps nécessaire à un système de récupération pour renvoyer des résultats à une requête.

Lexical search

Des techniques de recherche qui reposent surtout sur la correspondance exacte ou quasi exacte de mots‑clés.

LLM

IA & ML

Les grands modèles de langage sont des systèmes d'IA entraînés sur de vastes données textuelles pour comprendre et générer du texte semblable à celui des humains.

Log probabilities

Les logarithmes des probabilités de tokens produites par un modèle de langage, utilisés pour scorer et analyser les générations.

LoRA

Low-Rank Adaptation - une technique de fine-tuning efficiente qui entraîne de petites matrices d'adaptation au lieu de mettre à jour tous les poids.

M

Mécanisme d'Attention

Une technique de réseau neuronal permettant aux modèles de se concentrer sur les parties pertinentes de l'entrée lors de la production de la sortie.

Metadata enrichment

L’ajout ou la déduction de champs supplémentaires (entités, thèmes) au‑delà du document brut.

Metadata filtering

Limiter la récupération sur la base de champs comme la date, la source, la langue ou le niveau de confidentialité.

Métriques de fiabilité

Des métriques qui décrivent la stabilité, la prévisibilité et la sécurité d’un système d’IA dans le temps.

Milvus

Une base de données vectorielle open-source optimisée pour stocker, indexer et rechercher des vecteurs d'embedding à grande échelle—permettant la recherche par similarité pour les applications IA comme RAG, recherche sémantique et recommandations.

Modèle d’embedding

Un modèle de ML qui convertit du texte ou d’autres données en vector embeddings.

Modèle de classement par autorité

Un modèle de classement par autorité ordonne les sources par autorité juridique et fiabilité afin de faire remonter les sources contrôlantes en premier.

Multi-hop retrieval

Une récupération qui enchaîne plusieurs étapes de recherche pour répondre à des questions complexes en plusieurs étapes.

N

Nearest-neighbor search

Des algorithmes qui trouvent les vecteurs les plus proches d’un embedding de requête.

Negative retrieval

Un schéma de récupération qui recherche explicitement des preuves contradictoires, manquantes ou infirmantes.

O

OCR

Reconnaissance Optique de Caractères—technologie qui convertit les images de texte (documents numérisés, photos, PDF) en texte lisible par machine, permettant recherche, édition et traitement IA du contenu imprimé ou manuscrit.

Ontologie

Un modèle formel des concepts et de leurs relations dans un domaine.

P

Passage retrieval

La récupération de petits passages ou chunks de texte plutôt que de documents entiers pour des réponses plus précises.

Perplexité

Une métrique mesurant à quel point un modèle de langage prédit bien le texte, avec des valeurs plus basses indiquant une meilleure capacité de prédiction.

Pinecone

Un service de base de données vectorielle entièrement géré conçu spécifiquement pour les applications machine learning, offrant une recherche de similarité serverless à l'échelle.

Piste d’audit

Un enregistrement infalsifiable des actions, décisions et événements système dans le temps.

Politique de conservation des données

Les règles qui définissent combien de temps différents types de données sont conservés et quand ils doivent être supprimés.

Pondération de la fiabilité des sources

La pondération de fiabilité des sources donne plus d’influence aux sources de confiance pour privilégier les contenus officiels et de qualité.

Pré-entraînement

La phase initiale d'entraînement d'un grand modèle de langage sur des corpus de texte massifs pour apprendre les patterns linguistiques généraux et les connaissances avant le fine-tuning spécifique.

Précision de récupération

La fraction des documents récupérés qui sont réellement pertinents pour la requête.

Privacy by design

Une approche où la protection des données et la vie privée sont intégrées dès la conception des systèmes.

Prompt

Le texte d'entrée ou l'instruction donnée à un modèle de langage pour guider la génération de sa réponse.

Prompt système

Le bloc d'instructions caché ou fixe qui définit le comportement global et les contraintes d'un LLM dans une application donnée.

Provenance des sources

Informations sur l’origine des données ou contenus et la façon dont ils ont été produits.

Q

QLoRA

Quantized LoRA - combine la quantification 4-bit avec les adaptateurs LoRA, permettant le fine-tuning de modèles 65B+ sur un seul GPU de 48 Go.

Quantification

Réduction de la précision du modèle de 32/16-bit à 8/4-bit, diminuant drastiquement l'utilisation mémoire et accélérant l'inférence.

Query Expansion

Techniques qui reformulent ou augmentent automatiquement les requêtes de recherche pour améliorer le retrieval en ajoutant synonymes, termes associés ou reformulations.

R

Recall de récupération

La fraction de tous les documents réellement pertinents qu’un système de récupération renvoie.

Recherche boolÃ©enne

La recherche boolÃ©enne combine des termes avec des opÃ©rateurs comme AND, OR et NOT pour inclure ou exclure des rÃ©sultats avec prÃ©cision.

Recherche en Faisceau

Un algorithme de décodage qui explore plusieurs séquences candidates en parallèle, gardant les k chemins les plus prometteurs à chaque étape.

Recherche Hybride

Une approche de récupération combinant recherche par mots-clés et recherche vectorielle sémantique pour exploiter les forces des deux méthodes.

Recherche plein texte

La recherche plein texte rÃ©cupÃ¨re des documents en faisant correspondre des termes Ã du texte indexÃ© (souvent via un index inversÃ©) puis classe les meilleurs rÃ©sultats.

Recherche Sémantique

Technologie de recherche qui comprend le sens et l'intention plutôt que simplement les mots-clés, pour des résultats plus pertinents et intelligents.

Reclassement

Une technique de récupération en deuxième étape qui réordonne les résultats de recherche initiaux pour améliorer la pertinence.

Reconnaissance d'Entités Nommées

Technique IA qui identifie et classifie les entités nommées comme personnes, lieux et organisations dans le texte pour l'extraction d'information.

Récupération Dense

Récupération d'information utilisant des représentations vectorielles denses apprises, permettant la correspondance sémantique au-delà des mots-clés.

Récupération Sparse

Récupération d'information utilisant des vecteurs creux haute dimension basés sur les fréquences de termes, comme BM25 et TF-IDF.

Réduction de dimensionnalité

Techniques qui réduisent la dimension des embeddings tout en préservant un maximum d’information.

Réécriture de requête

Le fait de transformer une requête utilisateur en une forme plus efficace pour la récupération.

Regression testing (systèmes d’IA)

Vérifier que les changements de modèles ou de pipelines ne dégradent pas involontairement le comportement existant.

Relevance scoring

L’attribution de scores numériques qui indiquent à quel point un résultat correspond à une requête.

Réseau feed-forward

Un réseau de neurones où l'information circule uniquement de l'entrée vers la sortie, sans connexions récurrentes.

Réseau Neuronal

Un modèle d'apprentissage automatique composé de couches interconnectées de neurones artificiels qui apprennent des patterns à partir de données.

Résolution des conflits de sources

La résolution des conflits de sources décrit comment un système de recherche/RAG détecte et traite des sources contradictoires, en privilégiant l’autorité contrôlante.

Responsabilité du modèle

La responsabilité du modèle implique un ownership clair, une traçabilité et une responsabilité sur la construction, les changements et l’usage d’un modèle d’IA.

Retrieval coverage

La mesure dans laquelle un système de récupération peut faire remonter toutes les informations nécessaires pour répondre aux questions d’un domaine.

Retrieval filtering

L’application de règles ou de filtres de métadonnées pour restreindre quels documents peuvent être récupérés.

Retrieval orchestration

La coordination de plusieurs étapes de récupération, index ou outils pour une même tâche ou requête d’IA.

Retrieval pipeline

Une séquence ordonnée d'étapes qui traitent une requête et des documents pour renvoyer des résultats classés dans un système RAG ou de recherche.

Retrieval scoring

Le calcul de scores numériques de pertinence pour des documents ou chunks en fonction d'une requête.

Retrieval sensible à la conformité

Le retrieval sensible à la conformité applique des contraintes (accès, provenance, logs) pour récupérer et citer des sources de manière défendable.

Retrieval-Augmented Generation

RAG est une technique d'IA qui combine la recherche d'information avec la génération de texte pour produire des réponses précises et sourcées.

Rétropropagation

Un algorithme qui calcule efficacement les gradients en propageant les erreurs en arrière à travers un réseau neuronal couche par couche.

RLHF

Reinforcement Learning from Human Feedback—une technique pour affiner les modèles de langage avec les préférences humaines comme signaux de récompense.

Robustesse du modèle

Capacité d’un modèle à maintenir ses performances malgré le bruit, les dérives ou des entrées adversariales.

Role-based access control (RBAC)

Un modèle de contrôle d’accès où les droits sont attribués à des rôles plutôt qu’aux utilisateurs individuellement.

S

Schema markup

Des annotations structurées décrivant ce que représente une page ou un élément.

Semantic clustering

Le regroupement d’embeddings en clusters sur la base de leur similarité sémantique.

Semantic ranking

Le classement des résultats selon leur pertinence sémantique plutôt que de simples mots‑clés.

SentencePiece

Une bibliothèque de tokenisation en sous-mots, indépendante de la langue, qui apprend un vocabulaire directement à partir du texte brut.

Similarité Cosinus

Une mesure mathématique de similarité entre deux vecteurs basée sur le cosinus de l'angle entre eux.

Similarité par produit scalaire

Une mesure de similarité entre vecteurs basée sur leur produit scalaire.

Similarité Sémantique

Une mesure de la ressemblance de deux textes en termes de sens, indépendamment des mots spécifiques utilisés.

Similarity search

Des techniques de recherche qui retrouvent les éléments les plus similaires dans un espace d’embeddings.

Source hierarchy

L’ordre des sources par niveau (loi, arrêté, guide, blog) et par autorité.

Une stratÃ©gie dâ€™indexation est le plan qui dÃ©finit quoi indexer, comment structurer le contenu et comment garder lâ€™index Ã jour pour une recherche fiable.

Stratégie de Chunking

La méthode de division des documents en segments plus petits pour une récupération et un traitement efficaces dans les systèmes RAG.

Stress testing

Évaluer le comportement d’un système d’IA dans des conditions extrêmes ou dégradées.

Structured data

Des données organisées en champs et types clairs, par exemple des tables ou enregistrements.

Suivi de fraîcheur des sources

Le suivi de fraîcheur des sources enregistre l’actualité de chaque source (version, mise à jour, dates d’effet) afin que le retrieval reste aligné sur un droit changeant.

Supervision humaine

La supervision humaine signifie que des personnes peuvent comprendre, surveiller et intervenir sur un système d'IA, y compris l'arrêter ou le contourner.

Système d'IA à haut risque

Un système d'IA à haut risque est un système classé comme tel par l'EU AI Act selon son usage prévu, déclenchant des obligations renforcées.

T

Taux d'hallucination

Part des sorties du modèle contenant des informations inventées ou non sourcées.

Taxonomie et information architecture

L’organisation hiérarchique et la structure du contenu pour aider utilisateurs et systèmes à retrouver l’information.

Température

Un paramètre contrôlant l'aléatoire des sorties du modèle de langage, affectant créativité versus cohérence.

Temporal indexing

Une indexation qui permet de filtrer et raisonner sur des dimensions temporelles (versions, validité).

Tests adversariaux

Soumettre le modèle à des entrées difficiles ou malveillantes pour révéler ses faiblesses.

TF-IDF

Term Frequency-Inverse Document Frequency - une mesure statistique de l'importance des mots dans un document par rapport à une collection.

Tokenisation

Le processus de division du texte en unités plus petites (tokens) que les modèles de langage peuvent traiter et comprendre.

Transparence algorithmique

La transparence algorithmique consiste à fournir des informations claires sur le fonctionnement d'un système d'IA, ses données, ses limites et ses modes d'échec.

U

Usage d'outils par les LLM

Schéma de conception où les LLM décident quand et comment appeler des outils externes pour accomplir des tâches.

V

Validation human-in-the-loop

Utilisation de réviseurs humains pour vérifier, corriger ou approuver les sorties d'IA.

Vector embeddings

Représentations vectorielles numériques de texte ou d’autres données pour mesurer la similarité sémantique.

Vector normalization

Le redimensionnement des embeddings à une norme fixe, souvent des vecteurs unitaires, pour stabiliser les comparaisons.

Vector quantization

Une technique de compression qui projette des embeddings continus sur un ensemble limité de codewords.

Version control for knowledge systems

Le contrôle de version du contenu, des schémas et des configurations dans les systèmes de recherche et de connaissance.

W

Weaviate

Une base de données vectorielle open-source qui combine recherche vectorielle avec filtrage de données structurées et modules ML intégrés—permettant recherche sémantique, RAG et applications IA-natives.

WIB/CIR

Droit fiscal

Le Code des Impôts sur les Revenus (CIR) est la législation principale régissant l'imposition des revenus en Belgique.

Z

Zero-Shot Learning

Une capacité d'apprentissage automatique où les modèles effectuent des tâches sans exemples spécifiques, s'appuyant uniquement sur les connaissances pré-entraînées et les instructions en langage naturel.

É

Échantillonnage Top-k

Une méthode d'échantillonnage qui restreint la sélection de tokens aux k tokens les plus probables à chaque étape de génération.

Échantillonnage Top-p

Une méthode d'échantillonnage qui sélectionne parmi le plus petit ensemble de tokens dont la probabilité cumulative dépasse un seuil p.

Élagage

Suppression des poids ou neurones inutiles des réseaux neuronaux pour réduire la taille et le coût de calcul sans perte significative de précision.

Éthique des données

L’éthique des données est l’usage responsable des données: collecte, partage et traitement en respectant les personnes, le contexte et les attentes légitimes.

Évaluation continue

Relancer régulièrement des évaluations en production pour détecter tôt les régressions ou dérives.

Évaluation de conformité IA