Glossaire

Termes clés du droit fiscal belge et de l'IA expliqués

A

Ajustement de la pertinence

Lâ€™ajustement de la pertinence est lâ€™amÃ©lioration systÃ©matique du classement en ajustant signaux, poids et rÃ¨gles Ã partir de mesures et dâ€™Ã©valuations.

Analyse de couverture de retrieval

L’analyse de couverture de retrieval vérifie si l’index et le pipeline peuvent retrouver les sources nécessaires pour un périmètre défini de questions et sujets.

Analytique de recherche

Lâ€™analytique de recherche mesure lâ€™usage et la performance de la recherche (requÃªtes, clics, zÃ©ro rÃ©sultat, satisfaction) pour lâ€™amÃ©liorer.

C

Cartographie des dépendances juridiques

La cartographie des dépendances juridiques construit un graphe de citations et relations entre sources afin que retrieval et analyse suivent ce qui dépend de quoi.

ComprÃ©hension de requÃªte

La comprÃ©hension de requÃªte dÃ©crit comment un systÃ¨me interprÃ¨te le sens dâ€™une recherche (entitÃ©s, intention, ambiguÃ¯tÃ©) avant le retrieval et le classement.

Confidence scoring

L’attribution de scores indiquant à quel point les preuves ou la récupération soutiennent une réponse.

Content indexing

La création et la maintenance d’index de recherche sur les documents, champs et embeddings.

Corpus

L’ensemble complet de documents dont dispose un système de recherche ou d’IA.

D

DÃ©couvrabilitÃ© du contenu

La dÃ©couvrabilitÃ© du contenu dÃ©crit la facilitÃ© avec laquelle un contenu peut Ãªtre trouvÃ©, accessible et indexÃ© par des systÃ¨mes de recherche (internes ou externes).

Data pipeline

La chaîne d’étapes qui convertit des données sources brutes en contenu indexable et exploitable.

Data preprocessing

Le prétraitement de données brutes pour supprimer le bruit et uniformiser les formats avant la recherche ou l’IA.

Deduplication

L’identification et la suppression de documents dupliqués ou quasi dupliqués dans un corpus.

Document chunk

Un petit segment de document indexé et consulté comme unité distincte.

Document ingestion

L’ingestion et le stockage de nouveaux documents dans une plateforme de recherche ou de connaissance.

Document normalization

L’uniformisation du texte et de la structure entre documents pour simplifier l’indexation et la recherche.

Document parsing

La conversion de fichiers bruts en texte structuré et métadonnées.

E

Entity extraction

La détection automatique de noms, organisations, dates et autres entités dans un texte.

Expansion sÃ©mantique

Lâ€™expansion sÃ©mantique Ã©largit une requÃªte avec des termes ou sens proches (synonymes, entitÃ©s, embeddings) pour amÃ©liorer le rappel sans trahir lâ€™intention.

I

Indexation multi-juridictionnelle

L’indexation multi-juridictionnelle structure l’index sur plusieurs pays/régions afin que le retrieval respecte juridiction, langue et applicabilité.

Information retrieval system

Un logiciel qui indexe des documents et traite des requêtes pour retrouver des informations pertinentes.

Intention de requÃªte

Lâ€™intention de requÃªte est lâ€™objectif derriÃ¨re une recherche (ce que lâ€™utilisateur veut accomplir) et elle guide le classement des rÃ©sultats.

K

Knowledge base

Un ensemble structuré de documents et de faits consultés par les systèmes de recherche ou d’IA.

L

Lexical search

Des techniques de recherche qui reposent surtout sur la correspondance exacte ou quasi exacte de mots‑clés.

M

Metadata enrichment

L’ajout ou la déduction de champs supplémentaires (entités, thèmes) au‑delà du document brut.

Modèle de classement par autorité

Un modèle de classement par autorité ordonne les sources par autorité juridique et fiabilité afin de faire remonter les sources contrôlantes en premier.

O

Ontologie

Un modèle formel des concepts et de leurs relations dans un domaine.

P

Pondération de la fiabilité des sources

La pondération de fiabilité des sources donne plus d’influence aux sources de confiance pour privilégier les contenus officiels et de qualité.

R

La recherche boolÃ©enne combine des termes avec des opÃ©rateurs comme AND, OR et NOT pour inclure ou exclure des rÃ©sultats avec prÃ©cision.

Recherche plein texte

La recherche plein texte rÃ©cupÃ¨re des documents en faisant correspondre des termes Ã du texte indexÃ© (souvent via un index inversÃ©) puis classe les meilleurs rÃ©sultats.

Relevance scoring

L’attribution de scores numériques qui indiquent à quel point un résultat correspond à une requête.

Résolution des conflits de sources

La résolution des conflits de sources décrit comment un système de recherche/RAG détecte et traite des sources contradictoires, en privilégiant l’autorité contrôlante.

S

Schema markup

Des annotations structurées décrivant ce que représente une page ou un élément.

Semantic ranking

Le classement des résultats selon leur pertinence sémantique plutôt que de simples mots‑clés.

Source hierarchy

L’ordre des sources par niveau (loi, arrêté, guide, blog) et par autorité.

Une stratÃ©gie dâ€™indexation est le plan qui dÃ©finit quoi indexer, comment structurer le contenu et comment garder lâ€™index Ã jour pour une recherche fiable.

Structured data

Des données organisées en champs et types clairs, par exemple des tables ou enregistrements.

Suivi de fraîcheur des sources

Le suivi de fraîcheur des sources enregistre l’actualité de chaque source (version, mise à jour, dates d’effet) afin que le retrieval reste aligné sur un droit changeant.

T

Taxonomie et information architecture

L’organisation hiérarchique et la structure du contenu pour aider utilisateurs et systèmes à retrouver l’information.

Temporal indexing

Une indexation qui permet de filtrer et raisonner sur des dimensions temporelles (versions, validité).

V

Version control for knowledge systems

Le contrôle de version du contenu, des schémas et des configurations dans les systèmes de recherche et de connaissance.