Définition
La pondération de la fiabilité des sources est une technique où un système de recherche ou de RAG applique des poids différents selon la confiance accordée à chaque source. La fiabilité reflète notamment la provenance, le contrôle éditorial, la discipline de mise à jour, et le caractère officiel ou interprétatif d’une source.
Pourquoi c’est important
- Réponses plus sûres : réduit l’influence de contenus de faible qualité.
- Meilleur ranking : aide à départager plusieurs documents pertinents.
- Explicabilité : rend visible la préférence pour des sources officielles.
- Robustesse : limite l’impact de contenus bruyants ou optimisés SEO.
Comment ça fonctionne
La fiabilité est souvent un score ou une métadonnée utilisée dans le ranking et/ou la synthèse :
Récupérer -> score pertinence -> appliquer poids de fiabilité -> classer -> générer avec citations
Exemple de niveaux (droit/fiscalité) :
- Textes officiels et publications administratives
- Jurisprudence primaire (avec métadonnées sur le niveau de juridiction)
- Doctrine professionnelle et notes internes curées
- Web non vérifié
Exemple pratique
Sur une obligation déclarative, le système récupère une page officielle et plusieurs billets de blog. La pondération remonte la source officielle et l’utilise comme citation principale ; les blogs restent des éléments d’explication secondaires.
Questions fréquentes
Q: En quoi est-ce différent d’un modèle de classement par autorité ?
R: La fiabilité est plus large (confiance, provenance). L’autorité est plus juridique (hiérarchie des normes et sources contrôlantes). Souvent, on combine les deux.
Q: Est-ce manipulable ?
R: Moins que la pertinence “mots-clés”, mais oui si la liste de sources n’est pas maîtrisée. Les bons systèmes contrôlent les domaines autorisés et la provenance, et reviennent sur les sources à fort impact.
Termes associés
- Modèle de classement par autorité - privilégier les sources contrôlantes
- Source Conflict Resolution - gérer des sources contradictoires
- Ajustement de la pertinence - optimiser ranking et évaluation
- Search Analytics - suivre qualité et dérive
- Retrieval sensible à la conformité - contraindre les sources par policy et règles
Références
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.
References
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.