Skip to main content
Recherche & Retrieval

Pondération de la fiabilité des sources

La pondération de fiabilité des sources donne plus d’influence aux sources de confiance pour privilégier les contenus officiels et de qualité.

Également appelé: Trust weighting, Source quality weighting, Reliability scoring

Définition

La pondération de la fiabilité des sources est une technique où un système de recherche ou de RAG applique des poids différents selon la confiance accordée à chaque source. La fiabilité reflète notamment la provenance, le contrôle éditorial, la discipline de mise à jour, et le caractère officiel ou interprétatif d’une source.

Pourquoi c’est important

  • Réponses plus sûres : réduit l’influence de contenus de faible qualité.
  • Meilleur ranking : aide à départager plusieurs documents pertinents.
  • Explicabilité : rend visible la préférence pour des sources officielles.
  • Robustesse : limite l’impact de contenus bruyants ou optimisés SEO.

Comment ça fonctionne

La fiabilité est souvent un score ou une métadonnée utilisée dans le ranking et/ou la synthèse :

Récupérer -> score pertinence -> appliquer poids de fiabilité -> classer -> générer avec citations

Exemple de niveaux (droit/fiscalité) :

  1. Textes officiels et publications administratives
  2. Jurisprudence primaire (avec métadonnées sur le niveau de juridiction)
  3. Doctrine professionnelle et notes internes curées
  4. Web non vérifié

Exemple pratique

Sur une obligation déclarative, le système récupère une page officielle et plusieurs billets de blog. La pondération remonte la source officielle et l’utilise comme citation principale ; les blogs restent des éléments d’explication secondaires.

Questions fréquentes

Q: En quoi est-ce différent d’un modèle de classement par autorité ?

R: La fiabilité est plus large (confiance, provenance). L’autorité est plus juridique (hiérarchie des normes et sources contrôlantes). Souvent, on combine les deux.

Q: Est-ce manipulable ?

R: Moins que la pertinence “mots-clés”, mais oui si la liste de sources n’est pas maîtrisée. Les bons systèmes contrôlent les domaines autorisés et la provenance, et reviennent sur les sources à fort impact.

Termes associés


Références

Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.

References

Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.