Skip to main content
Recherche & Retrieval

Expansion sémantique

L’expansion sémantique élargit une requête avec des termes ou sens proches (synonymes, entités, embeddings) pour améliorer le rappel sans trahir l’intention.

Également appelé: Query expansion, Expansion de requête, Expansion par synonymes

Définition

L’expansion sémantique (souvent appelée query expansion) ajoute à une requête des alternatives liées au sens: synonymes, concepts proches, variantes d’entités. L’objectif est de retrouver des contenus pertinents même si les mots exacts ne sont pas présents.

Pourquoi c’est important

  • Meilleur rappel: couvre des formulations différentes.
  • Meilleure couverture métier: relie abréviations, citations et jargon.
  • Meilleure UX: moins de requêtes sans résultat, moins de reformulations.
  • Hybride: peut alimenter la recherche plein texte et la recherche vectorielle.

Comment ça fonctionne

Requête -> compréhension -> expansion sûre -> retrieval -> classement -> validation par analytics

Les sources d’expansion incluent des listes de synonymes, des taxonomies et des voisins en embedding. Le risque principal est d’élargir au point de changer l’intention.

Exemple pratique

Si un utilisateur tape “CIR92”, l’expansion peut inclure “WIB92” et “Code des impôts sur les revenus” pour retrouver la même source malgré les variantes linguistiques.

Questions fréquentes

Q: Pourquoi l’expansion peut-elle dégrader la pertinence?

R: Une expansion trop large ajoute du bruit. On peut pondérer les termes ajoutés plus bas et surveiller l’impact.

Q: Est-ce la même chose que des synonymes dans l’index?

R: C’est lié. On peut faire l’expansion au moment de la requête ou à l’indexation. L’expansion à la requête est souvent plus facile à auditer.

Termes associés


Références

Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.

References

Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.