Définition
L’expansion sémantique (souvent appelée query expansion) ajoute à une requête des alternatives liées au sens: synonymes, concepts proches, variantes d’entités. L’objectif est de retrouver des contenus pertinents même si les mots exacts ne sont pas présents.
Pourquoi c’est important
- Meilleur rappel: couvre des formulations différentes.
- Meilleure couverture métier: relie abréviations, citations et jargon.
- Meilleure UX: moins de requêtes sans résultat, moins de reformulations.
- Hybride: peut alimenter la recherche plein texte et la recherche vectorielle.
Comment ça fonctionne
Requête -> compréhension -> expansion sûre -> retrieval -> classement -> validation par analytics
Les sources d’expansion incluent des listes de synonymes, des taxonomies et des voisins en embedding. Le risque principal est d’élargir au point de changer l’intention.
Exemple pratique
Si un utilisateur tape “CIR92”, l’expansion peut inclure “WIB92” et “Code des impôts sur les revenus” pour retrouver la même source malgré les variantes linguistiques.
Questions fréquentes
Q: Pourquoi l’expansion peut-elle dégrader la pertinence?
R: Une expansion trop large ajoute du bruit. On peut pondérer les termes ajoutés plus bas et surveiller l’impact.
Q: Est-ce la même chose que des synonymes dans l’index?
R: C’est lié. On peut faire l’expansion au moment de la requête ou à l’indexation. L’expansion à la requête est souvent plus facile à auditer.
Termes associés
- Compréhension de requête - comprendre avant d’étendre
- Intention de requête - garder l’objectif utilisateur
- Embeddings - base de l’expansion par sens
- Recherche plein texte - ajouter des variantes mots-clés
- Ajustement de la pertinence - mesurer et ajuster l’impact
Références
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.
References
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.