Décodage Glouton — Glossaire

Définition

Le décodage glouton est la stratégie de génération de texte la plus simple où le modèle sélectionne toujours le token avec la plus haute probabilité à chaque étape de génération. Il fait des choix localement optimaux sans considérer comment les décisions actuelles affectent les possibilités de tokens futurs, résultant en des séquences rapides mais potentiellement sous-optimales.

Pourquoi c’est important

Le décodage glouton offre des avantages clés dans des scénarios spécifiques :

Vitesse — méthode de décodage la plus rapide, une seule passe forward par token
Déterministe — même entrée produit toujours même sortie
Simplicité — pas d’hyperparamètres à ajuster
Référence — point de comparaison standard pour autres méthodes
Tâches structurées — fonctionne bien pour sorties factuelles, contraintes

Cependant, le décodage glouton produit souvent du texte répétitif ou générique.

Comment ça fonctionne

┌────────────────────────────────────────────────────────────┐
│                     DÉCODAGE GLOUTON                       │
├────────────────────────────────────────────────────────────┤
│                                                            │
│  À chaque étape: Choisir argmax(probabilité)               │
│                                                            │
│  Étape 1: "Le" → probabilités:                            │
│  ┌─────────────────────────────────────────────┐           │
│  │  chat:  0.35  ◄── SÉLECTIONNÉ (plus haut)  │           │
│  │  chien: 0.25                                │           │
│  │  homme: 0.15                                │           │
│  │  car:   0.10                                │           │
│  │  ...                                        │           │
│  └─────────────────────────────────────────────┘           │
│                                                            │
│  Étape 2: "Le chat" → probabilités:                       │
│  ┌─────────────────────────────────────────────┐           │
│  │  dort: 0.40  ◄── SÉLECTIONNÉ (plus haut)   │           │
│  │  court: 0.20                                │           │
│  │  est:   0.18                                │           │
│  │  était: 0.12                                │           │
│  └─────────────────────────────────────────────┘           │
│                                                            │
│  Résultat: "Le chat dort..."                              │
│                                                            │
│  ┌────────────────────────────────────────────────┐        │
│  │  PROBLÈME: OPTIMA LOCAL VS GLOBAL             │        │
│  │                                                │        │
│  │  Glouton: "Le chat dort" (p=0.35×0.40=0.14)  │        │
│  │  Mieux: "Le chien court" (p=0.25×0.55=0.14)  │        │
│  │                                                │        │
│  │  Second chemin peut mener à meilleure séq.!   │        │
│  │  Glouton ne voit pas—s'engage sur "chat"     │        │
│  └────────────────────────────────────────────────┘        │
│                                                            │
│  GLOUTON VS ALTERNATIVES:                                  │
│  ────────────────────────                                  │
│  Glouton:    Choisir top-1 toujours  → déterministe       │
│  Top-k:      Échantillonner top-k    → divers             │
│  Top-p:      Échantillonner nucleus  → adaptatif          │
│  Faisceau:   Suivre plusieurs chemins→ meilleures séq.    │
│                                                            │
└────────────────────────────────────────────────────────────┘

Quand utiliser le décodage glouton:

Scénario	Recommandation
Génération de code	Souvent bon (sortie structurée)
Traduction	Faisceau généralement préféré
Écriture créative	Utiliser échantillonnage
Q&A factuel	Peut bien fonctionner
Classification	Approprié
Chat général	Utiliser échantillonnage

Questions fréquentes

Q : Pourquoi le décodage glouton produit du texte répétitif ?

R : Une fois que le modèle génère une phrase commune, cette phrase a souvent haute probabilité de continuer. Le modèle peut se bloquer en boucles comme “Je pense que je pense que je pense…” car chaque répétition est localement optimale.

Q : Quand dois-je utiliser le décodage glouton ?

R : Utilisez-le pour tâches structurées avec réponses correctes claires : complétion de code, classification, extraction simple. Évitez-le pour génération créative ou ouverte où la diversité compte.

Q : Le décodage glouton est-il équivalent à température = 0 ?

R : Effectivement oui. La température approchant 0 rend la distribution de probabilité de plus en plus piquée sur le token de plus haute probabilité, convergeant vers sélection gloutonne.

Q : Comment glouton se compare à recherche en faisceau ?

R : Glouton est recherche en faisceau avec largeur 1. La recherche en faisceau explore plusieurs chemins et trouve souvent des séquences complètes de plus haute probabilité, au coût de plus de calcul.

Termes associés

Recherche en Faisceau — explore plusieurs séquences
Échantillonnage Top-k — ajoute du hasard
Échantillonnage Top-p — échantillonnage adaptatif
Température — contrôle forme de distribution
Inférence — processus de génération

Références

Holtzman et al. (2020), “The Curious Case of Neural Text Degeneration”, ICLR. [2 500+ citations]

Meister et al. (2020), “If Beam Search is the Answer, What was the Question?”, EMNLP. [200+ citations]

Welleck et al. (2020), “Neural Text Generation With Unlikelihood Training”, ICLR. [500+ citations]

See et al. (2017), “Get To The Point: Summarization with Pointer-Generator Networks”, ACL. [3 500+ citations]

References

Holtzman et al. (2020), “The Curious Case of Neural Text Degeneration”, ICLR. [2,500+ citations]

Meister et al. (2020), “If Beam Search is the Answer, What was the Question?”, EMNLP. [200+ citations]

Welleck et al. (2020), “Neural Text Generation With Unlikelihood Training”, ICLR. [500+ citations]

See et al. (2017), “Get To The Point: Summarization with Pointer-Generator Networks”, ACL. [3,500+ citations]