Greedy Decodering — Woordenlijst

Definitie

Greedy decodering is de eenvoudigste tekstgeneratiestrategie waarbij het model altijd het token met de hoogste kans selecteert bij elke generatiestap. Het maakt lokaal optimale keuzes zonder te overwegen hoe huidige beslissingen toekomstige tokenmogelijkheden beïnvloeden, resulterend in snelle maar potentieel suboptimale sequenties.

Waarom het belangrijk is

Greedy decodering biedt belangrijke voordelen in specifieke scenario’s:

Snelheid — snelste decoderingsmethode, enkele forward pass per token
Deterministisch — zelfde invoer produceert altijd zelfde uitvoer
Eenvoud — geen hyperparameters om af te stemmen
Basislijn — standaard vergelijkingspunt voor andere methoden
Gestructureerde taken — werkt goed voor feitelijke, beperkte outputs

Echter, greedy decodering produceert vaak repetitieve of generieke tekst.

Hoe het werkt

┌────────────────────────────────────────────────────────────┐
│                     GREEDY DECODERING                      │
├────────────────────────────────────────────────────────────┤
│                                                            │
│  Bij elke stap: Kies argmax(kans)                          │
│                                                            │
│  Stap 1: "De" → kansen:                                   │
│  ┌─────────────────────────────────────────────┐           │
│  │  kat:  0.35  ◄── GESELECTEERD (hoogste)    │           │
│  │  hond: 0.25                                 │           │
│  │  man:  0.15                                 │           │
│  │  auto: 0.10                                 │           │
│  │  ...                                        │           │
│  └─────────────────────────────────────────────┘           │
│                                                            │
│  Stap 2: "De kat" → kansen:                               │
│  ┌─────────────────────────────────────────────┐           │
│  │  zat: 0.40  ◄── GESELECTEERD (hoogste)     │           │
│  │  liep: 0.20                                 │           │
│  │  is:   0.18                                 │           │
│  │  was:  0.12                                 │           │
│  └─────────────────────────────────────────────┘           │
│                                                            │
│  Resultaat: "De kat zat..."                               │
│                                                            │
│  ┌────────────────────────────────────────────────┐        │
│  │  PROBLEEM: LOKALE VS GLOBALE OPTIMA           │        │
│  │                                                │        │
│  │  Greedy: "De kat zat" (p=0.35 × 0.40 = 0.14) │        │
│  │  Beter: "De hond liep" (p=0.25 × 0.55 = 0.14)│        │
│  │                                                │        │
│  │  Tweede pad kan tot betere sequentie leiden!  │        │
│  │  Greedy ziet dit niet—committeert aan "kat"  │        │
│  └────────────────────────────────────────────────┘        │
│                                                            │
│  GREEDY VS ALTERNATIEVEN:                                  │
│  ────────────────────────                                  │
│  Greedy:     Kies altijd top-1   → deterministisch        │
│  Top-k:      Sample uit top-k    → divers                 │
│  Top-p:      Sample uit nucleus  → adaptief               │
│  Beam:       Volg meerdere paden → betere sequenties      │
│                                                            │
└────────────────────────────────────────────────────────────┘

Wanneer greedy decodering gebruiken:

Scenario	Aanbeveling
Code generatie	Vaak goed (gestructureerde output)
Vertaling	Meestal beam search verkozen
Creatief schrijven	Gebruik sampling
Feitelijke Q&A	Kan goed werken
Classificatie	Geschikt
Algemene chat	Gebruik sampling

Veelgestelde vragen

V: Waarom produceert greedy decodering repetitieve tekst?

A: Zodra het model een veelvoorkomende zin genereert, heeft die zin vaak hoge kans om door te gaan. Het model kan vastlopen in lussen zoals “Ik denk dat ik denk dat ik denk…” omdat elke herhaling lokaal optimaal is.

V: Wanneer moet ik greedy decodering gebruiken?

A: Gebruik het voor gestructureerde taken met duidelijke correcte antwoorden: code-aanvulling, classificatie, eenvoudige extractie. Vermijd het voor creatieve of open generatie waar diversiteit belangrijk is.

V: Is greedy decodering equivalent aan temperatuur = 0?

A: Effectief ja. Temperatuur die naar 0 nadert maakt de kansverdeling steeds meer gepiekt op het hoogste-kans token, convergerend naar greedy selectie.

V: Hoe verhoudt greedy zich tot beam search?

A: Greedy is beam search met beam breedte 1. Beam search verkent meerdere paden en vindt vaak volledige sequenties met hogere kans, ten koste van meer berekening.

Gerelateerde termen

Beam Search — verkent meerdere sequenties
Top-k Sampling — voegt willekeur toe
Top-p Sampling — adaptieve sampling
Temperatuur — controleert distributievorm
Inferentie — generatieproces

Referenties

Holtzman et al. (2020), “The Curious Case of Neural Text Degeneration”, ICLR. [2.500+ citaties]

Meister et al. (2020), “If Beam Search is the Answer, What was the Question?”, EMNLP. [200+ citaties]

Welleck et al. (2020), “Neural Text Generation With Unlikelihood Training”, ICLR. [500+ citaties]

See et al. (2017), “Get To The Point: Summarization with Pointer-Generator Networks”, ACL. [3.500+ citaties]

References

Holtzman et al. (2020), “The Curious Case of Neural Text Degeneration”, ICLR. [2,500+ citations]

Meister et al. (2020), “If Beam Search is the Answer, What was the Question?”, EMNLP. [200+ citations]

Welleck et al. (2020), “Neural Text Generation With Unlikelihood Training”, ICLR. [500+ citations]

See et al. (2017), “Get To The Point: Summarization with Pointer-Generator Networks”, ACL. [3,500+ citations]