Definitie
Full-text search is keyword-gebaseerde retrieval over tekstvelden zoals titel, body en metadata. De meeste systemen bouwen een inverted index die termen koppelt aan documenten (en posities) waar ze voorkomen, zodat zoeken snel en schaalbaar is.
Waarom het belangrijk is
- Precisie: exacte termen, frases en filters zijn vaak cruciaal in juridische/fiscale content.
- Snelheid: inverted indexes schalen goed naar grote corpora.
- Transparantie: je kunt verklaren waarom een resultaat matcht (termen, velden, boosts).
- Controle: ondersteunt veldweging, frasezoekopdrachten en Booleaanse operatoren.
Hoe het werkt
Tekst -> tokeniseer/normaliseer -> inverted index -> query -> scoring -> ranking
Praktisch voorbeeld
Zoeken naar "roerende voorheffing" AND België kan betrouwbaar documenten opleveren die die exacte frase en jurisdictie expliciet bevatten.
Veelgestelde vragen
Q: Is full-text search hetzelfde als semantische zoekfunctie?
A: Nee. Full-text matcht tokens/frases. Semantische search matcht betekenis (vaak met embeddings). Veel systemen combineren beide (hybride search).
Q: Waarom mis ik soms resultaten die zouden moeten matchen?
A: Vaak door analyzerkeuzes (stemming, stopwoorden), ontbrekende velden of content die niet werd geïndexeerd door de indexeringsstrategie.
Gerelateerde termen
- Indexeringsstrategie - wat en hoe indexeren
- Booleaanse zoekopdracht - AND/OR/NOT logica
- Relevantie-afstemming - ranking verbeteren
- Vindbaarheid van content - content vindbaar en indexeerbaar maken
Referenties
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.
References
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.