Schlüsselbegriffe im belgischen Steuerrecht und KI erklärt
Retrieval-Abdeckungsanalyse prüft, ob Index und Retrieval-Pipeline die nötigen Quellen für eine definierte Menge an Fragen und Themen finden können.
Auffindbarkeit beschreibt, wie leicht Inhalte von Suchsystemen (intern oder extern) gefunden, erreicht und indexiert werden können.
Quellenkonflikt-Auflösung beschreibt, wie ein Such- oder RAG-System widersprüchliche Quellen erkennt und behandelt, mit Fokus auf kontrollierende Autorität und explizite Unsicherheit.
Ein Autoritäts-Ranking-Modell priorisiert Quellen nach rechtlicher Autorität und Zuverlässigkeit, damit kontrollierende, belastbare Quellen zuerst erscheinen.
Boolesche Suche kombiniert Begriffe mit Operatoren wie AND, OR und NOT, um Ergebnisse präzise ein- oder auszuschließen.
Die Vergabe von Scores, die angeben, wie stark Belege oder Retrieval eine Antwort tragen.
Der Aufbau und die Pflege von Suchindizes über Dokumente, Felder und Embeddings.
Die Abfolge von Schritten, die Rohdaten in indexierbare, nutzbare Inhalte verwandelt.
Vorverarbeitung von Rohdaten, um Rauschen zu entfernen und Formate für Suche oder KI zu vereinheitlichen.
Das Erkennen und Entfernen doppelter oder fast doppelter Dokumente in einem Korpus.
Ein kleines Segment eines Dokuments, das als eigene Einheit indexiert und abgefragt wird.
Das Einlesen und Speichern neuer Dokumente in einer Such‑ oder Wissensplattform.
Die Vereinheitlichung von Text und Struktur über Dokumente hinweg, um Indexierung und Suche zu vereinfachen.
Die Umwandlung von Rohdateien in strukturieren Text und Metadaten.
Das automatische Erkennen von Namen, Organisationen, Daten und anderen Entitäten in Text.
Die Gewichtung der Quellenzuverlässigkeit gibt vertrauenswürdigen Quellen mehr Einfluss, damit Retrieval und Antworten offizielle, hochwertige Quellen priorisieren.
Eine Indexierungsstrategie ist der Plan, was indexiert wird, wie Inhalte strukturiert werden und wie der Index aktuell bleibt, damit die Suche zuverlässig ist.
Software, die Dokumente indexiert und Anfragen bearbeitet, um relevante Informationen zu finden.
Eine strukturierte Sammlung von Dokumenten und Fakten, die von Such- oder KI‑Systemen genutzt wird.
Die Gesamtheit der Dokumente, über die ein Such- oder KI‑System verfügt.
Suchtechniken, die vor allem auf exakte oder fast exakte Schlüsselwortübereinstimmung setzen.
Mapping rechtlicher Abhängigkeiten baut einen Graphen aus Zitationen und Beziehungen zwischen Rechtsquellen, damit Retrieval und Analysen nachvollziehen können, was wovon abhängt.
Das Hinzufügen oder Ableiten zusätzlicher Felder (Entitäten, Themen) über den Rohdokumenten.
Multijurisdiktionale Indexierung strukturiert einen Index über Länder/Regionen hinweg, sodass Retrieval Jurisdiktion, Sprache und Anwendbarkeit berücksichtigt.
Ein formales Modell von Konzepten und deren Beziehungen innerhalb eines Fachgebiets.
Query-Verständnis beschreibt, wie ein Suchsystem die Bedeutung einer Anfrage (Entitäten, Intent, Mehrdeutigkeit) vor Retrieval und Ranking interpretiert.
Die Vergabe numerischer Scores, die angeben, wie gut ein Ergebnis zu einer Anfrage passt.
Relevanz-Tuning ist die systematische Verbesserung des Suchrankings durch Anpassung von Signalen, Gewichten und Regeln auf Basis von Messungen und Evaluation.
Strukturierte Annotationen, die beschreiben, was eine Seite oder ein Element darstellt.
Das Ranking von Ergebnissen nach semantischer Relevanz statt nur nach Schlüsselwörtern.
Semantische Erweiterung verbreitert eine Query um verwandte Begriffe oder Bedeutungen (Synonyme, Entitäten, Embeddings), um Recall zu erhöhen, ohne den Intent zu verlieren.
Die Einordnung von Quellen nach Ebene (Gesetz, Verordnung, Leitfaden, Blog) und Autorität.
Daten, die in klaren Feldern und Typen organisiert sind, etwa Tabellen oder Datensätze.
Suchanalyse misst Nutzung und Leistung der Suche (Queries, Klicks, Nulltreffer, Zufriedenheit), um Ranking, Content und Indexierung gezielt zu verbessern.
Suchintention ist das zugrunde liegende Ziel hinter einer Suchanfrage (was der Nutzer erreichen will) und steuert Ranking und Ergebnisarten.
Die hierarchische Ordnung und Struktur von Inhalten, damit Nutzer und Systeme Informationen finden.
Indexierung, die Filterung und Schlussfolgern entlang der Zeitdimension (Versionen, Gültigkeit) erlaubt.
Quellenaktualitäts-Tracking erfasst, wie aktuell jede Quelle ist (Version, letzte Updates, Geltungsdaten), damit Retrieval mit sich änderndem Recht Schritt hält.
Versionskontrolle für Inhalte, Schemata und Konfigurationen in Such- und Wissenssystemen.
Volltextsuche findet Dokumente, indem Suchbegriffe mit indexiertem Text (oft über einen invertierten Index) abgeglichen und die Treffer gerankt werden.