Glossar

Schlüsselbegriffe im belgischen Steuerrecht und KI erklärt

A

Adapter

Kleine trainierbare Module, die in eingefrorene vortrainierte Modelle eingefügt werden und effizientes aufgabenspezifisches Fine-Tuning ermöglichen.

Adversariales Testen

Systematisches Angreifen von Modellen mit schwierigen oder bösartigen Eingaben, um Schwachstellen aufzudecken.

Alignment

Der Prozess, KI-Systeme so zu trainieren, dass sie sich gemäß menschlicher Werte, Absichten und Präferenzen verhalten—sicherstellend, dass Modelle hilfreich, harmlos und ehrlich sind.

Anpassung an die Rechtsdomäne

Rechtsdomänen-Anpassung stimmt ein KI- oder Retrieval-System auf juristische Sprache, Quellen und Korrektheitskriterien ab, für präzisere, belastbare Ergebnisse.

Answer Grounding

Sicherstellen, dass zentrale Teile einer Antwort auf konkrete Quellen zurückgeführt werden können.

Approximate Nearest Neighbor

Algorithmen, die approximativ ähnliche Vektoren schnell finden, indem sie perfekte Genauigkeit gegen massive Geschwindigkeitsverbesserungen eintauschen.

Attention-Mechanismus

Eine neuronale Netzwerktechnik, die Modellen ermöglicht, sich bei der Ausgabeerzeugung auf relevante Teile der Eingabe zu konzentrieren.

Attribution

Die KI-Fähigkeit, generierte Aussagen mit spezifischen Quellbelegen zu verknüpfen und festzustellen, welche Teile der Ausgabe von welchen Dokumenten gestützt werden.

B

Backpropagation

Ein Algorithmus, der effizient Gradienten berechnet, indem er Fehler rückwärts durch ein neuronales Netzwerk Schicht für Schicht propagiert.

Beam Search

Ein Dekodierungsalgorithmus, der mehrere Kandidatensequenzen parallel erkundet und die top-k vielversprechendsten Pfade bei jedem Schritt behält.

Benchmarking

Der systematische Prozess zur Bewertung von Modellleistung gegen standardisierte Datensätze und Metriken, der faire Vergleiche zwischen verschiedenen Modellen, Architekturen und Ansätzen ermöglicht.

Bi-Encoder

Eine neuronale Architektur, die Queries und Dokumente separat in feste Vektoren kodiert, was effiziente Ähnlichkeitssuche durch vorberechnete Embeddings und Approximate-Nearest-Neighbor-Indizes ermöglicht.

Bias-Minderung

Bias-Minderung umfasst Methoden, um unfairen Bias in Daten, Modellverhalten und Outcomes eines KI-Systems zu erkennen und zu reduzieren.

BM25

Best Matching 25 - der State-of-the-Art probabilistische Ranking-Algorithmus für Textsuche basierend auf TF-IDF-Prinzipien.

Byte Pair Encoding (BPE)

Ein Subword-Tokenisierungsalgorithmus, der ein Vokabular durch iteratives Zusammenführen häufiger Symbolpaare aufbaut.

C

Chain-of-Thought

Eine Prompting-Technik, die Schritt-für-Schritt-Reasoning von Sprachmodellen hervorruft, die Leistung bei komplexen Aufgaben verbessert, indem der Denkprozess explizit und verifizierbar gemacht wird.

Chunking-Strategie

Die Methode zur Aufteilung von Dokumenten in kleinere Segmente für effektives Retrieval und Verarbeitung in RAG-Systemen.

Cross-Encoder

Eine neuronale Architektur, die Query-Dokument-Paare gemeinsam kodiert, um Relevanzscores zu erzeugen, mit höherer Genauigkeit als Bi-Encoder aber zu höheren Rechenkosten.

D

Deep Learning

Ein Teilbereich des Machine Learning, der neuronale Netze mit vielen Schichten nutzt, um hierarchische Repräsentationen zu lernen.

Dense Retrieval

Informationsabruf mit gelernten dichten Vektordarstellungen, ermöglicht semantisches Matching über Schlüsselwort-Überlappung hinaus.

Dimensionsreduktion

Verfahren, die die Dimensionalität von Embeddings verringern und möglichst viel Information erhalten.

Distanzmetrik

Eine mathematische Funktion, die Abstand oder Ähnlichkeit zwischen zwei Embeddings quantifiziert.

Dot-Product-Similarität

Ein Ähnlichkeitsmaß zwischen Vektoren, das auf ihrem Skalarprodukt basiert.

E

Embedding Alignment

Die Abstimmung von Embeddings aus verschiedenen Modellen oder Sprachen, damit sie vergleichbar werden.

Embedding Compression

Verfahren, die Embeddings in Speicher oder Bits pro Vektor verkleinern, ohne die Qualität stark zu mindern.

Embedding Drift

Langsame Verschiebung der Bedeutung oder Skala von Embeddings durch Modell‑ oder Datenänderungen.

Embedding Space

Der Vektorraum, in dem Embeddings liegen und in dem Abstände semantische Beziehungen annähern.

Embedding-Modell

Ein ML‑Modell, das Text oder andere Daten in Vektor-Embeddings umwandelt.

Embeddings

Dichte Vektorrepräsentationen von Daten (Text, Bilder, etc.), die semantische Bedeutung in einem kontinuierlichen numerischen Raum erfassen.

Erklärbarkeit

Die Fähigkeit zu verstehen, zu interpretieren und zu erklären, wie KI/ML-Modelle Vorhersagen treffen—essentiell für Vertrauen, Debugging, regulatorische Compliance und verantwortungsvolle KI-Bereitstellung.

Euklidische Distanz

Die Luftliniendistanz zwischen zwei Punkten in einem Vektorraum.

Evals-Framework

Wiederverwendbare Umgebung zum Definieren, Ausführen und Nachverfolgen von KI-Evaluationen.

Evaluationsdatensatz

Kuratiertes Set von Beispielen mit bekannten Labels zur Messung der Modellperformance.

F

FAISS

Facebook AI Similarity Search - die umfassendste Open-Source-Bibliothek für effiziente Ähnlichkeitssuche und Clustering von dichten Vektoren.

Faithfulness

Eigenschaft, dass eine Erklärung das tatsächliche Modellverhalten und die zugrunde liegenden Belege korrekt widerspiegelt.

Faktentreue

Maß dafür, wie gut eine generierte Antwort mit verlässlichen Quellen oder Ground Truth übereinstimmt.

Faktizität

Der Grad, zu dem KI-generierte Inhalte überprüfbare Wahrheit genau widerspiegeln und korrekte Aussagen von Fabrikationen und Halluzinationen unterscheiden.

Feedforward-Netzwerk

Ein neuronales Netz, in dem Informationen nur vorwärts von Eingabe zu Ausgabe fließen, ohne rückgekoppelte Verbindungen.

Fehleranalyse

Gezielt untersuchen, wo und warum ein Modell versagt, um spätere Versionen zu verbessern.

Few-Shot Learning

Ein Machine-Learning-Paradigma, bei dem Modelle Aufgaben aus nur wenigen Beispielen lernen, was schnelle Anpassung ohne umfangreiches Neutraining oder Fine-Tuning ermöglicht.

Fine-Tuning

Der Prozess des Weitertrainierens eines vortrainierten Modells auf domänenspezifischen Daten für bessere Spezialisierung.

Function Calling

Eine LLM-Fähigkeit, bei der das Modell strukturierte Argumente auswählt und ausfüllt, um externe Tools oder Funktionen aufzurufen.

G

Generative Schicht

Der Teil eines RAG-Systems, in dem das Sprachmodell den abgerufenen Kontext nutzt, um eine Antwort zu erzeugen.

Gieriges Dekodieren

Eine einfache Textgenerierungsstrategie, die bei jedem Schritt immer das Token mit der höchsten Wahrscheinlichkeit auswählt.

Gradientenabstieg

Ein Optimierungsalgorithmus, der Modellparameter iterativ anpasst, indem er sich in die Richtung bewegt, die die Verlustfunktion reduziert.

Ground Truth

Die maßgeblichen, verifizierten Referenzdaten zum Trainieren und Evaluieren von Machine-Learning-Modellen—die 'korrekten' Antworten, gegen die Modellvorhersagen gemessen werden.

Grounding

Die Technik zur Verankerung von KI-Modellausgaben an überprüfbaren Quellen, Fakten oder abgerufenen Dokumenten, um Halluzinationen zu reduzieren und Genauigkeit zu erhöhen.

Guardrails

Sicherheitsmechanismen und Einschränkungen, die KI-Systeme daran hindern, schädliche, unangemessene oder themenabweichende Outputs zu generieren—Laufzeitschutz über das Alignment während des Trainings hinaus.

H

Halluzination

Wenn ein KI-Modell falsche, erfundene oder unbelegte Informationen als Fakten präsentiert.

Halluzinationsrate

Anteil der Ausgaben eines Modells, die erfunden oder nicht belegt sind.

HNSW

Hierarchical Navigable Small World Graphen - der State-of-the-Art-Algorithmus für schnelle approximative Nearest-Neighbor-Suche in hochdimensionalen Räumen.

Human-in-the-loop-Validierung

Einsatz menschlicher Prüfer, um KI-Ausgaben zu kontrollieren, zu korrigieren oder freizugeben.

Hybrid Indexing

Die Kombination von Vektor- und lexikalischen Indizes, um semantische und Schlüsselwort-Matches zu unterstützen.

Hybride Suche

Ein Retrieval-Ansatz, der Keyword-basierte und semantische Vektorsuche kombiniert, um die Stärken beider Methoden zu nutzen.

I

In-Context Learning

Die Fähigkeit großer Sprachmodelle, neue Aufgaben zur Inferenzzeit zu lernen, indem sie auf Beispiele oder Instruktionen im Prompt konditionieren, ohne Parameterupdates.

Index Refresh

Das periodische Aktualisieren eines Vektorindex, um neue Daten oder Modelländerungen abzubilden.

Index Sharding

Das Aufteilen eines großen Index in mehrere Shards über Maschinen oder Partitionen hinweg.

Inferenz

Der Prozess der Verwendung eines trainierten Modells zur Generierung von Vorhersagen oder Ausgaben auf neuen Daten.

Instruction Tuning

Eine Fine-Tuning-Methode, die Sprachmodelle trainiert, Anweisungen in natürlicher Sprache für diverse Aufgaben zu befolgen.

Invertierter Index

Eine Datenstruktur, die Begriffe auf Dokumentstandorte abbildet, für schnelle Volltextsuche über große Dokumentsammlungen.

Iteratives Retrieval

Eine Retrievalstrategie, die Anfragen und Kontext wiederholt anhand von Zwischenergebnissen verfeinert.

J

Jailbreaking

Das gezielte Gestalten von Prompts oder Eingaben, um die Sicherheits- und Richtliniengrenzen eines KI-Systems zu umgehen.

K

Kalibrierung

Anpassung der Modellkonfidenzen an die tatsächliche Wahrscheinlichkeit der Korrektheit.

Knowledge-Retrieval-Strategie

Die übergeordneten Designentscheidungen dazu, wie ein System Wissen für LLMs abruft und strukturiert.

Konfidenzintervall

Ein Wertebereich, in dem eine Größe mit einer bestimmten Wahrscheinlichkeit liegt.

Kontextfenster

Die maximale Textmenge (gemessen in Tokens), die ein Sprachmodell in einer einzelnen Interaktion verarbeiten kann.

Kontextinjektion

Das Hinzufügen abgerufener oder zusätzlicher Informationen in einen LLM-Prompt, um die Generierung zu steuern.

Kontinuierliche Evaluation

Regelmäßiges erneutes Ausführen von Evaluationen in Produktion, um Regressionen oder Drift früh zu erkennen.

Kosinus-Ähnlichkeit

Ein mathematisches Maß für die Ähnlichkeit zwischen zwei Vektoren basierend auf dem Kosinus des Winkels zwischen ihnen.

L

LLM

Large Language Models sind KI-Systeme, die auf riesigen Textdaten trainiert wurden, um menschenähnlichen Text zu verstehen und zu generieren.

Log-Wahrscheinlichkeiten

Die Logarithmen der von einem Sprachmodell ausgegebenen Token-Wahrscheinlichkeiten, genutzt zur Bewertung und Analyse von Generierungen.

LoRA

Low-Rank Adaptation - eine effiziente Fine-Tuning-Technik, die kleine Adapter-Matrizen trainiert statt alle Modellgewichte zu aktualisieren.

M

Maschinelles Lernen

Ein KI-Bereich, in dem Systeme Muster aus Daten lernen, um Vorhersagen ohne explizite Programmierung zu treffen.

Metadata Filtering

Begrenzung des Retrievals anhand von Feldern wie Datum, Quelle, Sprache oder Vertraulichkeit.

Milvus

Eine Open-Source-Vektordatenbank, optimiert für das Speichern, Indexieren und Durchsuchen massiver Embedding-Vektoren—ermöglicht Ähnlichkeitssuche für KI-Anwendungen wie RAG, semantische Suche und Empfehlungen.

Modelldrift

Leistungsabfall eines Modells im Zeitverlauf, weil sich Datendistribution oder Nutzung ändern.

Modellkomprimierung

Techniken zur Reduzierung von KI-Modellgröße und Rechenanforderungen bei Erhalt der Leistung für effizientes Deployment.

Modellrobustheit

Wie gut ein Modell seine Leistung bei Rauschen, Verschiebungen oder adversarialen Eingaben beibehält.

Multi-Head Attention

Eine Technik, die mehrere Attention-Operationen parallel ausführt und Modellen ermöglicht, verschiedene Beziehungstypen gleichzeitig zu erfassen.

Multi-Hop-Retrieval

Retrieval, das mehrere verkettete Schritte nutzt, um komplexe mehrstufige Fragen zu beantworten.

N

Named Entity Recognition

KI-Technik die benannte Entitäten wie Personen, Orte und Organisationen in Text identifiziert und klassifiziert für Informationsextraktion.

Nearest-Neighbor-Suche

Algorithmen, die die nächstgelegenen Vektoren zu einer Query‑Embedding finden.

Negative Retrieval

Ein Retrievalmuster, das gezielt nach widersprechenden, fehlenden oder widerlegenden Belegen sucht.

Neuronales Netz

Ein Machine-Learning-Modell aus miteinander verbundenen Schichten künstlicher Neuronen, die Muster aus Daten lernen.

O

OCR

Optische Zeichenerkennung—Technologie, die Bilder von Text (gescannte Dokumente, Fotos, PDFs) in maschinenlesbaren Text umwandelt und Suche, Bearbeitung und KI-Verarbeitung von gedrucktem oder handgeschriebenem Inhalt ermöglicht.

P

Passage-Retrieval

Das Abrufen kleiner Textpassagen oder Chunks statt ganzer Dokumente für präzisere Antworten.

Perplexität

Eine Metrik, die misst, wie gut ein Sprachmodell Text vorhersagt, wobei niedrigere Werte bessere Vorhersagefähigkeit anzeigen.

Pinecone

Ein vollständig verwalteter Vektor-Datenbank-Service speziell für Machine-Learning-Anwendungen entwickelt, der serverlose Ähnlichkeitssuche im Maßstab bietet.

Positional Encoding

Verfahren in Transformer-Modellen, um Positionsinformationen zu ansonsten reihenfolgenblinden Embeddings hinzuzufügen.

Pretraining

Die initiale Trainingsphase eines großen Sprachmodells auf massiven Textkorpora, um allgemeine Sprachmuster, Weltwissen und Denkfähigkeiten vor aufgabenspezifischem Fine-Tuning zu lernen.

Prompt

Die Texteingabe oder Anweisung, die einem Sprachmodell gegeben wird, um die Antwortgenerierung zu steuern.

Prompt Injection

Eine Angriffstechnik, bei der bösartige Anweisungen in LLM-Eingaben eingefügt werden, um System-Prompts zu überschreiben, Guardrails zu umgehen oder das Modellverhalten auf unbeabsichtigte Weise zu manipulieren.

Pruning

Entfernen unnötiger Gewichte oder Neuronen aus neuronalen Netzen zur Reduzierung von Modellgröße und Rechenkosten ohne signifikanten Genauigkeitsverlust.

Q

QLoRA

Quantized LoRA - kombiniert 4-Bit-Quantisierung mit LoRA-Adaptern und ermöglicht Fine-Tuning von 65B+ Modellen auf einer einzelnen 48GB GPU.

Quantisierung

Reduzierung der Modellpräzision von 32/16-Bit auf 8/4-Bit, was den Speicherverbrauch drastisch senkt und die Inferenz beschleunigt.

Query Expansion

Techniken, die Suchanfragen automatisch umformulieren oder erweitern, um Retrieval durch Hinzufügen von Synonymen, verwandten Begriffen oder umformulierten Versionen zu verbessern.

Query Rewriting

Die Umformulierung einer Benutzeranfrage in eine Form, die für Retrieval besser funktioniert.

R

Regressionstests (KI-Systeme)

Prüfen, dass Änderungen an Modellen oder Pipelines bestehendes Verhalten nicht unbeabsichtigt verschlechtern.

Reranking

Eine zweistufige Retrieval-Technik, die initiale Suchergebnisse neu ordnet, um Relevanz mit ausgefeilteren Modellen zu verbessern.

Retrieval-Augmented Generation

RAG ist eine KI-Technik, die Informationsabruf mit Textgenerierung kombiniert, um präzise, quellenbasierte Antworten zu erzeugen.

Retrieval-Coverage

Das Ausmaß, in dem ein Retrievalsystem alle Informationen für die Beantwortung von Fragen in einem Bereich bereitstellen kann.

Retrieval-Filterung

Das Anwenden von Regeln oder Metadatenfiltern, um einzugrenzen, welche Dokumente abgerufen werden dürfen.

Retrieval-Latenz

Die Zeit, die ein Retrievalsystem benötigt, um Ergebnisse für eine Anfrage zurückzugeben.

Retrieval-Orchestrierung

Die Koordination mehrerer Retrievalschritte, Indizes oder Tools für eine einzelne KI‑Aufgabe oder Anfrage.

Retrieval-Pipeline

Eine geordnete Abfolge von Schritten, die eine Anfrage und Dokumente verarbeiten, um gerankte Ergebnisse in einem RAG- oder Suchsystem zurückzugeben.

Retrieval-Präzision

Der Anteil der abgerufenen Dokumente, die tatsächlich für die Anfrage relevant sind.

Retrieval-Recall

Der Anteil aller wirklich relevanten Dokumente, die ein Retrievalsystem zurückliefert.

Retrieval-Schicht

Der Teil eines RAG-Systems, der vor der Generierung relevante Dokumente oder Chunks findet und rankt.

Retrieval-Scoring

Die Berechnung numerischer Relevanzwerte für Dokumente oder Chunks zu einer gegebenen Anfrage.

RLHF

Reinforcement Learning from Human Feedback—eine Technik zum Fine-Tuning von Sprachmodellen mit menschlichen Präferenzen als Belohnungssignal.

S

Self-Attention

Ein Mechanismus, bei dem jedes Element einer Sequenz Attention-Gewichte mit allen anderen Elementen derselben Sequenz berechnet.

Semantic Clustering

Das Gruppieren von Embeddings in Cluster auf Basis semantischer Ähnlichkeit.

Semantische Ähnlichkeit

Ein Maß dafür, wie ähnlich zwei Texte in ihrer Bedeutung sind, unabhängig von den verwendeten Wörtern.

Semantische Suche

Suchtechnologie die Bedeutung und Absicht versteht statt nur Schlüsselwörter zu matchen, für relevantere und intelligentere Ergebnisse.

SentencePiece

Eine sprachunabhängige Subword-Tokenisierungsbibliothek, die ein Vokabular direkt aus Rohtext lernt.

Similarity Search

Suchtechniken, die die ähnlichsten Elemente in einem Embeddingsraum finden.

Sliding-Window-Chunking

Eine Chunking-Strategie, bei der sich überlappende Fenster über ein Dokument bewegen, um Kontext zwischen Chunks zu erhalten.

Sparse Retrieval

Informationsabruf mit hochdimensionalen dünnbesetzten Vektoren basierend auf Termfrequenzen, wie BM25 und TF-IDF.

Stresstests

Bewertung, wie sich ein KI-System unter extremen oder degradierten Bedingungen verhält.

Strukturierte Ausgabe-Generierung

Die Praxis, LLM-Antworten auf klar definierte Formate wie JSON, XML oder Schemata zu beschränken.

System-Prompt

Der versteckte oder feste Instruktionsblock, der Verhalten und Einschränkungen eines LLM in einer Anwendung festlegt.

T

Temperatur

Ein Parameter, der die Zufälligkeit von Sprachmodell-Ausgaben steuert und Kreativität versus Konsistenz beeinflusst.

TF-IDF

Term Frequency-Inverse Document Frequency - ein statistisches Maß für die Wichtigkeit von Wörtern in einem Dokument relativ zu einer Sammlung.

Tokenisierung

Der Prozess der Aufteilung von Text in kleinere Einheiten (Tokens), die Sprachmodelle verarbeiten und verstehen können.

Tool-Nutzung in LLMs

Ein Architekturpattern, bei dem LLMs entscheiden, wann und wie externe Tools für Aufgaben aufgerufen werden.

Top-k Sampling

Eine Sampling-Methode, die die Token-Auswahl auf die k wahrscheinlichsten nächsten Tokens bei jedem Generierungsschritt beschränkt.

Top-p Sampling

Eine Sampling-Methode, die aus der kleinsten Menge von Tokens auswählt, deren kumulative Wahrscheinlichkeit einen Schwellenwert p übersteigt.

Transformer-Architektur

Eine neuronale Netzwerkarchitektur, die Self-Attention verwendet, um sequentielle Daten parallel zu verarbeiten – die Basis moderner LLMs.

U

Unsicherheitsabschätzung

Die Quantifizierung, wie unsicher ein Modell hinsichtlich seiner Vorhersagen oder Antworten ist.

Unüberwachtes Lernen

Ein Machine-Learning-Ansatz, bei dem Modelle Muster und Strukturen in Daten ohne gelabelte Beispiele entdecken.

V

Vector Quantization

Eine Kompressionstechnik, die kontinuierliche Embeddings auf eine begrenzte Anzahl von Codewörtern abbildet.

Vektor-Datenbank

Eine spezialisierte Datenbank, optimiert für die Speicherung und Suche von hochdimensionalen Vektor-Embeddings mit Ähnlichkeitsmetriken.

Vektor-Embeddings

Numerische Vektorrepräsentationen von Text oder anderen Daten zur Messung semantischer Ähnlichkeit.

Vektor-Indexierung

Der Aufbau von Datenstrukturen, die schnelle Similarity Search über Embeddings ermöglichen.

Vektor-Normalisierung

Das Skalieren von Embeddings auf eine feste Norm, oft Einheitsvektoren, um Vergleiche zu stabilisieren.

Verlustfunktion

Eine mathematische Funktion, die misst, wie weit die Vorhersagen eines Modells von den gewünschten Ausgaben während des Trainings entfernt sind.

Verstärkendes Lernen

Ein Machine-Learning-Ansatz, bei dem Agenten optimales Verhalten durch Trial-and-Error-Interaktionen mit einer Umgebung lernen.

W

Weaviate

Eine Open-Source-Vektordatenbank, die Vektorsuche mit strukturierter Datenfilterung und integrierten ML-Modulen kombiniert—ermöglicht semantische Suche, RAG und KI-native Anwendungen.

Wissensdestillation

Training eines kleineren Schüler-Modells, um ein größeres Lehrer-Modell nachzuahmen, Wissenstransfer bei drastisch reduzierter Größe und Kosten.

Wissensgraph

Ein strukturiertes Netzwerk von Entitäten und ihren Beziehungen, das Maschinen ermöglicht, reale Konzepte zu verstehen und darüber zu schlussfolgern.

Z

Zero-Shot Learning

Eine Machine-Learning-Fähigkeit, bei der Modelle Aufgaben ohne aufgabenspezifische Beispiele ausführen, nur basierend auf vortrainiertem Wissen und natürlichsprachlichen Instruktionen.

Zitation

Die Praxis des expliziten Verweisens auf Quelldokumente in KI-generierten Antworten, ermöglicht Verifikation von Aussagen und baut Vertrauen durch Transparenz und Nachverfolgbarkeit auf.

Zuverlässigkeitsmetriken

Metriken, die erfassen, wie stabil, vorhersagbar und sicher ein KI-System über die Zeit ist.

Ü

Überwachtes Lernen

Ein Machine-Learning-Ansatz, bei dem Modelle aus gelabelten Trainingsdaten lernen, um Ausgaben vorherzusagen.