Skip to main content
KI & Machine Learning

Neuronales Netz

Ein Machine-Learning-Modell aus miteinander verbundenen Schichten künstlicher Neuronen, die Muster aus Daten lernen.

Auch bekannt als: Künstliches neuronales Netz, KNN, Neurales Netzwerk, Konnektionistisches Modell

Definition

Ein neuronales Netz ist ein Rechenmodell, das lose vom menschlichen Gehirn inspiriert ist und aus Schichten miteinander verbundener künstlicher Neuronen (Knoten) besteht. Jedes Neuron empfängt Eingaben, wendet Gewichte und einen Bias an, führt das Ergebnis durch eine Aktivierungsfunktion und gibt an die nächste Schicht aus. Durch Training mit Backpropagation lernen neuronale Netze, Muster zu erkennen, Vorhersagen zu machen und Ausgaben aus Daten zu generieren.

Warum es wichtig ist

Neuronale Netze sind das Fundament moderner KI:

  • Universelle Approximatoren — können jede stetige Funktion mit genug Neuronen lernen
  • Feature Learning — entdecken automatisch relevante Muster in Daten
  • Skalierbarkeit — Leistung verbessert sich mit mehr Daten und Rechenleistung
  • Vielseitigkeit — Vision, Sprache, Spracherkennung, Spiele, Wissenschaft und mehr
  • State-of-the-Art — treiben alle führenden KI-Systeme einschließlich LLMs an

Von Bilderkennung bis Sprachgenerierung dominieren neuronale Netze die KI.

Wie es funktioniert

┌────────────────────────────────────────────────────────────┐
│                    NEURONALES NETZ                         │
├────────────────────────────────────────────────────────────┤
│                                                            │
│  STRUKTUR EINES FEEDFORWARD-NETZWERKS:                     │
│  ─────────────────────────────────────                     │
│                                                            │
│  Eingabeschicht  Versteckte Schichten  Ausgabeschicht      │
│      │                │                    │               │
│      ○ ─────┬────► ○ ────┬────► ○ ────┬────► ○             │
│      │      │      │     │      │     │      │             │
│      ○ ─────┼────► ○ ────┼────► ○ ────┼────► ○             │
│      │      │      │     │      │     │      │             │
│      ○ ─────┴────► ○ ────┴────► ○ ────┴────► (Ausgabe)     │
│                                                            │
│     x₁,x₂,x₃      h₁,h₂,h₃      h₄,h₅,h₆       ŷ          │
│                                                            │
│  EINZELNES NEURON:                                         │
│  ─────────────────                                         │
│                                                            │
│  ┌────────────────────────────────────────────────┐        │
│  │  Eingaben      Gewichte  Summe+Bias  Aktivierung│       │
│  │                                                 │        │
│  │    x₁ ──────► w₁ ──┐                           │        │
│  │                    │                           │        │
│  │    x₂ ──────► w₂ ──┼──► Σ + b ──► f(·) ──► y  │        │
│  │                    │                           │        │
│  │    x₃ ──────► w₃ ──┘                           │        │
│  │                                                 │        │
│  │  y = f(w₁x₁ + w₂x₂ + w₃x₃ + b)                │        │
│  └────────────────────────────────────────────────┘        │
│                                                            │
│  HÄUFIGE AKTIVIERUNGSFUNKTIONEN:                           │
│  ───────────────────────────────                           │
│                                                            │
│  ReLU:    f(x) = max(0, x)         ___/                   │
│  Sigmoid: f(x) = 1/(1+e⁻ˣ)        _/⁻⁻                    │
│  Tanh:    f(x) = (eˣ-e⁻ˣ)/(eˣ+e⁻ˣ)  _/‾                  │
│  Softmax: Wahrscheinlichkeitsverteilung (für Klassifik.)   │
│                                                            │
│  NETZWERKTYPEN:                                            │
│  ──────────────                                            │
│  Feedforward (MLP):    Daten fließen in eine Richtung     │
│  Konvolutionell (CNN): Räumliche Muster (Bilder)          │
│  Rekurrent (RNN):      Sequentielle Daten (Text, Zeit)    │
│  Transformer:          Attention-basiert (LLMs)           │
│                                                            │
└────────────────────────────────────────────────────────────┘

Netzwerkarchitektur-Vergleich:

TypStärkeAnwendungen
MLPEinfache tabellarische DatenKlassifikation, Regression
CNNRäumliche HierarchienBilder, Video, Audio
RNN/LSTMSequentielle MusterZeitreihen, frühe NLP
TransformerWeitreichende AbhängigkeitenLLMs, modernes NLP, Vision

Häufige Fragen

F: Wie tief sollte ein neuronales Netz sein?

A: Es hängt von der Aufgabenkomplexität ab. Einfache Aufgaben brauchen wenige Schichten; komplexe Muster (wie Sprache) brauchen viele. Moderne LLMs haben 32-100+ Schichten. Beginnen Sie einfach und fügen Sie Tiefe hinzu bei Underfitting.

F: Was ist der Unterschied zwischen Neuronen und Parametern?

A: Neuronen sind die Recheneinheiten; Parameter sind die Gewichte und Biases, die sie verbinden. Ein Netzwerk mit 1000 Neuronen kann Millionen von Parametern haben (jedes Neuron verbindet sich mit vielen anderen).

F: Warum brauchen neuronale Netze Aktivierungsfunktionen?

A: Ohne nichtlineare Aktivierungen würden mehrere Schichten zu einer einzigen linearen Transformation kollabieren (egal wie viele Schichten). Aktivierungsfunktionen ermöglichen es Netzwerken, komplexe, nichtlineare Muster zu lernen.

F: Wie beziehen sich neuronale Netze auf “Deep Learning”?

A: Deep Learning bezieht sich spezifisch auf neuronale Netze mit vielen Schichten (tiefe Architekturen). Ein 2-Schichten-Netzwerk ist ein neuronales Netz, aber nicht “tief.” Moderne Transformer-LLMs sind sehr tiefe neuronale Netze.

Verwandte Begriffe


Referenzen

LeCun et al. (2015), “Deep Learning”, Nature. [40.000+ Zitationen]

Goodfellow et al. (2016), “Deep Learning”, MIT Press. [20.000+ Zitationen]

Hornik et al. (1989), “Multilayer feedforward networks are universal approximators”, Neural Networks. [25.000+ Zitationen]

Rosenblatt (1958), “The Perceptron: A Probabilistic Model for Information Storage”, Psychological Review. [Grundlegendes Paper]

References

LeCun et al. (2015), “Deep Learning”, Nature. [40,000+ citations]

Goodfellow et al. (2016), “Deep Learning”, MIT Press. [20,000+ citations]

Hornik et al. (1989), “Multilayer feedforward networks are universal approximators”, Neural Networks. [25,000+ citations]

Rosenblatt (1958), “The Perceptron: A Probabilistic Model for Information Storage”, Psychological Review. [Foundational paper]