← Zurück zum Glossar

Harness

Definition

Strukturierte Software-Schicht, die ein AI-Modell mit der Außenwelt verbindet — durch definierte Eingaben, Tool-Aufrufe, Eval-Routinen, Sicherheitsprüfungen und Output-Verarbeitung. Im Jahr 2026 wird der Begriff in zwei Hauptkontexten verwendet: als Eval Harness (systematische Test-Infrastruktur, etwa lm-evaluation-harness oder OpenAI Evals) und als Agent Harness (Laufzeit-Scaffolding, das ein Modell zu einem agentischen System macht — Tool-Aufrufe, Memory, Eskalationspfade).

Noise — Signal

Wenn Anbieter "wir liefern Foundation Model X" sagen, ist das nur die halbe Wahrheit — Qualität und Sicherheit eines produktiven Systems entstehen zu einem erheblichen Teil im umgebenden Harness. Zwei Anwendungen mit identischem Modell können sehr unterschiedliche Ergebnisse liefern, je nachdem, wie der Harness Tools verfügbar macht, Kontext kuratiert, Halluzinationen abfängt und Eval-Schleifen einbaut. Die häufige Verkürzung im Markt: das Modell wird gekauft, der Harness wird "irgendwie selbst gebaut". Genau dort entstehen Lock-in, Sicherheitslücken und Migrations-Risiko.

Die richtige Frage

Nicht: "Welches Modell setzen wir ein?" Sondern: "Welche Komponenten unseres Harness — Tool-Routing, Kontext-Kuratierung, Eval-Loop, Guardrails, Eskalation — bauen wir selbst, kaufen wir zu, und wo entsteht Lock-in, wenn wir das Modell wechseln wollen?"

← Zurück zum Glossar