KI-Governance

Governance ist die Straße, nicht die Bremsschwelle.

Der häufigste Fehlerfall bei der Einführung regulierter KI ist, Governance als Reibung zu behandeln. Der Rahmenwechsel, der es zum Laufen bringt.

Von Bamidele Aly 6 Min. Lesezeit Mai 2026

Zwei Lager, die nicht zusammenarbeiten können

Der Großteil der „KI für die Finanzwelt"-Ratschläge zerfällt in zwei Lager. Im ersten sind Ingenieure, die nicht verstehen, warum die Aufseher nervös sind. Sie schreiben Proofs of Concept, die zeigen, was technisch möglich ist, und gehen davon aus, dass die Bereitstellungsfrage „Change Management" sei. Im zweiten sind Risikoprofis, die nicht verstehen, was die Technik tatsächlich kann. Sie schreiben Rahmen, die Anwendungsklassen verbieten, die die Technik längst hinter sich gelassen hat.

Beide Lager veröffentlichen dann Rahmen, die das jeweils andere Lager nicht nutzen kann. Das erste behandelt jedes Modell als einzelnes auslieferbares Artefakt und ignoriert die aufsichtliche Pipeline. Das zweite behandelt jedes Modell als Blackbox und verlangt Kontrollen, die — wörtlich angewandt — den Einsatz jedes nicht-deterministischen Systems verbieten. Beide scheitern bei der ersten Aufsichtsbegehung, nur in entgegengesetzter Richtung.

Der Weg hindurch ist weder Tempo noch Vorsicht; es ist der richtige Rahmen dafür, wozu die Kontrollen dienen.

Die eigentliche Frage

Die Frage, die zählt, wenn generative KI in einen regulierten Finanzprozess eintritt, ist nicht „Ist das Modell gut genug?". Sie lautet „Kann ein Aufseher nachvollziehen, was geschehen ist?". Das verschiebt die Kontrollfläche.

In einem KI-freien Ablauf sitzen die Kontrollen am Menschen. Der Name des Reviewers steht auf der Akte; die Akte verweist auf die Quelldokumente; die Quelldokumente sind versioniert. Ein Aufseher kann im Nachhinein rekonstruieren, was bedacht und entschieden wurde. Die Re-Review der menschlichen Arbeit ist die Kontrolleinheit.

Wenn ein Modell die Offenlegung entwirft, bricht das. Die Ausgabe des Modells ist nicht sein Reasoning. Der Prompt ist eine Eingabe unter vielen; das Fine-Tuning-Korpus eine zweite; der Systemprompt eine dritte; die Temperatur eine vierte. Nichts davon ist in der Offenlegung selbst sichtbar. Die Kontrollfläche muss sich also verschieben: vom Prüfen der Arbeit zum Prüfen des Modellverhaltens um die Arbeit herum.

Drei Dinge müssen nachvollziehbar werden: Herkunft der Eingaben, Entscheidungspfad, Versionsgeschichte der Ausgaben. Alles andere scheitert, sobald ein Aufseher sich mit dem Artefakt hinsetzt und fragt: „Wie kam dieser Absatz zustande?".

Die Frage lautet nicht „Ist das Modell gut genug?". Sie lautet „Kann ein Aufseher nachvollziehen, was geschehen ist?".

Praktische Instrumente

Drei, die wirklich Arbeit leisten. Risikobasierte Klassifizierung: Nicht jede KI ist gleich. Ein LLM, das ein Memo zur Freigabe durch einen Senior entwirft, gehört in eine andere Risikoklasse als ein Modell, das Kreditrisiken scort, das wiederum in eine andere Klasse als eines, das die Eigenmittel beeinflusst. Das Erste braucht Entwurfs-Review-Kontrollen; das Zweite laufende Performance-Überwachung; das Dritte vollwertige Modellrisiko-Governance. Der Fehler ist, ein einziges Kontrollset überall anzuwenden.

Das AI Project Canvas: ein einseitiges Artefakt, das das Team zwingt, vor der ersten Codezeile zu erklären, was das Modell tun wird, wer es prüft, wie der auditierbare Pfad aussieht und was geschieht, wenn es falsch antwortet. Als Dokumenttyp ist es nicht neu — jede Aufsicht hat ein Pendant —, aber die Disziplin, es als ersten Designschritt auszufüllen, statt als letzten Compliance-Schritt, ändert, welche Projekte überhaupt starten.

Aufsichtliche Anschlussfähigkeit: Kontrollen so entwerfen, dass sie zu dem passen, wonach Aufseher bereits suchen, in deren Vokabular. PRA, FCA, EZB und OCC haben Erwartungen an Modellrisiken veröffentlicht, die der generativen KI um ein Jahrzehnt vorausgehen. Die Kontrollen eines LLM-basierten Beratungswerkzeugs müssen sauber auf SS1/23 oder SR 11-7 abbilden. Tun sie das nicht, ist die Lücke zwischen dem, was das Team meint gebaut zu haben, und dem, was die Aufsicht erwartet, exakt die Lücke, in der der Audit landen wird.