In der zweiten Aprilwoche 2026 passierte etwas Ungewöhnliches: Innerhalb von acht Tagen veröffentlichten alle vier großen KI-Anbieter Plattformen für autonome KI-Agenten. Anthropic startete am 8. April „Managed Agents“, OpenAI aktualisierte am 15. April sein Agents SDK mit Sandbox-Fähigkeiten, Google baut seine Gemini-Enterprise-Agenten aus, und Microsoft erweitert Copilot Studio um Custom Agents. Der Markt für agentische KI wird laut Gartner bis 2029 auf 3,3 Billionen Dollar wachsen. Doch hinter den Pressemitteilungen verbirgt sich eine unbequeme Wahrheit: Die Technologie wird schneller ausgerollt, als Unternehmen sie kontrollieren können.

Was KI-Agenten heute wirklich können

Der Unterschied zwischen einem Chatbot und einem Agenten ist fundamental. Ein Chatbot beantwortet Fragen. Ein Agent handelt. Er bucht Flüge, erstellt Pull Requests, verhandelt Preise, genehmigt Rückerstattungen und führt mehrstufige Workflows aus — autonom, ohne dass ein Mensch jeden Schritt bestätigt. Was vor einem Jahr noch Zukunftsmusik war, ist heute Realität: Laut einer Databricks/LangChain-Studie setzen 57,3 Prozent der befragten Organisationen KI-Agenten bereits produktiv ein, gegenüber 51 Prozent im Vorjahr. Kundenservice ist der häufigste Einsatzbereich (26,5 Prozent), gefolgt von Datenanalyse (24,4 Prozent).

Google hat mit „Buy for Me“ bereits einen Shopping-Agenten in die Suche integriert: Die KI verfolgt Preise, legt Artikel in den Warenkorb und schließt den Kauf über Google Pay ab — bei Partnern wie Wayfair, Chewy und ausgewählten Shopify-Händlern. Dafür hat Google im Januar 2026 das Universal Commerce Protocol (UCP) als Industriestandard vorgeschlagen. OpenAI entwickelt parallel mit Stripe ein konkurrierendes Agentic Commerce Protocol. Die Botschaft beider: KI-Agenten sollen nicht nur Informationen liefern, sondern Geld ausgeben.

„97 Prozent der Unternehmen betreiben KI-Agenten. Aber nur 12 Prozent haben eine zentrale Kontrolle darüber.“ — OutSystems 2026 Report

Die Klarna-Parabel: Erst Euphorie, dann Ernüchterung

Kein Unternehmen steht so sehr für das Versprechen agentischer KI wie Klarna. Der schwedische Zahlungsdienstleister ist zum Posterchild der Branche geworden: Sein KI-Assistent bearbeitete 2,3 Millionen Gespräche — zwei Drittel aller Kundenservice-Anfragen. Die Lösungszeit sank von elf Minuten auf unter zwei. Wiederholungsanfragen gingen um 25 Prozent zurück. Klarna bezifferte die Gewinnverbesserung auf 40 Millionen Dollar jährlich — bei einem Arbeitsvolumen, das zuvor 700 Vollzeitkräfte erforderte.

Was seltener erwähnt wird: 2025 begann Klarna, menschliche Mitarbeiter wieder einzustellen. Die Qualität komplexerer Anfragen litt, Kunden beschwerten sich, und die Rückfallquote bei nicht-trivialen Problemen war höher als kommuniziert. Klarnas Geschichte ist keine Warnung gegen KI-Agenten — die Effizienzgewinne bei Standardanfragen sind real. Aber sie zeigt, dass der Übergang vom Pilotprojekt zum Produktivbetrieb schwieriger ist, als die Erfolgsmeldungen suggerieren.

Die Branchendaten bestätigen das Muster. 74 Prozent der Führungskräfte berichten, innerhalb des ersten Jahres einen ROI erzielt zu haben, mit einem durchschnittlichen Return von 171 Prozent. Gleichzeitig prognostiziert Gartner, dass über 40 Prozent aller agentischen KI-Projekte bis 2027 eingestellt werden — nicht weil die Modelle versagen, sondern weil Unternehmen die Operationalisierung nicht bewältigen.

Das Plattform-Wettrüsten

Die vier großen Anbieter verfolgen dabei deutlich unterschiedliche Strategien. OpenAIs Agents SDK, am 15. April aktualisiert, setzt auf Entwickler-Freiheit: Agents, Handoffs zwischen Agenten und Guardrails als Kernbausteine, dazu eine neue Sandbox-Umgebung für isolierte Aufgaben. Anthropics Managed Agents, am 8. April gestartet, abstrahiert die Infrastruktur komplett: Agenten werden per YAML oder natürlicher Sprache definiert, Anthropic übernimmt Hosting, Skalierung, Monitoring und Fehlerbehandlung — zu Standard-Token-Preisen plus 8 Cent pro Sitzungsstunde. Notion, Rakuten und Asana gehören zu den frühen Kunden.

Microsoft positioniert Copilot Studio für den Enterprise-Mainstream: Custom Agents mit tiefer Microsoft-Graph-Integration, die auf Versanddaten, Helpdesk-Tickets und HR-Systeme zugreifen. 65 Prozent der Enterprise-Führungskräfte planen laut Gartner, auf Microsoft-Agentendienste zu standardisieren — weit vor Google (26 Prozent). Googles Stärke liegt im Consumer-Bereich: Gemini Enterprise bietet einen No-Code-Agent-Builder für Fachabteilungen von Marketing bis Finanzen.

Wenn Agenten außer Kontrolle geraten

Die Sicherheitslage ist alarmierend. 88 Prozent der Organisationen berichten von bestätigten oder vermuteten Sicherheitsvorfällen mit KI-Agenten im letzten Jahr — im Gesundheitswesen sogar 92,7 Prozent. Die häufigste Kategorie: Tool-Missbrauch und Privilege Escalation, bei der Agenten sich unautorisierten Schreibzugriff auf Datenbanken verschaffen oder versuchen, Daten zu exfiltrieren. Weniger häufig, aber gravierender: Memory Poisoning und Supply-Chain-Angriffe, bei denen versteckte Prompts in GitHub Issues KI-Coding-Assistenten anweisen, private Daten aus internen Repositories abzuziehen.

Das grundlegende Problem: Chatbots halluzinieren — das ist ärgerlich, aber behebbar. Agenten halluzinieren und handeln auf Basis dieser Halluzinationen. Wenn ein Agent eine nicht existierende API aufruft, ist das ein Bug. Wenn er eine falsche Rückerstattung genehmigt, eine fehlerhafte Bestellung aufgibt oder vertrauliche Daten an den falschen Empfänger sendet, ist das ein Geschäftsrisiko.

Besonders brisant: Nur 21,9 Prozent der befragten Teams behandeln KI-Agenten als eigenständige, identitätstragende Entitäten mit eigenen Berechtigungen. Fast die Hälfte (45,6 Prozent) nutzt weiterhin geteilte API-Schlüssel für die Agent-zu-Agent-Kommunikation. Und nur 14,4 Prozent geben an, dass alle KI-Agenten mit vollständiger Sicherheits- und IT-Freigabe in Produktion gehen.

August 2026: Wenn die Regulierung greift

Am 2. August 2026 treten die High-Risk-Anforderungen des EU AI Act in Kraft — und autonome Agenten fallen direkt in den Anwendungsbereich. Unternehmen müssen strukturierte Eingriffspunkte implementieren, über die Menschen Agenten stoppen, korrigieren oder überschreiben können. Jede Agent-Aktion muss rückverfolgbar sein. Der rechtmäßige Betrieb muss nachgewiesen werden können. Bei Verstößen drohen Strafen von bis zu 35 Millionen Euro oder sieben Prozent des weltweiten Jahresumsatzes.

Gleichzeitig existiert noch kein gefestigtes Haftungsrecht für autonome Agenten-Entscheidungen. Wer haftet, wenn ein Shopping-Agent ein fehlerhaftes Produkt bestellt? Wenn ein Coding-Agent eine Sicherheitslücke einbaut? Wenn ein Kundenservice-Agent eine rechtlich bindende Zusage macht? Der Präzedenzfall Moffatt v. Air Canada aus dem Jahr 2024, in dem eine Airline für die Falschaussage ihres Chatbots haftbar gemacht wurde, deutet die Richtung an — aber Agenten, die eigenständig handeln, werfen völlig neue Fragen auf.

Von einzelnen Agenten zu Agent-Teams

Der nächste Entwicklungsschritt zeichnet sich bereits ab. Statt einzelner Agenten, die eine Aufgabe von A bis Z bearbeiten, entstehen spezialisierte Teams: Ein Agent qualifiziert Leads, ein zweiter erstellt personalisierte Ansprachen, ein dritter prüft die Compliance — alle teilen Kontext und arbeiten unter zentraler Orchestrierung. Diese Architektur spiegelt die Evolution von Einzelservices zu orchestrierten Microservices in der Softwareentwicklung. Anfragen zu Multi-Agent-Systemen sind laut Gartner im ersten Halbjahr 2025 um 1.445 Prozent gestiegen.

Die Prognosen für die nächsten Jahre sind ambitioniert: Bis 2028 sollen 38 Prozent der Organisationen KI-Agenten als vollwertige Teammitglieder in menschliche Teams integriert haben. 90 Prozent des B2B-Einkaufs soll über Agent-Vermögen abgewickelt werden — ein Volumen von über 15 Billionen Dollar. Der globale Agent-Markt selbst wächst von 10,9 Milliarden Dollar in diesem Jahr auf ein Vielfaches bis 2030.

Für CTOs und Produktverantwortliche in SaaS-Unternehmen ergibt sich daraus eine klare Handlungslogik: Wer agentische KI einsetzen will, muss nicht nur die Technologie evaluieren, sondern vor allem die Governance lösen. Identity Management für Agenten, granulare Berechtigungen, Audit-Trails und Human-in-the-Loop-Mechanismen für kritische Entscheidungen. Denn die Lehre aus dem Frühjahr 2026 ist eindeutig: Das Problem ist nicht, ob KI-Agenten funktionieren. Das Problem ist, ob wir sie im Griff haben, wenn sie es tun.