Reportage: Warum drei von vier KI-Projekten scheitern

Es klang so vielversprechend: Generative KI würde Prozesse revolutionieren, Kosten senken, ganze Geschäftsmodelle transformieren. Zwei Jahre nach dem ChatGPT-Moment investieren Unternehmen weltweit Hunderte Milliarden Dollar in KI-Projekte. Doch die Ernüchterung kommt schneller als die Rendite. Eine aktuelle Gartner-Erhebung unter 782 IT-Führungskräften zeigt: Nur 28 Prozent der KI-Projekte in der IT-Infrastruktur erreichen ihre ROI-Ziele vollständig — 20 Prozent scheitern komplett. Der Rest dümpelt irgendwo dazwischen. Noch drastischer fällt das Urteil einer MIT-Studie vom Sommer 2025 aus: 95 Prozent aller generativen KI-Pilotprojekte liefern keinen messbaren Beitrag zum Unternehmensergebnis. Was läuft schief — und was machen die wenigen Gewinner anders?

Das Pilotprojekt-Fegefeuer

In der Branche hat sich ein treffender Begriff für das Phänomen etabliert: „Pilot Purgatory“ — das Fegefeuer der Pilotprojekte. Unternehmen starten begeistert einen KI-Prototyp, erzielen in der kontrollierten Laborumgebung vielversprechende Ergebnisse und scheitern dann am Übergang in den produktiven Betrieb. Von 33 gestarteten KI-Piloten schaffen es im Schnitt nur vier bis in die Produktion — eine Ausfallquote von 88 Prozent beim Skalieren.

Das Modell ist fast nie das Hauptproblem. — Alex Potapov, Senior Consultant, NTT DATA

Die Gründe sind selten technischer Natur. Die eigentlichen Stolpersteine: unvorbereitete Daten, unklare Zuständigkeiten und Architekturen, die „nie dafür gebaut waren, die Präsentation zu überleben.“ Laut McKinseys State-of-AI-Bericht 2025 nutzen zwar 88 Prozent der befragten Unternehmen KI in mindestens einer Geschäftsfunktion — ein Anstieg von 78 Prozent im Vorjahr. Doch fast zwei Drittel haben noch nicht einmal begonnen, KI unternehmensweit zu skalieren. Nur 39 Prozent der Befragten sehen überhaupt einen messbaren Einfluss auf das Betriebsergebnis (EBIT). Und die Gruppe der „AI High Performers“, also jener 5,5 Prozent der Unternehmen, die mehr als fünf Prozent ihres EBIT auf KI zurückführen, bleibt eine exklusive Minderheit.

Die Realitätslücke: Warum Erwartungen und Ergebnisse auseinanderklaffen

Die Zahlen offenbaren eine fundamentale Diskrepanz zwischen Investitionsbereitschaft und tatsächlichem Ertrag. Laut Deloittes „State of AI in the Enterprise 2026“ haben 85 Prozent der Unternehmen ihr KI-Budget im vergangenen Jahr erhöht, 91 Prozent planen weitere Steigerungen. Gleichzeitig berichten mehr als 80 Prozent der Organisationen von keinem messbaren EBIT-Effekt durch generative KI.

Ein zentrales Problem: die fehlende Erfolgsmessung. Die MIT-Studie fand heraus, dass 61 Prozent der KI-Projekte auf Basis von projizierten Wertschätzungen genehmigt wurden, deren tatsächliche Einlösung nach dem Deployment nie formal überprüft wurde. Unternehmen geben Millionen für KI aus, ohne systematisch zu messen, ob sich die Investition lohnt.

Dazu kommt eine strategische Fehlallokation: Mehr als die Hälfte der GenAI-Budgets fließen in Vertriebs- und Marketing-Tools. Doch die MIT-Forscher identifizierten den größten ROI in einem ganz anderen Bereich — der Automatisierung von Back-Office-Prozessen. Dort, wo es um die Ablösung von Business Process Outsourcing, die Reduktion externer Agenturkosten und die Verschlankung operativer Abläufe geht, zeigt KI die stärkste Wirkung.

Ein weiterer blinder Fleck: die Build-vs.-Buy-Entscheidung. Unternehmen, die spezialisierte KI-Tools von Drittanbietern kaufen und Partnerschaften eingehen, erzielen in rund 67 Prozent der Fälle Erfolge. Eigenentwicklungen gelingen nur einem Drittel so oft. Dennoch setzen viele Organisationen auf kostspielige Eigenentwicklungen — oft getrieben vom Wunsch nach Differenzierung, der in der Praxis selten eingelöst wird.

Was die Gewinner anders machen

Doch es gibt sie, die Erfolgsgeschichten. Ein Stanford-Forschungsteam hat 51 erfolgreiche Enterprise-KI-Deployments analysiert und dabei klare Muster identifiziert. Der entscheidende Faktor war nie das KI-Modell — es war immer die Organisation.

Drei Beschleuniger kristallisierten sich heraus: aktive Unterstützung durch die Geschäftsleitung, bestehende Daten- und Technologie-Grundlagen sowie die Bereitschaft der Endnutzer, neue Werkzeuge tatsächlich einzusetzen. McKinsey bestätigt: Die KI-Vorreiter sind dreimal häufiger als andere Unternehmen durch starkes Engagement der Führungsebene gekennzeichnet — und zwar sowohl bei der Strategiedefinition als auch beim Vorleben der KI-Nutzung im Alltag.

Der wirkungsvollste Hebel überrascht: Von allen organisatorischen Veränderungen, die mit GenAI-Erfolg korrelieren, rangiert die grundlegende Neugestaltung von Arbeitsabläufen am höchsten. Wer KI einfach auf bestehende Prozesse aufsetzt, verschenkt Potenzial. Doch nur 21 Prozent der Unternehmen, die GenAI nutzen, haben bisher zumindest einige Workflows grundlegend überarbeitet.

Ein konkretes Beispiel aus der Stanford-Studie: Ein großes Fintech-Unternehmen setzte einen KI-Coding-Agenten ein, um Millionen Zeilen Legacy-Code auf eine moderne Architektur zu migrieren — das Projekt dauerte Wochen statt der veranschlagten Monate. Eine Großbank, die denselben Use Case verfolgte, kämpft dagegen seit Jahren mit der Umsetzung. Der Unterschied: nicht die Technologie, sondern die organisatorische Bereitschaft und Umsetzungsgeschwindigkeit.

Vier Lehren für die Praxis

Was können Entscheider aus diesen Erkenntnissen mitnehmen? Erstens: Messen statt hoffen. Wer KI-Projekte ohne definierte Erfolgskennzahlen und regelmäßige Überprüfung startet, investiert blind. Die 61 Prozent ungeprüfter ROI-Prognosen aus der MIT-Studie sind ein Alarmzeichen.

Zweitens: Klein starten, aber richtig skalieren. Der Weg aus dem Pilotprojekt-Fegefeuer führt über produktionsreife Dateninfrastruktur, klare Ownership und MLOps-Fähigkeiten. Gartner prognostiziert, dass 60 Prozent der KI-Projekte bis 2026 an fehlender „AI-ready Data“ scheitern werden.

Drittens: Prozesse neu denken, nicht nur automatisieren. Die erfolgreichsten Unternehmen nutzen KI nicht als Turbo für bestehende Abläufe, sondern als Anlass, Workflows fundamental zu überdenken. Das erfordert Change Management und die Einbindung der Mitarbeitenden — nicht nur ein IT-Projekt.

Viertens: Kaufen vor Bauen. Eigenentwicklungen lohnen sich nur dort, wo echte Differenzierung entsteht. Für Standardanwendungen sind spezialisierte Anbieter im Vorteil — und die Erfolgsquote ist doppelt so hoch.

Die generative KI-Revolution findet statt. Aber sie belohnt nicht jene, die am lautesten investieren — sondern jene, die am klügsten implementieren. Der durchschnittliche ROI für Unternehmen, die es von der Pilotphase in die produktive Skalierung schaffen, liegt laut Deloitte bei 1,7x mit Kosteneinsparungen von 26 bis 31 Prozent. Das Potenzial ist real. Die Frage ist nicht, ob KI funktioniert — sondern ob die Organisation bereit ist, sich zu verändern.

Die Ernüchterung nach dem Hype — Warum drei von vier KI-Projekten ihre Ziele verfehlen

Das Pilotprojekt-Fegefeuer

Die Realitätslücke: Warum Erwartungen und Ergebnisse auseinanderklaffen

Was die Gewinner anders machen

Vier Lehren für die Praxis