Die neue Parität

76 Prozent der Unternehmen, die große Sprachmodelle einsetzen, nutzen Open-Source-Modelle — häufig parallel zu proprietären Alternativen. Das zeigt: Die Frage ist längst nicht mehr „ob“, sondern „wie“. Was vor zwölf Monaten ein globales Top-5-Modell gewesen wäre, gibt es heute als Open-Weight-Download. Alibabas Qwen 3.5 mit 9 Milliarden Parametern schlägt auf mehreren Benchmarks OpenAIs GPT-oss-120B — und läuft auf einem handelsüblichen Laptop. Xiaomis MiMo-V2-Pro, erst letzte Woche vorgestellt, erreicht mit einer Billion Parametern und 42 Milliarden aktiven Parametern einen ClawEval-Score von 61,5 — nahe an Claude Opus 4.6. Die Kosten: ein Siebtel westlicher Modelle.

Doch „nahe dran“ ist nicht „gleichauf“. Auf dem Intelligence Index von LM Council führen proprietäre Modelle weiterhin: Gemini 3.1 Pro und GPT-5.4 erreichen 57 Punkte, das beste Open-Weight-Modell (GLM-5 Reasoning) kommt auf 50. Beim SWE-Bench, dem wichtigsten Coding-Benchmark, hält Claude Opus 4.5 mit 80,9 Prozent den Rekord. Die Lücke schrumpft — aber sie existiert, besonders bei den anspruchsvollsten Aufgaben.

Was „Open Source“ wirklich bedeutet

Der Begriff „Open Source“ ist in der KI-Welt zum Kampfbegriff geworden. Die Open Source Initiative (OSI) hat im Oktober 2024 eine formale Definition veröffentlicht: Echte Open-Source-KI erfordert Dateninformationen, vollständigen Quellcode UND offene Gewichte. Nach dieser Definition sind Metas Llama-Modelle — die bekanntesten „Open-Source“-Modelle — streng genommen nicht Open Source.

Llamas Lizenz verbietet die Nutzung durch Unternehmen mit über 700 Millionen monatlich aktiven Nutzern ohne Metas Genehmigung. Die Free Software Foundation stufte Llama 3.1 im Januar 2025 als „nicht frei“ ein. Auf der anderen Seite stehen Alibabas Qwen-Modelle und die geplante DeepSeek-V4-Veröffentlichung unter Apache 2.0 — einer echten Open-Source-Lizenz, die volle kommerzielle Nutzung, Modifikation und Weiterverbreitung erlaubt.

Für Unternehmen ist diese Unterscheidung alles andere als akademisch. Wer Llama in ein Produkt einbaut, braucht eine juristische Prüfung. Wer Apache-2.0-Modelle nutzt, hat Rechtssicherheit. In einer Branche, in der KI-Modelle zunehmend Kernbestandteile von Produkten werden, kann die Lizenzfrage über die Architektur entscheiden.

Die Kostenrechnung — komplizierter als gedacht

Die naive Annahme „Open Source ist kostenlos“ hält der Praxis nicht stand. Ein „kostenloses“ Open-Source-Modell kann Unternehmen über 500.000 Dollar pro Jahr an Engineering-Aufwand kosten — für Infrastruktur, Feinabstimmung, Monitoring und Updates. Bei geringem Tokenvolumen sind APIs schlicht günstiger: GPT-5-mini kostet 0,125 Dollar pro Million Input-Tokens, und der Engineering-Overhead entfällt.

Die Rechnung kippt bei hohem Volumen. Organisationen, die über 100 Millionen Tokens pro Tag verarbeiten, können durch Self-Hosting zwischen 5 und 50 Millionen Dollar jährlich sparen. Der Break-even-Punkt liegt typischerweise bei 5 bis 10 Millionen Tokens pro Monat für Premium-Modelle, oder ab 50.000 täglichen Anfragen.

Doch der wichtigste Kostenfaktor ist nicht der Token-Preis: Es ist die Datensouveränität. Für europäische Unternehmen unter der DSGVO kann Self-Hosting die einzige Option sein, wenn sensible Daten verarbeitet werden. Gestern erst veröffentlichten Mistral (Voxtral TTS, Text-to-Speech) und Cohere (Transcribe, Spracherkennung) Open-Source-Modelle, die explizit für den datenschutzkonformen Einsatz auf eigener Infrastruktur konzipiert sind — beide laufen auf Consumer-Hardware.

Warum Big Tech verschenkt

Jeder der großen Open-Source-Anbieter hat eine andere strategische Motivation. Meta finanziert die KI-Entwicklung aus Werbeeinnahmen und „sozialisiert“ die Kosten mit der Community. Llama treibt das Meta-AI-Ökosystem (WhatsApp AI, Instagram AI) und lenkt Deployments auf Metas Cloud-Partnerschaften.

Alibaba verknüpft Qwen direkt mit der Alibaba-Cloud-Expansion — wer Qwen nutzt, landet häufig auf Alibaba-Cloud-Infrastruktur. Mistral positioniert sich als europäischer KI-Champion, der mit EU-Datensouveränität und Enterprise-Services Geld verdient.

Die gemeinsame Logik: Die Modellschicht wird zur Commodity. Wer sie verschenkt, gewinnt Einfluss auf die Schichten darüber (Orchestrierung, Anwendungen, Ökosystem) oder darunter (Compute, Hardware). Stanfords HAI AI Index 2026 bestätigt: Jedes Mal, wenn ein starkes Open-Source-Modell erscheint, fallen die API-Preise der proprietären Anbieter innerhalb von Wochen.

Was das für Entscheider bedeutet

Die Koexistenz-These hat sich durchgesetzt — es wird keinen einzelnen Gewinner geben. Für Unternehmen ergeben sich daraus drei pragmatische Leitlinien:

Erstens: Hybrid-Architektur ist der Standard. Sensible Workloads auf selbst gehosteten Open-Source-Modellen, weniger kritische Aufgaben über proprietäre APIs. Das bietet Datensouveränität, wo nötig, und Spitzenqualität, wo verfügbar.

Zweitens: Die Modellwahl ist keine langfristige Entscheidung mehr. Modelle werden austauschbar, der Wettbewerbsvorteil liegt in den Daten, der Orchestrierungsschicht und den domänenspezifischen Feinabstimmungen. Wer sich auf ein einziges Modell festlegt, baut auf Sand.

Drittens: Europa hat durch Open Source eine einmalige Chance. Mistral, Qwen und die kommende DeepSeek-V4-Generation unter Apache 2.0 ermöglichen es europäischen Unternehmen, erstklassige KI einzusetzen, ohne Daten an US-Cloud-Anbieter zu senden. Die partiellen Ausnahmen des EU AI Act für Open-Source-Modelle verstärken diesen Vorteil.

Die KI-Industrie folgt einem bekannten Muster: Wie einst bei Betriebssystemen (Linux vs. Windows) oder Datenbanken (PostgreSQL vs. Oracle) wird Open Source die Basisschicht dominieren — während proprietäre Anbieter sich über Qualität, Integration und Service differenzieren. Der echte Wettbewerb findet nicht zwischen Modellen statt, sondern zwischen den Ökosystemen, die auf ihnen aufgebaut werden.