Das KI-Phone-Rennen 2026: Warum jetzt alle ein eigenes Gerät wollen — und was Apple, OpenAI, Google und Microsoft daraus lernen sollten

Eine Woche, vier Ankündigungen, ein Bild

Es kommt selten vor, dass sich vier strategische Schachzüge so konsequent in eine Linie sortieren. Innerhalb von 72 Stunden Anfang Mai 2026 wurde aus einer diffusen Hardware-Diskussion ein klares Bild. Apple zahlte 250 Millionen Dollar Schadensersatz dafür, dass die auf der WWDC 2024 versprochene „personalized Siri“ nie funktionierte. Bloomberg bestätigte, dass Apple in iOS 27 erstmals Drittanbieter-LLMs wie Claude und Gemini als Default-Wahl in Siri, Writing Tools und Image Playground zulässt. Google-Cloud-Chef Thomas Kurian hatte bereits Ende April auf der Cloud Next 2026 in Las Vegas eingeräumt, dass ein 1,2-Billionen-Parameter-Custom-Gemini künftig als Reasoning-Backbone der neuen Siri arbeitet. Apple-Analyst Ming-Chi Kuo berichtete in derselben Woche, dass OpenAI sein eigenes Smartphone fast-trackt — mit einem maßgeschneiderten MediaTek-Chip, im 2-Nanometer-Prozess, mit Massenproduktion ab H1 2027 und einer Stückzahlplanung von 30 Millionen Geräten für 2027 und 2028. Und Microsofts neue Xbox-Chefin Asha Sharma beerdigte am gleichen Tag den Gaming Copilot — 14 Monate nach der Ankündigung.

Wer diese vier Meldungen zusammenliest, sieht das Drehbuch der nächsten zwei Jahre Smartphone-Industrie. Es geht nicht mehr um das Gerät. Es geht um das Modell, das im Gerät steckt — und wer dieses Modell stellt.

Was die Pioniere uns gelehrt haben

Vor zwei Jahren startete eine Welle dedizierter KI-Geräte mit dem Versprechen, das Smartphone als zentrales Computing-Interface abzulösen. Das Ergebnis ist ernüchternd. Humane AI Pin, im April 2024 für 699 Dollar plus 24-Dollar-Monatsabo gestartet, sammelte zur Spitzenzeit eine Bewertung von einer Milliarde Dollar ein. HP kaufte die Reste im Februar 2025 für 116 Millionen — knapp zwölf Prozent der Spitzenbewertung. Das Pin-Gerät wurde am 28. Februar 2025 deaktiviert, ohne Refund. Der YouTuber Marques Brownlee nannte es „eines der schlechtesten Produkte, die ich je reviewed habe“, und ab Sommer 2024 überstieg die Return-Rate die Verkaufsrate. Rabbit R1, der zweite Pionier, verkaufte über 100.000 Einheiten und generierte 20 Millionen Dollar Revenue in den ersten Monaten 2024 — und stagnierte dann. Im Herbst 2025 schwenkte Rabbit auf eine Perplexity-Partnership für Echtzeit-Suche um, lieferte OTA-Updates aus, blieb aber kommerziell irrelevant.

Der dritte Versuch, Friend.com vom 23-jährigen Avi Schiffmann, hat den klarsten Lehrwert. Schiffmann investierte 1 Million Dollar in eine NYC-Subway-Werbekampagne mit 11.000 Plakatflächen im September 2025 — und verkaufte rund 3.000 Einheiten zu 129 Dollar; ausgeliefert wurden gut 1.000. Die Plakate wurden in Manhattan flächendeckend mit Anti-Surveillance-Slogans beschrieben. Reviews dokumentierten Latenzen von sieben bis zehn Sekunden, ein Gerät, das nach 1,5 Wochen die Namen seiner Besitzer vergisst, und Privacy-Klauseln, die passive Audio- und Videoaufzeichnung erlauben. Schiffmanns Reaktion: „Capitalism is the greatest artistic medium.“

Die drei Geräte scheiterten an drei Achsen. Erstens am Ecosystem-Defizit — kein App-Layer, kein Entwickler-SDK, keine Integration in bestehende Workflows. Zweitens an Latenz und Reliability — Cloud-Abhängigkeit machte die Geräte langsam und unzuverlässig. Drittens am Use-Case — keine der drei Lösungen erledigte etwas spürbar besser als „Phone plus ChatGPT-App“. Die Lehre, die alle drei verbindet, formulierte ein Kommentator des Verge präzise: Standalone-AI-Hardware muss nicht „besser als nichts“ sein, sondern „besser als ein Smartphone“. Niemand schaffte das.

Apples 180-Grad-Wende

Apple hat aus diesen Erfahrungen die unbequeme Konsequenz gezogen — nicht das eigene Gerät zu ersetzen, sondern den eigenen Stack aufzubrechen. Drei Bausteine machen die Wende sichtbar.

Erstens: das Settlement über 250 Millionen Dollar. Es ist juristisch ein Vergleich, kommunikativ ein Eingeständnis, dass das WWDC-2024-Versprechen einer kontextbewussten, App-übergreifenden Siri nicht haltbar war. Anspruchsberechtigt sind US-Käufer von iPhone 15 Pro bis 16 Pro Max zwischen Juni 2024 und März 2025; pro Gerät zahlt Apple 25 bis 95 Dollar. Hinter der überschaubaren Summe steht ein größerer Reputationsschaden: Apple hat 18 Monate lang öffentlich vorgegeben, ein Produkt liefern zu können, das es intern bereits aufgegeben hatte.

Zweitens: das iOS-27-„Extensions“-System. Bloombergs Mark Gurman beschreibt einen Mechanismus, der Drittanbieter-LLMs als Default-Wahl in den systemweiten Apple-Intelligence-Funktionen zulässt — Siri, Writing Tools, Image Playground, jeweils konfigurierbar pro Anfragentyp. Heute ist nur OpenAI ChatGPT in iOS 26 integriert; in iOS 27 sollen Google Gemini, Anthropic Claude und xAI Grok dazukommen. Sogar separate Stimmen für die jeweiligen Modelle sind geplant — „damit klar ist, ob Siri oder Gemini gerade antwortet“. Vorstellung WWDC 8. Juni 2026, Release September 2026 mit dem iPhone 18.

Drittens: Custom-Gemini als Reasoning-Backbone. Auf der Google Cloud Next 2026 bestätigte Thomas Kurian die Partnerschaft. Apple lizenziert ein 1,2-Billionen-Parameter-Modell von Google, hostet es auf eigener Hardware in Private Cloud Compute und reicht komplexes Reasoning an dieses Modell weiter. Bloomberg-Berichte aus November 2025 nennen Kosten in Höhe von rund einer Milliarde Dollar pro Jahr. Die Architektur ist dreischichtig: einfache Tasks on-device (Apple Foundation Models), mittlere auf Private Cloud Compute, komplexes Reasoning auf dem Custom-Gemini.

Wer Apples Geschichte kennt, weiß, was diese Entscheidung kostet. Apple hat die Plattform-Kontrolle als Markenkern gepflegt — vom A-Series-Chip über das eigene Mapping bis zum Sicherheitsmodell. Jetzt wird Google die unsichtbare KI-Schicht stellen, die jede Antwort von Siri prägt. Wedbush-Analyst Dan Ives sieht darin einen pragmatischen Realismus, der die Apple-Aktie wieder beleben könnte — sie steht für 2026 minus sieben Prozent. Daring-Fireball-Blogger John Gruber warnt im Gegenzug, Apple gebe damit den historisch wertvollsten Hebel des iPhones aus der Hand: die Kontrolle über die Default-Schnittstelle, an der Customer-Acquisition für jede App entschieden wird.

OpenAIs Doppelwette

OpenAI fährt die spiegelbildliche Strategie. Wer das beste Modell baut, will nicht von fremden Geräten abhängig sein, auf denen er nicht das Default-LLM stellt. Die Konsequenz ist eine doppelte Hardware-Wette: das MediaTek-Phone für den vertrauten Smartphone-Formfaktor und der Jony-Ive-Smart-Speaker für eine neue Geräteklasse.

Das MediaTek-Phone ist der pragmatischere Teil. Custom-Dimensity-9600 in TSMC-N2P-Process (2 Nanometer), Dual-NPU-Architektur, LPDDR6, UFS 5.0, pKVM für Security. Ming-Chi Kuo nennt zwei explizite Treiber: einen IPO-Narrativ für Ende 2026 und „intensifying competition in AI agent phones“. Die Wahl von MediaTek über Qualcomm signalisiert Customisierungsbereitschaft und einen weniger schweren Co-Branding-Anchor. Das Konzept geht über „Smartphone mit ChatGPT-App“ hinaus: OpenAI plant eine Agent-zentrierte UI, in der Apps durch Agents ersetzt werden — das Gerät erledigt Aufgaben, statt einzelne Apps zu starten.

Der Ive-Speaker ist die ambitioniertere Wette. Im Mai 2025 übernahm OpenAI io Products für rund 6,5 Milliarden Dollar in einem all-stock-Deal. Das Gerät — screenless, mit Kamera, Face-ID-ähnlicher Erkennung, Voice-Shopping — soll laut MacRumors auf Februar 2027 verschoben sein, bei einem Preispunkt von 200 bis 300 Dollar. Sam Altman beschrieb die Vision in einem CNBC-Interview im November 2025: ein Gerät, das sich anfühle wie „sitting in the most beautiful cabin by a lake … the peace and calm“. Ein expliziter Anti-iPhone-Pitch — und genau jene Vision, die Humane AI Pin nicht eingelöst hat.

Wieso jetzt zwei Geräte parallel? Die Antwort liegt im Distributionsproblem. ChatGPT hat Anfang 2026 rund 900 Millionen wöchentlich aktive Nutzer (verdoppelt von 400 Millionen ein Jahr zuvor). Aber die Verteilung läuft über fremde Geräte — vor allem iPhones und Android-Phones, auf denen Apple beziehungsweise Google das Default-LLM kontrollieren. Im Januar 2026 endete OpenAIs WhatsApp-Integration nach einer Meta-Policy-Änderung — ein Frühwarnsignal, wie verletzbar diese Distribution ist. Die OpenAI-Bewertung liegt bei 852 Milliarden Dollar (März 2026); ohne kontrollierte Hardware ist diese Bewertung struktur-fragil.

Was Microsoft, Google und China parallel tun

Microsoft ist der vierte Player, dessen Bewegung in dieser Woche ebenso aufschlussreich war wie das, was die anderen taten — nämlich ein Rückzug. Asha Sharma, die neue Xbox-CEO, stoppte den Gaming Copilot mobil und auf Konsole. Begründung: „refocusing our AI efforts to solving player problems like enhancing real-time graphics“. Übersetzt: Consumer-Devices sind nicht mehr Microsofts Schlachtfeld. Surface Copilot+ PCs floppten — Engadget zitiert „sales went practically nowhere“ —, der Xbox-Copilot wurde nach 14 Monaten beerdigt. Microsoft konzentriert sich consumer-seitig auf das, was funktioniert: Copilot als Enterprise-Subscription für Microsoft 365 mit aktuell rund 20 Millionen zahlenden Sitzen, Quartalswachstum 4-fach gegenüber Vorjahr.

Google fährt eine Doppelrolle. Das eigene Pixel-Lineup mit Gemini Nano on-device (1,8 bis 3,25 Milliarden Parameter, sub-100ms-Latenz) bedient den eigenen Hardware-Anspruch; gleichzeitig liefert Google das 1,2-Billionen-Parameter-Custom-Gemini an Apple und plant nach eigenen Roadmap-Aussagen die Gemini-Integration in 800 Millionen Galaxy-Geräte bis Ende 2026 (von 400 Millionen 2025). Samsung selbst hat seine Galaxy-AI-Brand-Awareness in einem Jahr von 30 auf 80 Prozent gesteigert; CEO Roh's Leitvision „Connect Future“ skizziert KI in jedem Samsung-Gerät vom Tablet bis zum Kühlschrank.

In China bauen Xiaomi und Huawei parallel ihre eigenen Stacks. Xiaomi launcht 2026 ein XRING-02-Smartphone mit Eigen-OS und einem leichten Eigen-LLM (MiLM); ein 6.500-GPU-Inception-Cluster trainiert die Modelle. Huawei und Xiaomi waren laut Digitimes die ersten Smartphone-Hersteller mit On-Device-LLMs, vor Apple. Die Strategie ist offen: Unabhängigkeit vom US-Stack, On-Device aus Privacy- und Souveränitäts-Gründen.

Der unerwartete Erfolg in dieser Landschaft ist Amazon Alexa+. Im Februar 2026 in den USA gestartet, bringt es laut Amazon 76 Prozent „unique tasks“ (also nicht-wiederholte Anfragen), 2- bis 3-fach mehr Konversationen als alte Alexa und Opt-out-Raten im niedrigen einstelligen Prozentbereich. Echo plus Alexa.com (Web) seit CES 2026 — ein zweiter Beleg, dass Voice-First funktioniert, wenn Distribution und Use-Case stimmen.

Warum jetzt — die strukturelle Analyse

Drei strukturelle Treiber konvergieren. Erstens die Karpathy-These vom „LLM OS“: Andrej Karpathy hat seit 2025 wiederholt argumentiert, das LLM werde nicht der Chatbot sein, sondern „the kernel process of a new Operating System“. Wenn das stimmt, kontrolliert wer das Default-Modell auf dem Gerät stellt, die gesamte User-Interaktion. Das ist die ökonomische Logik, die alle vier Player diese Woche getrieben hat.

Zweitens die MCP-Explosion. Das Model Context Protocol, von Anthropic 2024 vorgeschlagen und 2025 von OpenAI und Google adoptiert, ist von 1.200 Servern (Q1 2025) auf 9.400+ (Mitte April 2026) gewachsen — 7,8-fach in zwölf Monaten. Gartner schätzt, dass bis Ende 2026 40 Prozent der Enterprise-Apps task-spezifische Agents enthalten werden. Die Konsequenz für SaaS-Anbieter: Jede App wird zum MCP-Server hinter einem Phone-Agent. Die UI-Schicht verliert an Differenzierungswert; Differenzierung läuft über Daten, Aktionen und API-Zuverlässigkeit.

Drittens ist die Hardware endlich da. Flagship-NPUs schaffen 75 TOPS — genug für 7-Milliarden-Parameter-LLMs lokal. Gemini Nano läuft mit sub-100ms-Latenz. Aber: Thermische Constraints sind kritisch. Eine arXiv-Studie zeigt, dass das iPhone 16 Pro „nearly half its throughput within two iterations“ unter Sustained Load verliert. On-Device hat klare Limits — und genau hier kommen die Custom-Chips von OpenAI und die TPU-Inference-Backends von Google ins Spiel.

Was Tech-Entscheider mitnehmen sollten

Drei Konsequenzen sind für SaaS- und Tech-Entscheider praktisch handlungsleitend.

Erstens, Distribution verschiebt sich auf die LLM-Schicht. App-Store-Optimization war die letzten zehn Jahre die zentrale Customer-Acquisition-Disziplin. In den nächsten zwei Jahren wird die zentrale Disziplin „LLM-Default-Visibility“: Sind die eigenen APIs und Workflows in den Default-Agents von OpenAI, Google, Anthropic und Apple sauber referenziert? Nothing-CEO Carl Pei sagte auf der SXSW 2026: „Apps are going to disappear.“ Das ist langfristig zu radikal — kurz- bis mittelfristig stimmt aber, dass die UI-Hülle zunehmend transparent wird und Funktionen über LLM-Agents adressiert werden. Wer keine MCP-Server-Strategie hat, sollte sie 2026 entwickeln.

Zweitens, Voice wird ernsthaft. Voice-First wurde seit Alexa 1.0 immer wieder angekündigt und blieb regelmäßig hinter den Erwartungen zurück. Mit dem MediaTek-Phone von OpenAI, dem Ive-Speaker, Apple Intelligence Phase 2, Amazon Alexa+ und Google Gemini-on-Pixel kommt 2026/2027 die kritische Masse zusammen, die Voice tatsächlich zu einem Erstkanal macht. Primotech prognostiziert, Voice-Suchen würden 2026 mehr als 50 Prozent der digitalen Suchen ausmachen. SaaS-Produkte sollten ihre Workflows daraufhin auditieren: Welche Tasks lassen sich per Sprache anstoßen, welche Bestätigungs- und Edit-Loops sind sprachlich noch unausgereift?

Drittens, das Risiko-Szenario ist realistisch. Wenn auch Apple und OpenAI Hardware-mäßig scheitern — Apple wegen Settlement-Trauma und einem Reputations-Tief, OpenAI weil 30 Millionen Geräte in zwei Jahren zu wenig Distribution sind —, fällt alles zurück auf die Google-Samsung-Achse. Microsoft hat sich consumer-seitig schon verabschiedet. Das Ergebnis wäre ein faktisches Duopol: Apple-mit-Gemini und Android-mit-Gemini. Damit hätte Google ein Inferenz-Monopol auf der KI-Schicht jeder Mobilinteraktion. Für Wettbewerbsbehörden ist dieses Szenario eine offene Flanke, für Enterprise-Käufer ein Konzentrationsrisiko, das in Lieferantenstrategien einzuplanen ist.

Was wirklich auf dem Spiel steht

Das KI-Phone-Rennen ist nicht primär ein Hardware-Rennen. Es ist ein Rennen um die Frage, welche LLMs die Default-Schnittstelle zur Kundin stellen — auf dem Gerät, das jede Person täglich in der Hand hat. Wer dieses Standardmodell stellt, kontrolliert die nächste Suchleiste. Apple hat in dieser Woche sichtbar die Selbstkontrolle aufgegeben und an Google delegiert. OpenAI antwortet mit eigener Hardware. Microsoft zieht sich consumer-seitig zurück. Die Pioniere — Humane, Rabbit, Friend — haben den Fehler gemacht, das Smartphone ersetzen zu wollen, statt das Modell darauf zu kontrollieren.

Die realistische Prognose für die nächsten 24 Monate: Apple-mit-Gemini auf 2,3 Milliarden iPhones, Android-mit-Gemini auf 800 Millionen Samsung- und Pixel-Geräten, OpenAI-mit-eigenem-Phone auf vielleicht 30 Millionen Devices kumuliert, Xiaomi/Huawei-mit-eigenen-Stacks für den chinesischen Markt. In dieser Konstellation wird nicht das Hardware-Design entscheiden, sondern die Frage, welches Modell am besten Aufgaben in dem App-Backend zu erledigen weiß, das das Gerät umgibt. Für SaaS-Anbieter heißt das: Die nächste Ebene des Wettbewerbs läuft nicht mehr im App Store, sondern im MCP-Server-Netzwerk hinter den Phone-Agents. Wer dort sauber ranger und korrekt eingebunden ist, gewinnt. Wer nur eine GUI hat, verliert in der Voice-First-Welt graduell die Sichtbarkeit.

Das Settlement, der Bloomberg-Leak, Kuos Bericht und Sharmas Xbox-Aus liest sich in der Zusammenschau wie ein Drehbuch, dessen Akteure dieselbe Erkenntnis dieser Woche öffentlich gemacht haben — wenn auch unfreiwillig. Die Hardware-Schlacht 2026 wird auf einer Abstraktionsebene oberhalb des Geräts entschieden. Wer das verstanden hat, kauft jetzt MCP-Connector-Plätze auf Frontier-Modellen ein. Wer es nicht verstanden hat, plant noch eine bessere App.

Quellen