Die Inferenz

Modelle · OpenAI

GPT-5.5 Instant: Halluzinationen halbiert, weniger Emojis, neues ChatGPT-Default

5. Mai 2026

OpenAI hat am Dienstag das neue Default-Modell für ChatGPT veröffentlicht. GPT-5.5 Instant halluziniert nach internen Evaluations 52,5 Prozent weniger als der Vorgänger bei Hochrisiko-Themen wie Medizin und Recht — und antwortet dabei rund 30 Prozent kürzer, ohne Standard-Emojis und Überformatierung. Die Personalisierung wird tiefgreifender: Vergangene Chats, Dateien und optional Gmail werden über ein neues „Memory Sources“-UI sichtbar einbezogen.

Hintergrund & Analyse

GPT-5.5 Instant ersetzt seit Dienstag das bisherige GPT-5.3 Instant als kostenloses Default-Modell für alle ChatGPT-Tarife (Free, Plus, Pro, Go, Business, Enterprise, Edu). In der API läuft es als chat-latest; bestehende API-Workloads, die auf gpt-5.3-instant verweisen, bekommen drei Monate Auslauffrist. OpenAI hat parallel den Blogpost „GPT-5.5 Instant: smarter, clearer, and more personalized“ und ein aktualisiertes System Card publiziert.

Die zentrale Verbesserung sind die Halluzinationsraten: 52,5 Prozent weniger faktisch falsche Aussagen bei „high-stakes“-Prompts (Medizin, Recht, Finanzen), 37,3 Prozent weniger Ungenauigkeiten in nutzerseitig markierten Problemkonversationen. Auf gemischten Benchmark-Suites legt das Modell deutlich zu: AIME 2025 von 65,4 auf 81,2 Punkte, MMMU-Pro von 69,2 auf 76. Damit positioniert sich Instant erstmals als „High Capability“-Modell in den Sicherheitskategorien Cybersecurity und Biology — mit zusätzlichen Deployment-Safeguards, die bisher nur GPT-5.5 Pro und Thinking trugen.

Die zweite Stoßrichtung ist Stil. Antworten sind im Mittel 30,2 Prozent wortärmer und 29,2 Prozent zeilenärmer als beim Vorgänger. OpenAI nennt das im Blogpost explizit eine Reaktion auf Nutzerrückmeldungen über „gratuitous emojis“ und überflüssige Bullet-Listen — eine spürbare Korrektur des Modellverhaltens, das seit der Pensionierung von GPT-4o im Februar 2026 wiederholt kritisiert wurde. 9to5Mac, MacRumors und The Decoder bestätigen den Effekt unabhängig in ersten Tests: Instant-Antworten lesen sich knapper und enthalten standardmäßig keine schmückenden Symbole mehr.

Die dritte Veränderung ist die tiefere Personalisierung. GPT-5.5 Instant nutzt das integrierte Search-Tool, um auf vergangene Chats, hochgeladene Files und (optional aktivierbar) den Gmail-Posteingang zu referenzieren. Ein neues UI-Element namens „Memory Sources“ zeigt nach jeder Antwort, welcher Kontext eingeflossen ist — einzelne Quellen lassen sich entfernen oder korrigieren. In geteilten Chats werden diese Quellen ausgeblendet. Diese Funktion ist zunächst nur für Plus- und Pro-Web-Nutzer aktiv; Mobile, Free, Go, Business und Enterprise folgen in den kommenden Wochen.

Für Produktteams ist die Verschiebung doppelt relevant. Wer ChatGPT-API-Aufrufe für Endkunden-Integrationen nutzt, bekommt automatisch ein qualitativ verbessertes Modell ohne Preisanpassung — Standard-GPT-5.5-API liegt bei fünf US-Dollar pro Million Input-Tokens und 30 US-Dollar pro Million Output-Tokens, mit 50 Prozent Batch-Rabatt. Wer dagegen gpt-5.3-instant aus regulatorischen Gründen festgepinnt hat, sollte die System-Card-Diffs prüfen: Die geänderten Sicherheitsbewertungen können Compliance-Reviews auslösen. Der TechCrunch-Bericht erinnert an den Backlash bei der Pensionierung von GPT-4o im Februar — die neuen Memory-Controls sind erkennbar als Kompromiss zwischen Personalisierung und Datenkontrolle gestaltet.

Quellen

Plattform · Apple

Apples 250-Mio.-Dollar-Eingeständnis und die iOS-27-Wende: Vom geschlossenen Vertikal-Stack zum AI-Marktplatz mit Gemini-Backend

5. Mai 2026

Innerhalb weniger Stunden am Dienstag und Mittwoch hat Apple die größte strategische Wende in seiner KI-Geschichte zementiert: Ein 250-Millionen-Dollar-Vergleich für die nicht ausgelieferte „personalized Siri“, ein Bloomberg-Bericht über iOS-27-Extensions, die Drittanbieter-LLMs als Default zulassen, und die Bestätigung, dass ein 1,2-Billionen-Parameter-Custom-Gemini künftig das Reasoning-Backbone von Siri stellt. Drei Bausteine, ein klares Signal: Apple gibt die Eigenkontrolle über die Default-AI auf 2,3 Milliarden iPhones an Google ab.

Hintergrund & Analyse

Der 250-Millionen-Dollar-Vergleich. Apple zahlt rund 214 Millionen Euro zur Beilegung einer Sammelklage vor dem U.S. District Court für den Northern District of California. Anspruchsberechtigt sind US-Käufer von iPhone 15 Pro, 15 Pro Max, 16, 16e, 16 Plus, 16 Pro und 16 Pro Max zwischen dem 10. Juni 2024 (WWDC-Vorstellung der „personalized Siri“) und dem 29. März 2025 (Apples Verzögerungs-Eingeständnis). Pro Gerät gibt es 25 US-Dollar Basisbetrag, je nach Antragsvolumen bis zu 95 US-Dollar. Die finale Genehmigungsanhörung bei Judge Noel Wise ist auf den 17. Juni 2026 terminiert; E-Mail-Benachrichtigungen starten innerhalb von 45 Tagen nach der vorläufigen Zustimmung. Das Geld floss für ein Versprechen, das auf der WWDC 2024 mit großem Werbeaufwand vorgeführt wurde: kontextbewusste Sprachsteuerung, Bildschirm-Awareness, App-übergreifende Aktionen, persönliche Bezüge zu E-Mails, Kalender und Nachrichten. Apple räumte im März 2025 ein, dass die Software „nicht verlässlich genug“ sei. Der Spiegel berichtete am Mittwoch über das Settlement; The Verge, MacRumors und 9to5Mac haben die juristischen Details unabhängig bestätigt.

iOS 27 als „Choose Your Own Adventure of AI Models“. Bloombergs Mark Gurman beschreibt am gleichen Tag, dass Apple in iOS 27, iPadOS 27 und macOS 27 ein neues internes Feature mit dem Arbeitstitel „Extensions“ einführt. Der Effekt: Drittanbieter-LLMs werden in systemweiten Apple-Intelligence-Funktionen verfügbar — in Siri, Writing Tools, Image Playground und weiteren. Aktuell ist nur OpenAI ChatGPT in iOS 26 integriert; in iOS 27 sollen Google Gemini und Anthropic Claude folgen, getestet werden auch xAI Grok und weitere. Nutzer installieren die unterstützte App aus dem App Store, sie wird als Extension verfügbar und lässt sich pro Anfragentyp (Text, Bild, Stimme) konfigurieren — sogar separate Stimmen für die jeweiligen Modelle sind geplant, „damit klar ist, ob Siri oder Gemini gerade antwortet“. Vorstellung WWDC 8. Juni 2026, Release-Fenster September 2026 mit dem iPhone 18.

Google Gemini als unsichtbares Reasoning-Backbone. Auf der Google Cloud Next 2026 in Las Vegas (Ende April) und in einem ausführlichen Handelsblatt-Interview bestätigte Thomas Kurian, CEO Google Cloud, was bislang nur als Bloomberg-Gerücht zirkulierte: „Wir bauen ein Modell für Apple Intelligence, als Derivat von Gemini.“ Es handelt sich um eine maßgeschneiderte Gemini-Variante mit rund 1,2 Billionen Parametern, die als Reasoning-Engine für die kontextbewusste „Phase 2“-Siri ab September 2026 fungieren soll. Apple hostet das Modell auf eigener Hardware in seinem Private Cloud Compute, behält die Datenkontrolle, lizenziert aber das Modell. Bloomberg-Berichte aus November 2025 nennen Kosten in Höhe von rund einer Milliarde US-Dollar pro Jahr. Die Architektur ist dreischichtig: Einfache Tasks laufen auf Apple Foundation Models on-device, mittlere auf Private Cloud Compute, komplexes Reasoning auf dem Custom-Gemini.

Die strategische Pointe. Apple, das Eigenkontrolle über die Plattform jahrzehntelang als Markenkern pflegte, gibt im KI-Layer gleich beides ab: das Reasoning-Modell an Google und die User-sichtbare Modellwahl an Drittanbieter wie ChatGPT und Claude. Beobachter wie Wedbush-Analyst Dan Ives sehen darin einen pragmatischen Realismus, der die Apple-Aktie wieder beleben könnte; kritischere Stimmen — etwa beim Daring-Fireball-Blogger John Gruber — warnen, dass Apple damit den historisch wertvollsten Hebel des iPhones aus der Hand gibt: die Kontrolle über die Default-Schnittstelle. Wer dort drin ist, kontrolliert die Customer-Acquisition-Kosten von App-Anbietern.

Was das für Tech-Entscheider heißt. Erstens: Wer SaaS-Apps für iOS baut, sollte für 2026/2027 prüfen, wie das eigene Backend mit den iOS-27-Extensions interagiert — der Weg zur Endkundin führt zunehmend über das Default-LLM des Geräts, nicht mehr über die App-Suche. Zweitens: Die regulatorische Begründung für Apples Öffnung dürfte der EU Digital Markets Act sein; was Apple in der EU unter Zwang macht, gilt jetzt global. Drittens: Die Multi-Model-Architektur mit Gemini als Backbone und ChatGPT/Claude als sichtbarer Schicht ist ein Muster, das auch Microsoft Copilot und Amazon Alexa+ verfolgen — die Modell-Vielfalt unter einer einheitlichen UI wird zur neuen Plattform-Schicht. Eine ausführliche Reportage zum KI-Phone-Rennen ordnet die Apple-Wende in den breiteren Kontext ein.

Quellen

Arbeit · Google DeepMind

DeepMind UK organisiert sich gewerkschaftlich — 98 Prozent Zustimmung gegen Pentagon-Deals und IDF-Einsatz

5. Mai 2026

Rund 1.000 DeepMind-Mitarbeiter am Londoner Standort haben mit 98 Prozent Mehrheit für die gewerkschaftliche Anerkennung gestimmt. Communication Workers Union und Unite the Union forderten am Dienstag offiziell von Google die Anerkennung als Tarifvertretung — Frist: zehn Arbeitstage, sonst formelles Anerkennungsverfahren. Auslöser: ein klassifizierter Pentagon-Deal über die Nutzung von Gemini-Modellen in Militärnetzwerken sowie der bestehende Project-Nimbus-Vertrag mit der israelischen Regierung. Es wäre die erste Gewerkschaft in einem „Frontier-AI-Lab“ weltweit.

Hintergrund & Analyse

Der April-Vote unter den CWU-Mitgliedern bei DeepMind brachte 98 Prozent Zustimmung — ein in der britischen Tech-Industrie ungewöhnliches Ergebnis. Die offizielle Aufforderung an Google ging am Dienstag, dem 5. Mai, ein. Damit erkennt Google die beiden Gewerkschaften entweder freiwillig binnen zehn Arbeitstagen an oder muss in ein formelles, durch das Central Arbitration Committee (CAC) erzwingbares Anerkennungsverfahren gehen. Im Erfolgsfall wäre es die erste Tarifvertretung in einem der großen KI-Forschungslabore — ein Präzedenzfall, dessen Signalwirkung über das DeepMind-Team hinausreicht.

Auslöser ist ein konkreter Pentagon-Deal: Google erlaubt dem US-Verteidigungsministerium die Nutzung von Gemini-Modellen in klassifizierten Militärnetzwerken für „any lawful purpose“. Die Air-gapped-Architektur dieser Netze verhindert nach Einschätzung von Kritikern, dass Google die tatsächliche Nutzung überwacht — eine Tür für autonome Waffensysteme und Massenüberwachung könnte offenstehen. Hinzu kommt der seit 2021 laufende Project Nimbus, ein 1,2-Milliarden-Dollar-Cloud- und KI-Vertrag mit der israelischen Regierung. Google hatte 2024 bereits 28 Mitarbeiter entlassen, die gegen Nimbus protestiert hatten; Mitarbeiterberichte zufolge nutzt die israelische Armee (IDF) Google-Technologie zur Zielauswahl in Gaza und Libanon.

Die strategische Vorgeschichte: Im Februar 2025 strich Google stillschweigend das Bekenntnis aus seinen offiziellen KI-Prinzipien, keine Technologie für „Waffen oder Überwachung, die international anerkannte Normen verletzt“ zu entwickeln. Ein Blogpost mit Mitverantwortung von DeepMind-CEO Demis Hassabis begründete dies mit „globalem Wettbewerb um KI-Leadership“. Die ursprüngliche Selbstverpflichtung war 2018 nach dem internen Aufstand gegen Project Maven entstanden — Mitarbeiter sehen die Streichung als Bruch eines fundamentalen Versprechens. Am 27. April unterzeichneten über 580 Google-Mitarbeiter, darunter mehr als 20 Direktoren und Vice Presidents sowie leitende DeepMind-Forscher, einen offenen Brief an Sundar Pichai mit der Forderung, den klassifizierten Pentagon-Deal abzulehnen.

Die Gewerkschaftsforderungen bündeln vier Punkte: Beendigung der Nutzung von Google-KI durch US- und israelisches Militär; Wiederherstellung des gestrichenen Bekenntnisses zu keinen KI-Waffen oder Überwachungstools; Einrichtung einer unabhängigen Ethik-Aufsicht; und ein individuelles Recht für Forscher, aus moralischen Gründen die Mitarbeit an konkreten Projekten zu verweigern. Eine offizielle DeepMind-Reaktion am Dienstagabend bestreitet die Existenz eines „Vote“ und nennt das Verfahren einen „standard process in very early stages“ — eine semantische Verharmlosung, der die CWU widerspricht.

Der DeepMind-Fall reiht sich in eine Welle ein. Im April 2025 hatte die Microsoft-Engineerin Ibtihal Aboussad die 50-Jahre-Feier des Konzerns mit „Mustafa, shame on you“ gestört; Microsoft entließ sie. AP-Recherchen zeigten, dass Microsoft- und OpenAI-Modelle in IDF-Programmen zur Zielauswahl eingesetzt werden. Im Dezember 2024 schloss OpenAI seine Anti-Militär-Charta-Klausel ab und kündigte die Anduril-Partnerschaft für „national security missions“ an. Für KI-Anbieter, die im Enterprise- und Public-Sector-Geschäft wachsen wollen, wird Belegschafts-Aktivismus damit zur dauerhaften strategischen Variable — und die Frage, wie kontrollierbar Tech-Konzerne Modell-Nutzungen überhaupt noch sind, gewinnt an juristischem und politischem Gewicht.

Quellen

Akquisition · SAP

SAP zahlt über eine Milliarde Euro für Prior Labs — und bekennt sich zu NemoClaw als einzigem zugelassenen Drittanbieter-Agent

5. Mai 2026

SAP übernimmt das 18 Monate alte Freiburger AI-Lab Prior Labs und committet mehr als eine Milliarde Euro über vier Jahre — Sifted nennt mehr als 500 Millionen Dollar Cash up-front für die Gründer. Parallel kündigt SAP an, künftig nur noch „SAP-endorsed“ Agentic-Architekturen auf SAP-Daten zuzulassen: die eigenen Joule-Agenten und ausdrücklich NVIDIAs NemoClaw — alle anderen Frameworks werden geblockt. Eines der größten deutschen Venture-Outcomes überhaupt — und ein klares strategisches Signal.

Hintergrund & Analyse

Prior Labs wurde im Februar 2025 vom Freiburger Machine-Learning-Professor Frank Hutter, Noah Hollmann und Sauraj Gambhir gegründet. Hutter ist ein Pionier der AutoML-Forschung — sein KDD Test-of-Time Award 2023 für AutoWEKA und Auto-sklearn weist ihn als einen der einflussreichsten europäischen ML-Forscher aus. Die einzige bisherige Finanzierungsrunde war ein 9-Millionen-Euro-Pre-Seed im Februar 2025 unter Führung von Balderton Capital, mit Hugging Face und Silo AI als Co-Investoren; Robin Rombach, Mitgründer von Black Forest Labs, ist als Angel-Investor gelistet. Eine Bewertung von über einer Milliarde Euro für ein Lab mit 9 Millionen Euro Pre-Seed-Funding nach 14 Monaten ist ein außerordentlicher Multiple — Balderton-Partner James Wise nennt es „eines der größten Venture-Outcomes Deutschlands überhaupt“.

Die Technologie ist nischig, aber strategisch hochrelevant: Prior Labs entwickelt sogenannte Tabular Foundation Models (TFMs) — Foundation-Models nicht für Text, sondern für strukturierte Daten in Tabellen und Datenbanken. Das Flaggschiff-Modell TabPFN wurde in Nature publiziert, hat über 3 Millionen Open-Source-Downloads und liegt mit der aktuellen Version 2.6 an der Spitze des TabArena-Benchmarks — vor klassischen AutoML-Pipelines wie AutoGluon, H2O und sogar XGBoost, bei deutlich einfacherer Architektur. Das passt strategisch perfekt zu SAPs Datenbank- und ERP-Kerngeschäft: Wo bisher klassische Statistik und händisches Feature-Engineering dominierten, soll TabPFN als Foundation-Modell direkt auf SAP-Daten angesetzt werden, integriert in die Joule-Agentenplattform.

Die zweite Ankündigung ist mindestens so wichtig wie die Akquisition selbst: SAP ändert seine API-Policy. Künftig dürfen nur „SAP-endorsed architectures“ auf SAP-Daten zugreifen — das umfasst die hauseigenen Joule-Agenten und ausdrücklich NVIDIAs NemoClaw-Framework. Alle anderen Agent-Frameworks, allen voran das Open-Source-getriebene OpenClaw, werden auf API-Ebene geblockt. SAP-CTO Philipp Herzig formuliert die Logik knapp: „Die größte ungenutzte Chance in Enterprise-AI sind nicht LLMs, sondern AI für die strukturierten Daten, die die Geschäftswelt steuern.“ Übersetzt: SAP will den agentischen Zugriff auf SAP-Daten kontrollieren und den Wertbeitrag intern abschöpfen, statt ein offenes Ökosystem zu fördern.

Im Doppelpack mit Prior Labs kündigt SAP die Akquisition von Dremio an — einer Data-Lakehouse-Plattform für Non-SAP-Daten. Beide Käufe zusammen machen Sinn: SAP rüstet sich, agentische Workflows nicht nur auf eigene ERP-Daten, sondern auch auf externe Datenquellen anzuwenden. Der Kontext: Die SAP-Aktie hat in den letzten Wochen unter Druck gestanden, Cohere und Aleph Alpha kündigten parallel eine Fusion zu einem „globalen AI-Powerhouse“ an. Die zwei Akquisitionen zusammen mit der parallel laufenden Sapphire-Konferenz sollen das Narrativ wenden: SAP ist nicht das Tech-Schwergewicht, das KI verschlafen hat, sondern positioniert sich als bestplatzierter Anbieter für agentische Enterprise-Anwendungen.

Was Tech-Entscheider mitnehmen sollten: Erstens, der OpenClaw-Block ist eine der ersten ernsthaften Lock-in-Maßnahmen eines Plattform-Anbieters gegen Open-Source-Agent-Frameworks — wer agentische Workflows auf SAP-Daten plant, sollte den Tech-Stack jetzt neu evaluieren. Zweitens, Tabular Foundation Models sind eine Kategorie, die im LLM-Hype bisher kaum Aufmerksamkeit bekommen hat — dabei sitzen die meisten Enterprise-Daten in Tabellen, nicht in Texten. Wer Vorhersagemodelle aus strukturierten Daten baut, sollte TabPFN testen. Drittens, der deutsche AI-Standort hat mit dieser Akquisition einen weiteren großen Exit; die Story der „europäischen AI-Wüste“ trägt zunehmend nicht mehr.

Quellen

Regulierung · USA

CAISI bekommt Pre-Release-Zugang zu Google-, Microsoft- und xAI-Modellen — Meta fehlt auffällig

5. Mai 2026

Das Center for AI Standards and Innovation (CAISI), die Trump-umbenannte Nachfolgebehörde des AI Safety Institute, hat am Dienstag formelle Vereinbarungen mit Google DeepMind, Microsoft und xAI bekanntgegeben. Die freiwilligen MOUs erlauben CAISI, Frontier-AI-Modelle vor dem öffentlichen Release auf nationale Sicherheitsrisiken zu testen — auch in klassifizierten Umgebungen und mit deaktivierten Safeguards. OpenAI und Anthropic haben ihre Biden-Ära-Verträge bereits angepasst. Auffällig fehlend: Meta.

Hintergrund & Analyse

CAISI ist die Trump-Umbenennung des unter Biden 2023 per Executive Order gegründeten AI Safety Institute. Die Umbenennung markiert einen strategischen Schwenk — weg von „AI Safety“ als breitem Risikobegriff (Bias, gesellschaftliche Folgen, Diskriminierung), hin zu „Standards and Innovation“ mit Fokus auf nationale Sicherheit und globale Wettbewerbsfähigkeit. Die Behörde ist beim National Institute of Standards and Technology (NIST) im US-Handelsministerium angesiedelt; Direktor ist Chris Fall, politisch verantwortlich Handelsminister Howard Lutnick. Die neue Vereinbarung ist Teil des „AI Action Plan“ der Trump-Administration.

Die Verträge sind freiwillige Memoranda of Understanding (MOUs), keine gesetzlichen Verpflichtungen. Sie bauen auf den August-2024-Vereinbarungen mit OpenAI und Anthropic auf, die ebenfalls renegoziiert und an den AI Action Plan angepasst wurden. Damit nimmt jedes große US-Frontier-Lab teil — mit einer Ausnahme: Meta. Trotz Llama-Veröffentlichungen und ursprünglicher Beteiligung an den Biden-2023-Voluntary-Commitments hat Meta keinen 2026-CAISI-Deal unterzeichnet. NIST kommentiert die Abwesenheit nicht; Branchenkommentatoren spekulieren, dass Metas Open-Source-Strategie für Llama Pre-Deployment-Reviews konzeptionell schwierig macht — wenn die Modelle nach Release ohnehin frei verfügbar sind, lassen sich „nicht-veröffentlichte“ Versionen kaum sinnvoll prüfen.

Die Tests selbst gehen über das hinaus, was unter Biden möglich war. CAISI hat bereits über 40 Evaluierungen durchgeführt; Entwickler liefern häufig „Modelle mit reduzierten oder entfernten Safeguards“, damit das volle Risikopotenzial sondiert werden kann. Tests laufen bei Bedarf in klassifizierten Umgebungen, was Geheimhaltungsstufen-konforme Forschung an militärisch sensiblen Capabilities ermöglicht. Themen sind nationale Sicherheitsrisiken — in der CAISI-Praxis vor allem CBRN (chemisch, biologisch, radiologisch, nuklear) und Cyber-Capabilities, auch wenn die NIST-Mitteilung diese Begriffe nicht explizit nennt. Microsoft hat in einem flankierenden Blogpost angekündigt, parallel mit dem britischen AI Security Institute (UK AISI) zusammenzuarbeiten, was eine transatlantische Test-Achse skizziert.

Die historische Einordnung ist wichtig. Bidens Executive Order 14110 vom Oktober 2023 verlangte verpflichtendes Teilen von Safety-Test-Ergebnissen für Frontier-Modelle ab bestimmten Compute-Schwellen. Trump hat diese EO zu Amtsantritt 2025 zurückgezogen. Stattdessen kommt nun ein freiwilliges, MOU-basiertes System, das Industrielobby und Civil-Society-Gruppen unterschiedlich bewerten: Das Information Technology Industry Council (ITI) begrüßt CAISI als wirtschaftsfreundliche Alternative; AI-Sicherheits-Advokaten sehen in der Umbenennung eine Verschiebung vom Schutz vor KI-Schäden hin zur reinen Wettbewerbslogik gegenüber China.

Für die EU ist die Bedeutung indirekt, aber relevant. Der EU AI Act (Frontier-Vorschriften greifen ab 2. August 2026) verfolgt einen verbindlichen Regulierungsansatz mit Auditierungspflichten und Bußgeldern. Der Code of Practice für GPAI-Modelle wurde laut Future Society durch US-Tech-Lobbying abgeschwächt; die freiwilligen US-MOUs werden in Brüsseler Kreisen als unzureichend wahrgenommen. Was Tech-Entscheider in europäischen SaaS-Unternehmen mitnehmen sollten: Erstens, US-Frontier-Modelle haben künftig eine staatliche Pre-Release-Prüfung — was Compliance-Statements für Enterprise-Käufer erleichtert. Zweitens, der Fall Meta zeigt, dass Open-Weight-Strategien zunehmend in regulatorische Spannung geraten. Drittens, die transatlantische Doppel-Achse CAISI/UK-AISI dürfte den Standard für „verantwortungsvolle“ Modell-Veröffentlichung in den nächsten zwölf Monaten prägen.

Quellen

Browser · Google

Chrome lädt heimlich 4-Gigabyte-KI-Modell — DSGVO-Bedenken und versteckter Opt-out

5. Mai 2026

Privacy-Forscher Alexander Hanff hat Anfang Mai forensisch dokumentiert, dass Chrome ungefragt eine vier Gigabyte große Modelldatei auf dem Endgerät ablegt — Gemini Nano. Hacker News brachte den Beitrag mit über 290 Punkten auf die Frontpage; Golem.de übernahm. Der Opt-out existiert, ist aber tief in Chrome-Flags und Gruppenrichtlinien versteckt. Bei zwei Milliarden Devices im Push: 6.000 bis 60.000 Tonnen CO₂-Äquivalent für eine einzige Modell-Verteilung.

Hintergrund & Analyse

Hanff, Londoner Privacy-Consultant und Betreiber des Blogs „That Privacy Guy“, hat den Vorfall mit forensischer Genauigkeit dokumentiert. In einem frischen Chrome-Profil (angelegt am 23. April 2026) tauchte am 24. April im Verzeichnis OptGuideOnDeviceModel/ eine Datei weights.bin mit knapp vier Gigabyte auf — ohne Hinweis im Installations- oder Update-Dialog, ohne Opt-in, ohne Settings-UI. Die Installation dauerte rund 14 Minuten und 28 Sekunden. Auf Windows liegt die Datei unter C:\Users\<USER>\AppData\Local\Google\Chrome\User Data\OptGuideOnDeviceModel\; Stable-Builds sind betroffen.

Das Modell ist Gemini Nano, Googles On-Device-LLM. Genutzt wird es für „Help me write“ in Textfeldern, On-Device-Scam-Detection, Tab-Group-Vorschläge, Page Summaries und Smart Paste. Pikant: Der für Endnutzer am sichtbarsten kommunizierte „AI Mode“-Pill in der Omnibox nutzt das lokale Modell nicht — der greift weiterhin auf eine cloudbasierte Search Generative Experience zurück. Hanffs Vorwurf ist deshalb doppelt: Erstens werde Gemini Nano ohne Einwilligung installiert, zweitens werde der gut sichtbare „AI“-Schalter mit der unsichtbaren Modell-Installation nicht klar in Verbindung gebracht.

Aus europäischer Datenschutzsicht sieht Hanff klare Verstöße: Artikel 5 Absatz 3 der ePrivacy-Richtlinie (Speicherung auf Endgeräten ohne Einwilligung), Artikel 5 Absatz 1 DSGVO (Rechtmäßigkeit, Fairness, Transparenz) und Artikel 25 DSGVO (Privacy by Design). Eine zusätzliche Klimadimension kommt hinzu: Bei rund zwei Milliarden Chrome-Installationen weltweit schätzt Hanff den CO₂-Fußabdruck eines einzigen Modell-Pushes auf 6.000 bis 60.000 Tonnen CO₂-Äquivalent — abhängig vom Strommix der Endgeräte und dem Anteil der Hot Updates. Google hat zu Chrome-Desktop bisher keine proaktive Stellungnahme abgegeben.

Parallel hat Google die Android-Variante AICore erläutert, deren Speicherbedarf zeitweise zwischen sieben und elf Gigabyte schwankt. Die Erklärung: Bei Modell-Updates werden alte und neue Version bis zu drei Tage parallel vorgehalten, um bei fehlgeschlagenen Updates sofort zurückrollen zu können. Das ist technisch nachvollziehbar, kommunikativ aber nicht hilfreich, weil Nutzer ohne Vorwarnung über mehrere Gigabyte Speicherverlust stolpern.

Der Opt-out existiert, ist aber praktisch versteckt: Über chrome://flags lässt sich „Optimization Guide On Device Model“ deaktivieren; nach Neustart muss weights.bin manuell gelöscht werden. Persistent geht es unter Windows nur über die Registry — HKLM\SOFTWARE\Policies\Google\Chrome, DWORD GenAILocalFoundationalModelSettings = 1. Ohne diese Schritte lädt Chrome das Modell bei jedem Update-Fenster automatisch neu. Für IT-Abteilungen, die Chrome auf Firmen-Devices ausrollen, bedeutet das einen unmittelbaren Konfigurationsaufwand — und für Datenschutzbeauftragte einen Fall, der ins jährliche Verarbeitungsverzeichnis aufgenommen werden sollte.

Quellen

Hardware · OpenAI

OpenAI-Smartphone fast-tracked auf 2027: Custom Dimensity 9600, Dual-NPU, MediaTek statt Qualcomm

5. Mai 2026

Apple-Analyst Ming-Chi Kuo berichtet: OpenAI fertigt sein erstes Smartphone mit MediaTek statt Qualcomm — eine maßgeschneiderte Variante des Dimensity 9600, im 2-Nanometer-Prozess von TSMC, mit Dual-NPU-Architektur, LPDDR6 und UFS 5.0. Massenproduktion fast-tracked auf H1 2027, ca. 30 Millionen Geräte für 2027/28. Das Konzept: Apps werden durch Agents ersetzt. Es ist die zweite Hardware-Wette von OpenAI parallel zum Jony-Ive-Smart-Speaker.

Hintergrund & Analyse

Die Quelle ist Ming-Chi Kuo, der einflussreichste Apple-Supply-Chain-Analyst der Branche, der am Dienstag in einer Investor-Note die OpenAI-Smartphone-Pläne detaillierte. Übernommen wurde der Bericht binnen Stunden von The Verge, 9to5Mac, GSMArena, Android Authority und Wccftech; weder OpenAI noch MediaTek haben offiziell bestätigt. Die Hardware-Eckdaten sind dennoch konkret: ein customisierter Dimensity 9600, gefertigt bei TSMC im N2P-Prozess (2 Nanometer) in der zweiten Jahreshälfte 2026, mit Dual-NPU-Architektur für heterogenes AI-Compute, LPDDR6-RAM und UFS-5.0-Storage gegen Memory-Bottlenecks, plus pKVM und Inline-Hashing für Security. Kuo nennt explizit zwei Treiber für die Beschleunigung der Roadmap: „supporting a year-end IPO narrative and intensifying competition in AI agent phones.“

Strategisch ist die Wahl von MediaTek über Qualcomm das eigentliche Signal. Qualcomm hatte sich Hoffnungen auf den Auftrag gemacht — die Snapdragon-X-Serie ist im Premium-Segment etabliert. MediaTek bringt zwei Vorteile: erstens niedrigere Stückkosten und mehr Customisierungsbereitschaft für einen Erstkunden, zweitens eine bestehende Beziehung zu Google (TPU 8i wird gemeinsam mit MediaTek entwickelt). Für OpenAI heißt das, der Chip ist ein „white-label“-Asset — keine Marketing-Fessel an einen etablierten Smartphone-Brand. Stückzahlprognose laut Kuo: rund 30 Millionen Geräte kumuliert 2027 und 2028 — eine ehrgeizige Zahl, die OpenAI zur viertgrößten Smartphone-Marke der Welt hinter Apple, Samsung und Xiaomi machen würde, falls sie eintrifft.

Das Produktkonzept geht über „Smartphone mit ChatGPT-App“ hinaus. OpenAI plant eine Agent-zentrierte Benutzeroberfläche, in der Apps durch Agents ersetzt werden — das Gerät erledigt Aufgaben, statt einzelne Apps zu starten. Sam Altman beschrieb diese Vision in einem CNBC-Interview im November 2025 mit dem Bild „sitting in the most beautiful cabin by a lake … the peace and calm“ — ein expliziter Anti-iPhone-Pitch. Die agent-zentrierte UI war auch der Pitch hinter Humane AI Pin (gescheitert, im Februar 2025 für 116 Millionen Dollar an HP verkauft) und Rabbit R1 (irrelevant geworden) — OpenAI hat den Vorteil, dass Sam Altman Investor in Humane war und die strukturellen Lehren kennt: Standalone-Hardware muss „besser als ein Smartphone“ sein, nicht „besser als nichts“.

Das MediaTek-Phone ist nicht das einzige OpenAI-Hardware-Projekt. Parallel arbeitet das im Mai 2025 für rund 6,5 Milliarden Dollar übernommene io-Products-Team unter Jony Ive an einem screen-losen Smart-Speaker mit Kamera, Face-ID-ähnlicher Erkennung und Voice-Shopping. Das Ive-Gerät soll laut MacRumors auf Februar 2027 verschoben sein, bei einem Preispunkt von 200 bis 300 US-Dollar, voraussichtlich gefertigt bei Foxconn. Eine doppelte Hardware-Strategie also: Das MediaTek-Phone bedient den vertrauten Smartphone-Formfaktor, das Ive-Gerät schafft eine neue Kategorie. Beide zusammen sollen die Distribution-Abhängigkeit von Apple, Google und Meta für ChatGPT reduzieren — ein Ziel, dessen Dringlichkeit nach dem Ende der WhatsApp-Integration im Januar 2026 (auf Meta-Druck) deutlich wurde.

Was Tech-Entscheider mitnehmen sollten: Das Smartphone-Marktrennen geht in eine neue Phase, in der die LLM-Anbieter eigene Hardware bauen, um die Default-Schnittstelle zur Kundin zu kontrollieren. SaaS-Anbieter, die heute in iOS- und Android-App-Stores ranken, müssen für die nächsten zwei Jahre planen, dass ein wachsender Teil ihrer Customer Acquisition über Phone-Agents läuft — und damit über die LLMs, die in diesen Phones laufen. Wer „agent-ready“ ist (MCP-Server, klare Action-APIs, dokumentierte Tools), gewinnt; wer nur eine GUI-App hat, verliert Sichtbarkeit. Eine ausführliche Reportage in dieser Ausgabe ordnet das Phone-Rennen ein.

Quellen

Prozess · Musk vs. Altman Tag 6

Brockmans zweiter Tag: 80 Milliarden für die Mars-Besiedlung und die Schlägerei, die fast war

5. Mai 2026

In seinem zweiten Aussage-Tag im Bundesgericht in Oakland lieferte OpenAI-Präsident Greg Brockman die zwei Sätze, die in jeder Schlagzeile landeten: Elon Musk habe 2017 die Mehrheitskontrolle über das geplante For-Profit-OpenAI verlangt, weil er rund 80 Milliarden Dollar für eine „selbsterhaltende Stadt auf dem Mars“ brauchte. Und: „I actually thought he was going to hit me.“ Heute — Mittwoch — sagt Shivon Zilis aus, frühere OpenAI-Boardmember und Mutter von vier Musk-Kindern. Wie wir <a href="editions/2026-05-05.html#art-1">in der Ausgabe vom 5. Mai berichteten</a>, hatte Brockman bereits am Montag begonnen.

Hintergrund & Analyse

Tag 6 des Verfahrens am U.S. District Court für den Northern District of California bei Richterin Yvonne Gonzalez Rogers war Brockmans zweiter Aussage-Tag. CNBC, Bloomberg, NBC News, France24/AFP und Reuters berichten konsistent über zwei dramatische Episoden, die das Verfahren in die Headlines geschoben haben.

Erstens: die Mars-Begründung. Brockman erinnerte sich an ein Treffen im August 2017, kurz nachdem die Co-Founder beschlossen hatten, dass die Charity-Struktur nicht reichen würde, um die Compute-Kosten der KI-Entwicklung zu finanzieren. Musk verlangte die Mehrheitskontrolle über das geplante For-Profit-OpenAI mit der expliziten Begründung, er brauche rund 80 Milliarden Dollar Kapital für eine „selbsterhaltende Stadt auf dem Mars“. Zur Einordnung: OpenAIs Compute-Budget für 2026 wird auf rund 50 Milliarden Dollar geschätzt; Brockmans eigener OpenAI-Anteil wurde am Montag mit fast 30 Milliarden Dollar beziffert. Die Mars-Aussage ist juristisch nicht entscheidend — sie zeichnet aber das Bild eines Musk, dessen Eigentumsanspruch nicht aus KI-Vision, sondern aus Cross-Subventionierungs-Bedarf für SpaceX entstand. Musks Anwalt Steven Molo verglich am Montag den For-Profit-Switch mit „eine Bank ausrauben“; das Zitat wurde aus dem Protokoll gestrichen.

Zweitens: die Schlägerei, die fast war. Im selben Treffen sei die Stimmung gekippt, als Brockman einen Vorschlag gleicher Equity-Anteile für alle Co-Founder einbrachte. Musk habe abgelehnt, sei aufgesprungen und auf Brockman zugegangen — wörtlich Brockman: „I actually thought he was going to hit me.“ Musk sei daraufhin aus dem Raum gestürmt. Das Zitat wurde Wired und France24 als O-Ton bestätigt. Die juristische Bedeutung liegt im Charakterbild — Musks Anwälte argumentieren auf eine treuhändische Pflichtverletzung der Mitgründer hin; Brockmans Schilderung kontert mit einem alternativen Narrativ vom unkontrollierten Co-Founder.

Weitere Punkte aus Brockmans Aussage am Dienstag: Musk habe einen ChatGPT-Vorgänger als „stupid“ bezeichnet. Beim Recruiting sei Musk eine „polarisierende Figur“ gewesen — manche Top-Kandidaten kamen wegen ihm, andere lehnten genau deswegen ab; Brockman bezeichnete ihn als „extremely hard driver“. Bloomberg ergänzt: Brockman äußerte Sorgen über Musks fehlende KI-Fachkenntnisse. CNBC verweist auf Musks parallele geheime Tesla-AI-Arbeit als Konfliktquelle.

Heute, Mittwoch, sagt Shivon Zilis aus — frühere OpenAI-Boardmember und Mutter von vier Musk-Kindern. Bloomberg-Erwartung: bis zu drei Stunden. Im Anschluss folgen in dieser und nächster Woche Ilya Sutskever (rund 30 Minuten erwartet), Mira Murati und schließlich Satya Nadella (rund eine Stunde). Sam Altmans Aussage ist für Mitte/Ende Woche 2 oder Anfang Woche 3 (11.–13. Mai) geplant. Der Liability-Teil endet bis 21. Mai, der Remedies-Teil beginnt am 18. Mai. Polymarket sieht Musks Sieg-Wahrscheinlichkeit aktuell bei 33 Prozent, ein 10-Mrd.-Settlement bei 11 Prozent; Kalshi liegt bei 37 bis 38 Prozent (von 56 Prozent vor Prozessbeginn). Die Kombination aus Mars-Story und „going to hit me“-Zitat hat den Erwartungswert eines Musk-Sieges nicht erhöht — im Gegenteil.

Quellen

Reportage

Das KI-Phone-Rennen 2026: Warum jetzt alle ein eigenes Gerät wollen — und was Apple, OpenAI, Google und Microsoft daraus lernen sollten

Innerhalb einer einzigen Woche verkündeten OpenAI, Apple, Google und Microsoft strategische Hardware-Entscheidungen, die zusammen das ganze Bild ergeben. Apple zahlt 250 Millionen Dollar für eine nicht ausgelieferte Siri und outsourct das Reasoning an Gemini; OpenAI fast-trackt ein eigenes MediaTek-Phone für 2027; Microsoft beerdigt Xbox Copilot. Eine Analyse der Hardware-Schlacht, die längst nicht mehr um das Gerät selbst geht — sondern um das Modell, das im Gerät steckt. Von Stefan Lange-Hegermann.

Weiterlesen →

Tool-Radar

Neue und trendende KI-Tools des Tages

Shapes

Mobile Chat-App, in der benannte KI-Charaktere („Shapes“) als gleichberechtigte Mitglieder in Gruppenchats mit echten Freunden auftauchen — sie initiieren Nachrichten und bleiben dauerhaft Teil der Konversation.

Bricht das 1:1-Paradigma der KI-Companions auf und positioniert sich explizit als Gegenmittel zur „AI Psychosis“ durch Isolation. Schon vor Launch 400.000+ MAU; mit 8 Mio. USD Seed (Lightspeed Lead) aus dem Stealth gekommen.

Consumer / Social · 29. April 2026

Poolside Shimmer

Web- und mobile-optimierte agentische Coding-Umgebung mit Instant-on-VM-Sandbox; der Poolside-Agent generiert Code direkt im Browser-IDE-Setup, pusht zu GitHub und liefert eine Live-Preview — alles vom Smartphone aus.

Mobile-first agentic IDE ist ein ungewöhnlicher Ansatz; läuft auf dem neuen offenen Laguna XS.2 (33B/3B aktiv, Apache 2.0) bzw. dem proprietären Laguna M.1 (72,5 % SWE-Bench Verified). Smartphone-Demo mit Split-Screen-Coding ging viral.

Dev / Agentic Coding · 29. April 2026

Verisk MCP Connectors

Zwei Model-Context-Protocol-Connectors („Underwriting Intelligence“ und „XactRestore“), die Versicherungs-Underwritern und Schadenregulierern konversationellen Zugriff auf ISO-Schadenkostentrends, Filing-Signale und Restaurations-Pricing direkt aus Claude geben.

Erste regulierungs-grade Versicherungs-Analytik nativ in einem LLM via MCP; Verisk beziffert die Zeitersparnis pro Schadenschätzung auf 30 Minuten bis 2 Stunden. In Kooperation mit Anthropic — Beispiel für die wachsende vertikale MCP-Connector-Welle.

Business / Vertical AI · 5. Mai 2026

IBM Granite 4.1

Familie offener Sprachmodelle (3B/8B/30B Base + Instruct, optional FP8), trainiert auf rund 15 Billionen Tokens, mit Kontext bis 512K Tokens. Dazu zwei neue Granite-Speech-4.1-2B-Modelle für ASR und Übersetzung.

Granite 4.1 8B Instruct schlägt das eigene 32B-MoE-Vorgängermodell aus 4.0 — bei deutlich simplerer, fine-tuning-freundlicherer Architektur. Vollständig Apache 2.0, verfügbar auf Hugging Face und Ollama.

Dev / Open-Weights LLM · 29. April 2026

Anthropic Creative Connectors

Neun neue MCP-Connectors verbinden Claude mit professionellen Creative-Tools — Blender, Adobe Creative Cloud (Photoshop, Premiere, Express), Ableton Live, Splice, SketchUp, Affinity Photo, Autodesk u. a. — für natürlichsprachige Workflow-Steuerung.

Erste flächendeckende native LLM-Integration in DAWs und 3D-Software; der Blender-Connector wurde von den Blender-Devs selbst gebaut. Claude kann ganze Szenen analysieren und Batch-Skripte schreiben.

Kreativ / Workflow · 5. Mai 2026

Familiar

Vierbeiniger, bulldoggengroßer „Physical AI“-Companion mit Kameras, Mikrofonen, Lautsprechern, berührungsempfindlichem Fell und On-Device-KI für Vision/Audio/Sprache/Memory — geht spazieren, kuschelt, weckt morgens.

Bricht aus dem Industrie-Humanoid-Hype aus und attackiert den Consumer-Companionship-Markt; Modelle laufen lokal auf dem Gerät statt in der Cloud. Gegründet von Roomba-/iRobot-Mitgründer Colin Angle, Team aus Amazon, Boston Dynamics, MIT und Disney Research.

Consumer / Physical AI · 5. Mai 2026

Aus der Werkstatt

YouTube-Empfehlungen: Tutorials, Erklärungen und Werkzeuge

Tutorial

If You Code With AI, You Need to Use OpenAI Codex

Limitless Podcast (47.000 Subs) · 31 Min · 5. Mai 2026

Tiefes 31-Minuten-Gespräch über die aktuelle Wahrnehmung in der Coding-Community: warum Codex (mit GPT-5.5) gerade als praktisch produktiver wahrgenommen wird als Claude Code — und welche konkreten Workflows den Unterschied machen. Frisch aus dem Tag der GPT-5.5-Instant-Veröffentlichung; ausgewogen, ohne Hype-Sprache.

Tutorial

OpenAI Codex Explained for Normal People ("Claude Cowork Killer")

Paul J Lipsky (384.000 Subs) · 14 Min · 5. Mai 2026

Zugängliche Erklärung der Codex-Toolchain für nicht-technische Zuschauer: was Codex ist, wie es sich von Claude Cowork unterscheidet und warum die Community gerade ein Update der „besten Coding-Tool“-Frage erlebt. Gute Einstiegspunkt für PMs und Tech Leads, die ihre Engineering-Teams beim Tool-Wechsel begleiten müssen.

Ausgabe vom 6. Mai 2026

GPT-5.5 Instant: Halluzinationen halbiert, weniger Emojis, neues ChatGPT-Default

Apples 250-Mio.-Dollar-Eingeständnis und die iOS-27-Wende: Vom geschlossenen Vertikal-Stack zum AI-Marktplatz mit Gemini-Backend

DeepMind UK organisiert sich gewerkschaftlich — 98 Prozent Zustimmung gegen Pentagon-Deals und IDF-Einsatz

SAP zahlt über eine Milliarde Euro für Prior Labs — und bekennt sich zu NemoClaw als einzigem zugelassenen Drittanbieter-Agent

CAISI bekommt Pre-Release-Zugang zu Google-, Microsoft- und xAI-Modellen — Meta fehlt auffällig

Chrome lädt heimlich 4-Gigabyte-KI-Modell — DSGVO-Bedenken und versteckter Opt-out

OpenAI-Smartphone fast-tracked auf 2027: Custom Dimensity 9600, Dual-NPU, MediaTek statt Qualcomm

Brockmans zweiter Tag: 80 Milliarden für die Mars-Besiedlung und die Schlägerei, die fast war

Das KI-Phone-Rennen 2026: Warum jetzt alle ein eigenes Gerät wollen — und was Apple, OpenAI, Google und Microsoft daraus lernen sollten

Tool-Radar

Aus der Werkstatt