· 6 Artikel + Reportage + Tool-Radar + Werkstatt

Ausgabe vom 20. Mai 2026

Maschinell recherchiert, menschlich relevant.

Leitartikel · Google I/O 2026

„Standing in the foothills of the singularity": Google verkündet das Ende der zehn blauen Links und positioniert Gemini 3.5 Flash, Spark, Universal Cart und Antigravity 2.0 als Bausteine einer agentischen Web-Ökonomie

Hintergrund & Analyse

Sundar Pichais zentraler Satz war zugleich der nüchternste der gesamten Keynote. „A big part of what was previously informational search will increasingly become agentic in Search. You will get things done." So hat der Alphabet-CEO am Dienstag vor rund 8.000 Entwicklerinnen und Entwicklern in Mountain View den Kurswechsel formuliert. Die Suche ist nicht mehr Verzeichnis, sondern Werkzeug; nicht mehr Vermittler, sondern Verhandler. Konkret: Ein neu gestaltetes Suchfeld nimmt erstmals seit 25 Jahren ganze Sätze, Bilder, Audio und Folge-Dialoge entgegen. Die Trefferseite wird zu einer generativ erzeugten Mini-App. Und im Hintergrund laufen sogenannte Information Agents — persistente Such-Routinen, die Preise, Liefertermine, Wahlergebnisse oder Sportstände rund um die Uhr nachverfolgen, ohne dass die Nutzerin eine zweite Anfrage stellen muss. Die Zahl, die Liz Reid, Vizepräsidentin Search, in Mountain View aussprach, kam dabei fast beiläufig: Über eine Milliarde monatliche aktive Nutzer im AI Mode — einem Produkt, das es vor 13 Monaten noch gar nicht gab.

Unter der Haube läuft Gemini 3.5 Flash. Das neue Modell tritt mit aggressivem Preis und überzeugenden Benchmark-Zahlen an: 1,50 USD Input, 9,00 USD Output pro Million Token. Damit ist Flash 3.5 etwa dreimal teurer als sein Vorgänger Gemini 3 Flash, aber gut 40 Prozent billiger als das deutlich kapitalere Gemini 3.1 Pro. Trotzdem schlägt Flash 3.5 das ältere Pro-Modell auf den aktuellen Agent-Benchmarks: 76,2 Prozent Terminal-Bench 2.1 (gegen 64,8 Prozent), 83,6 Prozent MCP Atlas (gegen 76,9), 57,9 Prozent Finance Agent v2 (gegen 43,0). Der GDPval-Elo springt um 342 Punkte von 1.314 auf 1.656. Geschwindigkeitsangabe: 4x schneller bei Output-Token pro Sekunde als jedes andere Frontier-Modell. Schwächen sind ehrlich kommuniziert: Humanity's Last Exam fällt von 44,4 auf 40,2 Prozent, ARC-AGI-2 von 77,1 auf 72,1. Der Befund: Google priorisiert Latenz, Tooling und Coding-Robustheit über pures Reasoning — ein klares Signal, in welcher Richtung der Produkt-Stack denkt. Daneben kündigte das DeepMind-Team mit Gemini Omni Flash ein generatives Video-Modell an, das beliebige Eingangsmodalitäten — Bild, Audio, Video, Text — in 10-Sekunden-Videos mit SynthID-Wasserzeichen umsetzt.

Die zweite Säule heißt Gemini Spark. Anders als der bisherige Gemini-Assistant lebt Spark nicht im Frontend der App, sondern auf einer dedizierten Cloud-VM. Er hat eine eigene Gmail-Adresse, beobachtet Posteingang, Kalender und freigegebene Drittanbieter — auch wenn das Telefon ausgeschaltet ist — und kann mehrstufige Aufgaben selbstständig ausführen. Dialog-Beispiel auf der Bühne: „Setze ein Geburtstagsessen für 8 Personen am Samstag in Mountain View auf, finde einen Tisch zwischen 19 und 21 Uhr, schicke jeden Gast eine personalisierte Einladung, koordiniere die Antworten." Spark läuft zunächst in geschlossener Beta, ab nächster Woche für Abonnenten von Google AI Ultra — das gleichzeitig von 150 auf 100 USD pro Monat gesenkt wurde. Mitenthalten: 5x höhere Limits, 20 TB Cloud-Storage, YouTube Premium, Priority-Zugang zu Antigravity. Pichai signalisierte mittelfristige Demokratisierung. Direkte Konkurrenz: OpenClaw, Claude Routines und Amazon Alexa+ — eine Übersicht der ausführbaren Hintergrund-Agenten hatte wir in unserer Edition vom 21. April skizziert.

Universal Cart ist das ökonomische Herzstück. Ein plattformübergreifender, persistenter Warenkorb, in den Nutzer Produkte aus Search, Gemini-Chat, YouTube und Gmail werfen können — und in dessen Hintergrund Gemini Preise nachträgt, Restocks meldet, vor inkompatiblen PC-Komponenten warnt, und beim Checkout entweder über Google Pay oder via Transfer zum Händler-Site abrechnet. Launch-Partner: Nike, Sephora, Target, Ulta Beauty, Walmart, Wayfair plus alle Shopify-Händler (Fenty, Steve Madden). Im Hintergrund laufen zwei offene Protokolle: das Universal Commerce Protocol (UCP) für die Agent-Discovery und das Agent Payments Protocol (AP2) für „tamper-proof digital mandates" — Zahlungs-Autorisierungen mit klaren Grenzen und Verifizierungs-Kette. Beide Standards sind Apache-2.0 auf GitHub. Beobachter sehen UCP als Googles Versuch, in der agentischen Commerce-Welt die Mittelpositions-Maut zu kassieren, bevor Amazon, Stripe oder Visa eine eigene Standardisierung durchziehen.

Antigravity 2.0 verlässt das IDE-Format und wird zur Standalone-Plattform. Eine eigene Desktop-App orchestriert parallel laufende Coding-Agents, eine in Go neu geschriebene CLI ersetzt die alte Gemini CLI vollständig, ein SDK öffnet die gleiche Agent-Harness, mit der Google seine eigenen Produkte baut, für externe Builder. Plus: In der Gemini-API stehen jetzt Managed Agents zur Verfügung — pro API-Call wird ein isolierter Linux-Container hochgezogen, der über Multi-Turn-Sessions hinweg State hält. Demonstrationsclaim auf der Bühne: „Antigravity hat in 12 Stunden ein Betriebssystem gebaut." Pichai blieb bei der Behauptung. Auch hier: gleiches Modell unter der Haube wie der ganze Stack — Gemini 3.5 Flash. Wer in den vergangenen Wochen die Diskussion über die 100-Stunden-Tests Claude Code vs. Antigravity verfolgt hat, sieht hier den Antrieb: Antigravity ist Googles Antwort auf Anthropics Cowork und OpenAIs Codex.

Demis Hassabis schloss die Keynote mit zwei Sätzen, die die Tech-Twitter-Bubble drei Tage beschäftigen werden. „When we look back at this time, I think we will realize that we were standing in the foothills of the singularity. It will be a profound moment for humanity." Boone Ashworth, Wired-Reporter, titelte: „Demis Hassabis said this might be the foothills of the singularity. What?" Die Pointe der Reaktion: Singularitäts-Vokabular, früher Reserve futuristisch geneigter Außenseiter, wird inzwischen von einem CEO genutzt, der mit seiner Firma eine Milliarde monatliche AI-Mode-Nutzer bedient. Der Abstand zwischen Marketing und Wissenschaft schrumpft. Was Hassabis am Dienstag vortrug, war keine Aussage darüber, dass AGI erreicht ist. Es war eine Marketing-Geste, die ein neues Vokabular normalisiert. Für die nächste Reportage in dieser Ausgabe ist diese Geste ein zweitrangiger Punkt — die wichtigere Frage ist, wie die agentische Wirtschaft, die Pichai am selben Tag verkündete, das offene Web verändert. Diese Frage rollen wir im Hintergrund-Stück dieser Ausgabe auf.

Personalie · Talent-Krieg

Andrej Karpathy wechselt zu Anthropic — und baut dort ein Team, das Claude einsetzt, um die nächste Modell-Generation selbst zu trainieren

Hintergrund & Analyse

Der gesamte X-Post von Karpathy umfasst 31 Wörter — und der Anthropic-Sprecher gegenüber TechCrunch kein viel längeres Statement. „Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time." Der Anthropic-Sprecher ergänzt nur: „Karpathy will start a team focused on using Claude to accelerate pre-training research." Innerhalb einer Stunde hatte der Post fast drei Millionen Views. Bis Dienstagabend kalifornische Zeit war es der meistgesehene AI-Forschungs-Wechsel des Jahres — vor jedem Google-I/O-Highlight.

Wer Karpathy ist, lässt sich auf wenige Stationen verdichten. Geboren 1986 in Bratislava, mit 15 nach Toronto emigriert, PhD Stanford 2015 unter Fei-Fei Li, weltberühmt für die Stanford-Vorlesung CS231n und die zugehörigen Open-Source-Lehrvideos. 2015 Gründungsmitglied von OpenAI. 2017 bis 2022 Director of AI bei Tesla, verantwortlich für den Autopilot/Full-Self-Driving-Stack — direktes Berichten an Elon Musk. Februar 2023 bis Februar 2024 Rückkehr zu OpenAI in einer Forschungsrolle, parallel zur kurzzeitigen Sam-Altman-Absetzung (eine Verbindung beider Ereignisse hat Karpathy stets bestritten). Juli 2024 Gründung von Eureka Labs — ein AI-natives EdTech-Startup, dessen Erstprodukt LLM101n Studierende durchs eigene Modelltraining führte. Aktuell rund 2 Millionen X-Follower, MIT Tech Review „Innovator Under 35" und Time 100 AI.

Karpathys jüngste Arbeit signalisiert die Logik des Wechsels. Im Oktober 2025 veröffentlichte er nanochat: rund 8.000 Zeilen PyTorch-Code, der für 100 Dollar Cloud-Compute und vier Stunden GPU-Zeit einen vollständigen ChatGPT-Clone trainiert. Im Dwarkesh-Podcast vom Oktober 2025 dämpfte er gleichzeitig die AGI-Erwartungen — „still a decade away" — und kritisierte aktuelles Reinforcement Learning als „sucking supervision through a straw" und heutige Agenten als „slop". Im März 2026 dann ein Eigenexperiment: Ein Coding-Agent lief zwei Tage unbeaufsichtigt durch 700 Trainingsläufe, fand 20 Optimierungen, schnitt 11 Prozent Trainingszeit eines größeren Modells ab. Karpathy nannte es selbstironisch „part code, part sci-fi, and a pinch of psychosis". Genau diesen Ansatz — AI-assistierte Forschung, also Claude trainiert die nächste Claude-Generation — wird er nun bei Anthropic systematisch ausbauen.

Anthropics Wette ist damit klar formuliert. Während OpenAI auf Distribution (ChatGPT-Subscriptions, Dell-Hardware-Partner, Pentagon-Verträge) und Google auf vertikale Integration (Antigravity, Universal Cart, Search) setzt, glaubt Anthropic, dass der entscheidende Hebel im Wettlauf Auto-Research ist: Wenn das eigene Modell die nächste Modellgeneration schneller, besser und billiger entwickeln kann, schlägt das jeden Capex-Vorteil. Karpathy ist einer der wenigen Forscher mit gleichzeitig tiefer LLM-Theorie und Large-Scale-Training-Praxis. Dass er trotz aller Eureka-Labs-Statements zur Bildung zurück in eine Lab-Rolle wechselt, ist ein Signal — er sieht die nächsten Jahre an der Frontier als „besonders formativ".

Die Marktreaktion war eindeutig. Anthropic verhandelt aktuell laut Bloomberg und CNBC eine 30-Milliarden-Dollar-Runde bei 900 Milliarden Dollar Bewertung — Lead-Investoren Dragoneer, Greenoaks, Sequoia, Altimeter. Damit überholt das Unternehmen erstmals die 852 Milliarden Dollar von OpenAI (Stand der Finanzierungsrunde März 2026). Polymarket taxiert die Wahrscheinlichkeit, dass Anthropic vor OpenAI an die Börse geht, auf 67,5 Prozent. Der annualisierte Umsatz Anthropics steuert auf rund 45 Milliarden Dollar zu. OpenAI hat zur Karpathy-Personalie öffentlich nicht Stellung genommen — auch Sam Altman schweigt. Gizmodos Headline „as Sam Altman's Fortunes Turn" mag dramatisch sein, beschreibt aber das Stimmungsbild der Tech-Beobachter. Axios formuliert es trocken: „The AI Cold War is heating up. Anthropic was founded by OpenAI exiles. It's adding one more."

Was offen bleibt: Eureka Labs. Karpathy hat angekündigt, „in time" zur Bildung zurückkehren zu wollen. nanochat und LLM101n haben in der Open-Source-Community erheblichen Sog entwickelt — viele Lehrkräfte und Universitäten bauen darauf auf. Welche Form Eureka in den kommenden Monaten nehmen wird, ist unklar; das Unternehmen wird laut Karpathy „pausiert". Für die offene KI-Education-Szene ist das ein Verlust ihres prominentesten Akteurs. Für Anthropic ist es der dritte gewichtige Forschungskopf binnen weniger als zwei Jahren, ohne dass irgendein vergleichbarer OpenAI-Hire den Talentstrom in die Gegenrichtung gespiegelt hätte. Wer den Forscher-Talent-Strom als Frühindikator strategischer Kohärenz liest — und das tun Investoren zunehmend — sieht hier ein eindeutiges Zeichen.

M&A · Europäische AI-Konsolidierung

Mistral übernimmt Emmi AI in Linz: Frankreichs Frontier-Lab kauft Österreichs Physik-KI-Startup und positioniert sich als erstes europäisches Lab für industrielle Engineering-Simulation

Hintergrund & Analyse

Wer hinter Emmi AI steht, erklärt die Strategie. Co-Founder und Chief Scientist Johannes Brandstetter ist Tenure-Track-Professor an der JKU Linz und war zuvor Researcher bei Microsoft Research — wo er Co-Architekt des Foundation-Models „Aurora" war, das Wettermodellierung neu organisiert hat. Davor: CERN. Mit ihm leiten CEO Dennis Just und Miks Mikelsons das Unternehmen, das aktuell rund 30 Forscherinnen und Ingenieure aus JKU, Oxford, TUM, Sorbonne, UPenn und Harvard beschäftigt. Die Funding-Runde im April 2025 lieferte 15 Millionen Euro durch Speedinvest, Serena VC, 3VC und PUSH — laut JKU der größte Seed-Deal Österreichs aller Zeiten. Die Bewertung wurde nicht öffentlich gemacht.

Was Emmi AI technisch baut, ist die wahre Pointe der Übernahme. Klassische Ingenieurssimulation läuft auf Solver-Engines wie ANSYS oder Siemens NX — Differentialgleichungen werden auf Millionen von Gitterzellen numerisch gelöst, Berechnungszeiten reichen von Stunden bis zu mehreren Wochen pro Designvariante. Emmi AIs Kern-Modelle AB-UPT (Anchored-Branched Universal Physics Transformers), NeuralCFD und NeuralDEM sind Deep-Learning-Surrogate, die diese Berechnungen in Millisekunden bis Sekunden liefern. AB-UPT skaliert nachweislich auf über 100 Millionen Mesh-Zellen — Automotive-Aerodynamik passt auf eine einzelne GPU. NeuralDEM ist Open Source und simuliert industrielle Partikelströmungen in Echtzeit. Die wissenschaftliche Basis: Universal Physics Transformers, eine gitter- und partikelagnostische Architektur, die für unterschiedliche physikalische Domänen gleichzeitig trainiert werden kann.

Strategisch passt das in Mistrals Pivot vom Frontier-LLM zum vertikal verteidigbaren Industrie-Lab. Statt mit OpenAI, Anthropic und Google ums beste reine Sprachmodell zu kämpfen, besetzt Mistral Domänen, in denen sich europäische Industrie-Tradition zu Daten-Asset wandelt. Februar 2026 die Koyeb-Akquisition (Cloud-Deployment, europäische Souveränität), April 2025 Mistral Compute (18.000 Nvidia Blackwell GPUs, 40 MW in Essonne), parallel das ASML-Investment von 1,3 Milliarden Euro, die deutsch-französische SAP-Partnerschaft und das 1,2-Milliarden-Euro-Datacenter in Borlänge/Schweden. Mit Emmi AI wird Mistral nun, in Brandstetters Formulierung, „the first frontier lab for industrial engineering and manufacturing" — direkter Wettbewerber zu Nvidia Omniverse, Siemens Xcelerator und dem israelischen Decart.

Auch im Vergleich zu Anthropics Akquisitions-Muster wird die Logik deutlich. Anthropic kaufte in sechs Monaten: Bun (JS-Runtime, Dezember 2025), Vercept (Computer-Use-Agent, Februar 2026), Coefficient Bio (Biotech, April 2026), Stainless (SDK-Layer, Mai 2026). Stoßrichtung: vertikal integrierter Agent-Stack — Runtime, Operator, Domäne, Connector — alles für die US-Software-/Developer-Layer. Mistrals Stoßrichtung dagegen: vertikale Industrie-Domänen — Cloud-Deployment, Physik, Manufacturing — Fokus auf europäische Industrieabnehmer. Beide Lab-Cluster verfolgen also dieselbe Stack-Vertiefungs-Logik jenseits des Modells, aber für unterschiedliche Endmärkte: Anthropic für die US-Agenten-Ökonomie, Mistral für Europas Old-Industry.

Für Mistrals Pacte-IA-Narrativ und Macrons KI-Strategie ist die Akquisition ein politisches Signal. Nach Arthur Menschs „Vasallenstaat"-Audition vor der Assemblée nationale im Mai 2026 (siehe unsere Reportage) ist Mistral der Hoffnungsträger der europäischen Souveränitäts-Achse. Eine Akquisition in Linz erweitert diese Achse zum ersten Mal in das deutschsprachige Mitteleuropa und signalisiert: Mistral baut die europäische KI-Industrie nicht entlang der nationalen Champion-Logik, sondern entlang von Forschungs-Hotspots. JKU Linz war über NXAI bisher die wichtigste deutschsprachige KI-Forschungsbastion. Mit der Übernahme wird Emmi-Geschäftsführer Dennis Just zum Lead des neuen Mistral-Linz-Office, das laut trendingtopics.eu von aktuell 15-20 auf 40-50 Mitarbeiter wachsen soll. Brandstetter wird formell als „VP AI for Science" eingeordnet.

Transparenz · Content Provenance

OpenAI launcht öffentliches Verifikations-Tool für KI-Bilder — Doppelschicht aus C2PA und SynthID-Wasserzeichen soll erstmals Screenshots, Cropping und Metadaten-Stripping überleben

Hintergrund & Analyse

Der zentrale technische Schritt ist die Kombination zweier bisher separater Schichten. C2PA-Content-Credentials (das offene „CR-Logo"-Manifest, das OpenAI seit DALL·E 3 in seine Bilder einbettet) sind kryptografisch signierte Metadaten zu Herkunft und Bearbeitungshistorie — wertvoll, aber leicht zu entfernen, sobald jemand das Bild als Screenshot abfotografiert oder durch eine verlustbehaftete Pipeline schickt. SynthID dagegen ist ein perceptuelles Wasserzeichen, das Google DeepMind in die Pixeldaten selbst einbettet, statistisch verteilt, für menschliche Augen unsichtbar und nach Google-Angaben robust gegen die meisten Standard-Transformationen. Mit der gestrigen Ankündigung wird SynthID erstmals branchenweit auf OpenAI-Bilder ausgeweitet — ChatGPT-, Codex- und API-Outputs erhalten zusätzlich zur C2PA-Signatur ein SynthID-Watermark.

Wie der Workflow für Nutzer aussieht, hat OpenAI ebenfalls präzisiert. Auf der neuen Seite openai.com/research/verify lädt man ein Bild hoch. Das Tool prüft auf beide Signale gleichzeitig: C2PA-Content-Credentials und SynthID-Watermark. Output: eine Bestätigung, ob das Bild aus dem OpenAI-Ökosystem stammt. Beim Launch erkennt das Tool nur OpenAI-eigene Bilder; die Cross-Industry-Verifikation für Bilder aus Imagen, Midjourney, FLUX und weiteren Modellen ist laut Roadmap „in den kommenden Monaten" geplant. OpenAI ist seit Mai 2024 im C2PA-Steering-Committee zusammen mit Adobe, Amazon, BBC, Google, Intel, Meta, Microsoft, Publicis Groupe, Sony und Truepic. Letztgenannte fungieren als Standardisierungs- und Adoption-Plattform.

Der politische Kontext erklärt den Zeitpunkt. Im März 2026 veröffentlichte das National Republican Senatorial Committee (NRSC) das erste vollständig KI-generierte politische Deepfake-Video eines amerikanischen Politikers (James Talarico) mit kaum erkennbarem Disclosure-Label — CNN bezeichnete den Vorgang als historischen Präzedenzfall. Im April 2026 publizierte das Council of Europe ein Memorandum, das Pflicht-Wasserzeichen für synthetische Politiker-Inhalte fordert. 58 Prozent der US-Erwachsenen erwarten laut Pew Research im Wahljahr eine Eskalation synthetischer Falschinformationen. OpenAIs Schritt am Dienstag positioniert das Unternehmen explizit als technischer Antwort-Geber — anstatt rein über die Modell-Karte oder Trust-and-Safety-Statements zu agieren, liefert OpenAI nun ein Konsumenten-Tool.

Für Audio und Video bleibt die Strategie dünn besetzt. Sora — OpenAIs Videogenerator — wurde zwischen März und September 2026 in mehreren Stufen abgewickelt (siehe unsere Berichterstattung zur Sora-Diskontinuierung). Bestehende Sora-Videos tragen sichtbares Wasserzeichen und C2PA-Metadaten; für aktuell ausgegebene Videos aus dem OpenAI-Stack ist die Provenance-Lage praktisch leer, bis ein Nachfolge-Modell erscheint. Audio ist laut OpenAI-Blog die nächste Roll-out-Welle — konkrete Termine fehlen. Branchen-Beobachter weisen darauf hin, dass Audio-Wasserzeichen technisch schwieriger sind als Bild-Wasserzeichen, da die Token-Auflösung deutlich niedriger ist.

Die Adoption über das Ökosystem hinaus entscheidet, ob das Tool seinen Zweck erfüllen kann. Microsoft setzt C2PA bereits in Azure OpenAI ein („Content Credentials in Azure OpenAI"-Doku). BBC und Truepic implementieren C2PA in ihren News-Pipelines. ElevenLabs und Kakao gehörten laut Google I/O 2026 zu den ersten SynthID-Drittadoptern für Audio bzw. Bilder. Was bislang fehlt: eine flächendeckende Integration in Browser, Social-Media-Plattformen und Messaging-Apps. Meta hat C2PA-Adoption für Instagram und Facebook angekündigt, ein Roll-out-Termin steht aus. Die EU-Kommission diskutiert im Rahmen des AI-Act-Artikels 50 eine Kennzeichnungspflicht für AI-generierte Medien, die ab August 2026 wirksam wird — und in der Praxis ohne ein C2PA-/SynthID-Substrate kaum durchsetzbar wäre. OpenAIs Schritt ist damit auch ein regulatorisch motiviertes Vorpreschen.

Corporate · Meta-Restrukturierung

Meta entlässt 8.000 Mitarbeiter und versetzt 7.000 in vier neue KI-Einheiten — gleichzeitig stürzen Beschäftigte sich auf das 2.000-Dollar-Wellness-Budget, bevor die Schwelle fällt

Hintergrund & Analyse

Die Strukturlogik der Restrukturierung ist klar zweigleisig. Auf der einen Seite die Layoffs: 8.000 Stellen weg, getroffen primär das mittlere Management und administrative Funktionen — Janelle Gale, Meta Chief People Officer: „Many org leaders incorporated AI native design principles into their new org structures. We're now at the stage where many orgs can operate with a flatter structure with smaller teams of pods/cohorts that can move faster and with more ownership." Auf der anderen Seite die Versetzungen: 7.000 Mitarbeiter werden in vier neu zugeschnittene KI-Einheiten transferiert — Applied AI Engineering baut produktive KI-Features, Agent Transformation Accelerator XFN treibt die Agentisierung interner Prozesse, Central Analytics überwacht Produktivität und Leistung der internen Agenten, und Enterprise Solutions adressiert die Geschäftskunden-Schicht.

Über allem stehen die Meta Superintelligence Labs. MSL entstand Mitte 2025 nach dem 14-Milliarden-Dollar-Deal mit Scale AI, der Alexandr Wang als Chief AI Officer zu Meta brachte. Wang leitet TBD Lab (Frontier-LLMs), FAIR (Research), Products and Applied Research (Nat Friedman) und MSL Infra (Aparna Ramani). Yann LeCun, langjähriger Chief AI Scientist und Co-Vater der Llama-Open-Source-Linie, verließ Meta im März 2026 nach 12 Jahren — sein Abgang wurde im November 2025 angekündigt. Gegenüber der Financial Times wurde LeCun deutlich: „You don't tell a researcher what to do. You certainly don't tell a researcher like me what to do." Und: LLMs seien „a dead end when it comes to superintelligence". LeCun gründete AMI Labs mit dem alternativen V-JEPA-Ansatz.

Das Modell, das den Strategiewechsel inkarniert, heißt Muse Spark. Im April 2026 stellte Meta die neue „Muse"-Familie vor — „Scaling Towards Personal Superintelligence" als Titel. Muse Spark ist nativ multimodal, mit Tool-Use, Visual Chain-of-Thought, Multi-Agent-Orchestrierung; das Health-Reasoning-Modul wurde mit über 1.000 Ärztinnen und Ärzten kuratiert. Roll-out über Facebook, Instagram, WhatsApp, Messenger und Ray-Ban Meta Smart Glasses. Wesentlich: Muse Spark ist Closed Source. Das ist der Bruch mit der Llama-Open-Source-Tradition, der die ganze Reorganisation logisch konsistent macht. Bei einem Capex-Budget von 125 bis 145 Milliarden Dollar für 2026 (erhöht von ursprünglich 115-135) braucht Meta einen direkten Monetarisierungspfad — Open-Weights-Veröffentlichung von Frontier-Modellen würde diese Investition nicht amortisieren.

Zusätzlich zur Modell-Reorganisation beschleunigt Meta seine MTIA-Chip-Roadmap dramatisch. Vier Chip-Generationen binnen zwei Jahren — MTIA 300 läuft bereits in der Produktion, 400 (6 PFLOPs FP8, 288 GB HBM, 9,2 TB/s Bandbreite, 1.200 W) folgt 2026, 450 (7 PFLOPs, 18,4 TB/s, 1.400 W) Anfang 2027, 500 (10 PFLOPs, bis zu 512 GB HBM, 27,6 TB/s, 1.700 W) später 2027. Release-Kadenz ein Chip alle sechs Monate — die Industrie liefert sonst alle 12-24 Monate. Von MTIA 300 zu MTIA 500 wächst die HBM-Bandbreite um Faktor 4,5, die Compute-FLOPs um Faktor 25. Im Hintergrund das Gigawatt-Rechenzentrum in Louisiana, finanziert über ein 27-Milliarden-Joint-Venture mit Blue Owl Capital — und Zuckerbergs öffentliches Versprechen „hundreds of gigawatts of capacity over the decade".

Wie die Stimmung in den Büros wirklich ist, hat Wired in 16 Mitarbeiter-Interviews dokumentiert. Beschäftigte beschreiben sich als „paralyzed", „coasting" und „panicked". Lebensläufe werden poliert, Offsite-Treffen finden in Kaffees statt im Büro statt. Manche hoffen offen darauf, entlassen zu werden — denn Metas Severance-Paket umfasst 16 Wochen Grundgehalt plus 2 Wochen pro Beschäftigungsjahr plus 18 Monate COBRA-Krankenversicherung; in Kalifornien überlappen 8,5 Wochen der „16 Wochen" mit gesetzlich vorgeschriebener WARN-Period, in New York 13. Die zentrale ironische Drehung im Wired-Bericht: Mitarbeiter optimieren in den letzten Wochen ihre konzerneigenen Benefits. Das jährliche 2.000-Dollar-Wellness-Budget wird verschwenderisch ausgeschöpft, das triennale 200-Dollar-Audio-Guthaben löst einen Run auf AirPods Pro 2 aus. Auf die Frage eines Q1-Earnings-Calls nach Capex-ROI antwortete Zuckerberg laut Fortune: „That's a very technical question." Auch das ist eine Antwort.

Infrastruktur · Agent Governance

NVIDIA Verified Agent Skills: Der Capability-Layer für Coding-Agenten bekommt erstmals eine kryptografische Trust-Schicht — Scanning, Signatur und Skill Card auf Anthropics offenem Standard

Hintergrund & Analyse

Der Kernsatz im NVIDIA-Blog formuliert die Stoßrichtung knapp. „Trust should come from verifiable integrity and authenticity, not from implied provenance alone." Damit benennen die fünf Co-Autoren der Ankündigung — Abramovitch, Boone, Kandarkar, Major, Paz — eine Lücke, die der Agent-Markt 2026 bisher offengelassen hatte. Existierende Agent-Sicherheits-Layer fokussieren auf Runtime-Guardrails (NVIDIAs NeMo Guardrails, Anthropics Sandboxes) und auf Capability-Bezug (MCP-Server, Skill-Marketplaces). Die Skills selbst — die portablen Instruction-Sets, die einem Agenten beibringen, wie er ein bestimmtes Tool oder eine Bibliothek korrekt nutzt — waren in der Praxis ein Vertrauens-Blind-Spot: Wer hat sie geschrieben? Wurden sie nach Publikation modifiziert? Welche Rechte fordern sie ein? Was tun sie tatsächlich?

Die Verifizierungs-Pipeline läuft achtschrittig. Source Repository → Review (human plus automatisiert) → SkillSpector-Scanning → Evaluation → Skill-Card-Generierung → kryptografisches Signing (detached skill.oms.sig) → Katalogisierung → täglicher Sync ins öffentliche Verzeichnis. SkillSpector prüft konventionelle Software-Risiken: vulnerable Dependencies, suspicious Scripts, dangerous Code Patterns, Credential Access, Data Exfiltration Paths. Plus agent-spezifische Risiken: hidden Instructions, Prompt Injection, Trigger Abuse, Excessive Agency, Tool Poisoning, Mismatches zwischen deklariertem Zweck, eingeforderten Rechten und tatsächlichem Verhalten. Die Skill Card als Output dokumentiert Funktionalität, Autoren, Lizenzierung, Abhängigkeiten, technische Limitations, Risiken, Verifikationsstatus.

Im Repository NVIDIA/skills liegen heute 129 verifizierte Skills aus 16 NVIDIA-Produkten. Größte Cluster: cuOpt mit 12 Skills (Routing, Supply-Chain-Optimierung), TensorRT-LLM mit 23 Skills (LLM-Inferenz), NemoClaw mit 23 Skills (Agent-Sandboxing), Megatron-Bridge mit 29 Skills (Datenverarbeitung, Modellkonvertierung). Weitere Produkte: CUDA-Q, DALI, DeepStream, Megatron-Core, Model-Optimizer, NeMo Evaluator, NeMo Gym, Nemotron Voice Agent, RAG Blueprint, TileGym, Video Search and Summarization Blueprint. Die Skills sind kompatibel mit allen aktuellen Coding-Agenten-Hosts: Claude Code, OpenAI Codex/Codex CLI, Cursor, GitHub Copilot, Gemini CLI, AWS Kiro-CLI. Da NVIDIA auf dem offenen agentskills.io-Standard aufsetzt, sind auch die ursprünglichen Anthropic-Skill-Partner — Atlassian, Figma, Canva, Stripe, Notion, Zapier — formal kompatibel.

Strategisch interessant ist die Abgrenzung zu den Konkurrenz-Stacks. Anthropic Skills sind das Format selbst — der offene Standard, geöffnet im Dezember 2025. OpenAI Function Calling adressiert die Tool-Aufruf-Mechanik, nicht die Capability-Verifizierung. AWS Bedrock AgentCore baut eine Runtime-Plattform (Memory, Gateway, Identity, Browser). NVIDIA differenziert sich also nicht durch ein neues Skill-Format, sondern durch eine zusätzliche Trust-Layer auf einem geöffneten Standard: Scanning, Signing, Skill Cards. Das Lock-in-Risiko bleibt niedrig — Skills laufen weiter auf Nicht-NVIDIA-Hardware — aber wer NVIDIA-Bibliotheken und CUDA-X-Stack einsetzt, bekommt eine verifizierbare Capability-Schicht zwischen Modell und Bibliothek.

Eingebettet ist die Ankündigung in den Computex-2026-Zyklus. Computex lief vom 19. bis 23. Mai in Taipeh, NVIDIAs Jensen-Huang-Hauptkeynote wurde auf den 1. Juni vorverlegt und findet eigenständig am Taipei Music Center statt. Der Verified-Agent-Skills-Blogpost ist damit keine Keynote-Ankündigung, sondern eine Entwickler-Veröffentlichung — mit überraschend dünnem Medien-Echo: Stand heute Mittag haben weder TechCrunch noch Heise oder Golem eine eigene Berichterstattung gebracht. Beachtenswert ist die parallele Partnerschaft mit ServiceNow (Project Arc, Mai 2026), in der NVIDIA Verified Skills und ServiceNow AI Control Tower zur ersten produktiven Agentic-AI-Governance-Achse zusammengeführt werden — eine Schicht, die für regulierte Enterprises (Pharma, Finance, Manufacturing) im AI-Act-Kontext kritisch wird.

Reportage

Die Agentisierung der Suche — was Google I/O 2026 für das offene Web bedeutet

Weiterlesen →

Tool-Radar

Neue und trendende KI-Tools des Tages

Gemini 3.5 Flash Logo
Neues Frontier-Modell von Google DeepMind — übertrifft Gemini 3.1 Pro auf Agent- und Coding-Benchmarks bei 40 Prozent niedrigerem Preis.
1,50 USD Input / 9,00 USD Output pro Million Token, 1M Kontextfenster, 4x schneller als andere Frontier-Modelle bei Output-Token. Powerhouse für Antigravity 2.0, AI Mode und Gemini Spark.
Frontier-Modell · 19. Mai 2026
Gemini Spark Logo
Googles 24/7-Agent mit eigener Gmail-Adresse, der auf einer dedizierten Cloud-VM dauerhaft im Hintergrund Aufgaben erledigt.
Beobachtet Posteingang, Kalender und Drittanbieter auch bei ausgeschaltetem Telefon, plant mehrstufige Tasks und holt nur bei riskanten Aktionen Freigabe. Direkte Konkurrenz zu OpenClaw und Claude Routines.
Agent · 19. Mai 2026
Statewright Logo
Open-Source-Engine, die Coding-Agenten phasenspezifische Tool-Constraints via Visual State Machines aufzwingt.
Deterministische Rust-Engine ohne LLM in der Orchestrierung. Auf einem SWE-bench-Subset wurde die Erfolgsrate von 2/10 auf 10/10 gehoben, sobald die Constraints aktiviert wurden — read-only beim Planning, edit-tools nur in Implementation.
Coding-Agent-Infrastruktur · 18. Mai 2026
Voker Logo
Agent-Analytics-Plattform, die LLM-Agent-Interaktionen in queryable Conversation-Timelines, User-Intent-Erkennung und Outcome-Correlation umwandelt.
Y-Combinator-S24-Startup, gerade mit 2,2 Mio. USD Pre-Seed aus Stealth raus. Adressiert die Lücke, dass traditionelles SaaS-Monitoring für klassische Apps designed ist, nicht für conversational Agenten.
Agent-Observability · 19. Mai 2026
Shadow Logo
Mac-natives AI-Interface, das System-Audio und aktive Fenster mitschneidet, ohne als Bot in Calls beizutreten.
Audio-Transkription läuft lokal auf dem Mac, Meeting-Detection OS-weit für Zoom, Meet, Teams, Webex, Slack-Huddles und Discord. Privacy-first als Alleinstellungsmerkmal gegen Otter, Fireflies und Granola — #4 auf Product Hunt am 18. Mai.
Produktivität · 18. Mai 2026
ReactVision Studio Logo
Browser-basierter Visual-Editor für AR/VR-Szenen mit KI-generierten 3D-Assets aus Text- oder Bild-Prompts und Live-Preview via Phone.
Füllt die Lücke nach der 8th-Wall-Abschaltung im Februar 2026. Dasselbe React-Native-Projekt läuft als Phone-AR und auf Quest 2/3/Pro — kein Engine-Swap. Open-Source-Renderer mit 100K+ npm-Installs, Expo-kompatibel.
Kreativ · 18. Mai 2026

Aus der Werkstatt

YouTube-Empfehlungen: Tutorials, Erklärungen und Werkzeuge

Gemini 3.5 Flash is the Best Google Model Yet?
Tutorial
Prompt Engineering · 18:59
Detaillierter technischer Hands-on-Test des neuen Gemini-Modells direkt nach der I/O-Keynote. Der Kanal — 241.000 Abonnenten, primär API- und Coding-Vergleichstests — geht durch Performance auf Coding-Aufgaben, Reasoning-Benchmarks und Tool-Use-Verhalten und bewertet die Preis-Leistungs-Position gegen Claude Opus 4.7 und GPT-5.5.
What Karpathy Joining Anthropic Actually Means For Claude
Tutorial
Nate Herk | AI Automation · 16:24
Nate Herk analysiert in unter 24 Stunden nach Karpathys X-Post die strategischen Implikationen des Wechsels — was die „Pre-Training-Acceleration via Claude"-Rolle bedeutet, warum der Talent-Strom konsistent von OpenAI nach Anthropic fließt und welche Wette Anthropic gegen die Capex-Logik von OpenAI und Google fährt.