· 6 Artikel + Reportage + Tool-Radar + Werkstatt

Ausgabe vom 17. April 2026

Maschinell recherchiert, menschlich relevant.

KI-Modelle · Anthropic

Claude Opus 4.7: Das neue Flaggschiff, das Anweisungen wörtlich nimmt

Hintergrund & Analyse

Am späten Nachmittag des 16. April veröffentlichte Anthropic Opus 4.7 als allgemein verfügbares Modell. Die Preise bleiben gegenüber Opus 4.6 unverändert bei 5 Dollar pro Million Input-Token und 25 Dollar pro Million Output-Token, das Kontextfenster beträgt eine Million Token, das Modell ist sofort auf Claude.ai, über die API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry und Snowflake Cortex verfügbar.

In den Benchmarks legt Opus 4.7 deutlich zu. Auf SWE-bench Pro, das reale Software-Engineering-Aufgaben testet, erreicht das Modell laut llm-stats 64,3 Prozent — ein Sprung gegenüber 53,4 Prozent bei Opus 4.6, vor GPT-5.4 (57,7 Prozent) und Gemini 3.1 Pro (54,2 Prozent). Auf SWE-bench Verified klettert der Wert von 80,8 auf 87,6 Prozent, Terminal-Bench 2.0 steigt von 65,4 auf 69,4 Prozent. OSWorld-Verified (78 Prozent) und MCP-Atlas (77,3 Prozent) zeigen stärkere Werkzeugnutzung. Die Bildverarbeitung akzeptiert nun Bildkanten bis 2.576 Pixel — das Dreifache des Vorgängers. Anthropic selbst nennt Opus 4.7 „state-of-the-art“ für Coding und Long-Context-Aufgaben.

Der eigentliche Paradigmenwechsel steckt im Namen des Release: „substanziell besser bei der Befolgung von Anweisungen“. Opus 4.6 war bekannt dafür, Prompts proaktiv umzuinterpretieren — wenn etwa ein Entwickler bat, eine Funktion zu löschen, räumte das Modell mit oft auch verwandten Code auf. Opus 4.7 tut das nicht mehr. Anthropic weist explizit darauf hin, dass bestehende Prompts „unerwartete Ergebnisse“ liefern können und überarbeitet werden müssen. In der Community auf Hacker News wird das gemischt aufgenommen: Wörtlichkeit erhöht die Verlässlichkeit für Agenten-Workflows, verringert aber die „magische“ Erfahrung, wenn ein Modell Zusammenhänge eigenständig erkennt.

Opus 4.7 tritt in ein spezielles Verhältnis zu Anthropics Mythos-Preview, dem Cyber-Security-Modell, das wir in unserer Ausgabe vom 8. April vorstellten. Anthropic hat Opus 4.7 bewusst schwächer bei offensiven Cyberaufgaben trainiert („differentially reduce these capabilities“) und zusätzliche Safeguards eingebaut. Die Botschaft: Opus ist das Arbeitspferd für breite Anwendung, Mythos bleibt elitenzugänglich. VentureBeat titelt „narrowly retaking lead for most powerful generally available LLM“ — eine typisch amerikanische Formulierung für: Das Modell ist knapp vorn, aber Anthropic räumt selbst ein, dass Mythos intern stärker ist.

Für Entwickler ändern sich zwei Details, die nicht in den Pressemitteilungen stehen, aber in der Praxis Wirkung entfalten. Erstens nutzt Opus 4.7 einen neuen Tokenizer, der je nach Text bis zu 1,35-mal mehr Tokens erzeugt als der Vorgänger — die effektiven Kosten steigen damit trotz gleichem Pro-Token-Preis. Zweitens ist das „Adaptive Thinking“ standardmäßig aktiv: Das Modell entscheidet selbst, ob es ausführlich denkt oder nicht. Wer die Gedankenspur sehen will, muss display: summarized setzen. GitHub Copilot berechnet Opus 4.7 mit 7,5 Premium-Requests pro Aufruf — ein Aufschlag, der zu kontroversen Diskussionen in der Developer-Community führt.

KI-Entwicklung · OpenAI

OpenAI kontert: Codex übernimmt den Mac — parallel, im Hintergrund

Hintergrund & Analyse

Der zeitliche Zufall könnte passender nicht sein. Noch am selben 16. April, an dem Anthropic Opus 4.7 freigab, rollte OpenAI ein großes Update seiner Codex-Desktop-App aus. Das Leitfeature: Computer Use. Codex kann Desktop-Anwendungen öffnen, mit einem eigenen Cursor klicken, Text eintippen und mehrere Aufgaben parallel bearbeiten. Laut OpenAI läuft das Ganze im Hintergrund, ohne dass der Mac blockiert wird — ein Vorteil gegenüber Anthropics Computer-Use-Research-Preview, bei dem der Rechner während der Agent-Aktion praktisch gesperrt ist. Intern nutzt OpenAI das Feature bereits für Qualitätssicherung.

Neu sind außerdem: Ein integrierter Atlas-Browser, in dem Codex einzelne DOM-Elemente kommentieren und später ganze Web-Anwendungen steuern können soll. Ein Memory-System, das sich über Sessions hinweg den Tech-Stack, Workflows und Präferenzen merkt. Multi-Agent-Workflows, in denen spezialisierte Agenten für Schreiben, Debugging und Testing parallel laufen. Und Heartbeat Automations: Codex kann sich selbst zukünftige Aufgaben schedulen und tagelange Vorhaben wiederaufnehmen. Dazu ein eingebauter Bildgenerator (gpt-image-1.5), 90+ Plugin-Integrationen von Atlassian Rovo über CircleCI und CodeRabbit bis GitLab, Microsoft Suite und Neon.

Der Haken für europäische Entwickler: Computer Use und Memory sind zum Launch nicht in der EU und in Großbritannien verfügbar. OpenAI begründet das nicht explizit, Branchenkenner vermuten DSA- und AI-Act-Unsicherheiten. Wer heute produktiv in der EU mit autonomen Desktop-Agenten arbeiten will, muss weiter auf Claude Code oder alternative Harnesses ausweichen — ein nicht zu unterschätzender Nachteil im Wettbewerb um Software-Engineering-Produktivität.

Die Nutzerzahlen zeigen, warum OpenAI diesen Push unternimmt. Anfang April verkündete Sam Altman 3 Millionen wöchentliche Codex-Nutzer und setzte aus diesem Anlass die Nutzungslimits zurück — ein Geschenk, das OpenAI bei jeder weiteren Millionen-Marke bis 10 Millionen wiederholen will. Intern nutzen laut The New Stack bereits 80 Prozent aller OpenAI-Mitarbeitenden Codex. Das Unternehmen baut aus der Desktop-App systematisch eine „Super-App“, wie The New Stack es nennt — eine einzige Schaltzentrale für alles, was früher in separaten Tools stattfand: IDE, Terminal, Browser, Projektmanagement.

Pikant: Codex und Claude Code werden von TechCrunch explizit als Konkurrenten um denselben Markt beschrieben, aber gleichzeitig existiert ein offizielles Codex-Plugin für Claude Code. Die Tools interoperieren auf technischer Ebene, während ihre Anbieter sich medial bekämpfen — ein typisches Muster der aktuellen KI-Entwicklungsphase. Für Teams bedeutet das: Vendor-Lock-in lässt sich durch Harnesses wie OpenRouter, LiteLLM oder gen-lock-freie Agent-Frameworks heute weitgehend vermeiden. Wer direkt auf OpenAI-SDK oder Anthropic-SDK baut, zahlt später höhere Switching-Kosten.

KI & Wirtschaft

Anthropic plant Design-Tool: Figma verliert Boardmitglied und 6 % Kurs

Hintergrund & Analyse

Die SEC-Einreichung datiert auf den 14. April, veröffentlicht wurde die Nachricht am 16. April von TechCrunch. Mike Krieger, seit Mai 2024 Chief Product Officer bei Anthropic, trat mit sofortiger Wirkung aus dem Figma-Board zurück, dem er gemeinsam mit Duolingo-CEO Luis von Ahn keine zwölf Monate angehört hatte. Figmas offizielle Begründung — „nicht aufgrund von Meinungsverschiedenheiten“ — ist die diplomatische Formel für einen klassischen Interessenkonflikt. Krieger hatte als Boardmitglied Einblick in Figmas strategische Roadmap, während Anthropic im Stillen an einem Konkurrenzprodukt arbeitete.

Dieses Produkt leakte The Information am 14. April: Opus 4.7 werde mit einem eigenständigen AI-Design-Tool ausgeliefert, das Websites, Landing Pages, Präsentationen und Prototypen aus natursprachigen Prompts generiert. Zielgruppe sind ausdrücklich auch Nicht-Designer. Anthropic positioniert sich damit frontal gegen Figma, Adobe, Wix, GoDaddy, Gamma, Canva und Googles Stitch. Kein Assistenz-Werkzeug für existierende Designer, sondern ein Ersatz für den Start-Workflow.

Die Markt-Reaktion war unmissverständlich. Figma verlor am Tag der Gerüchte rund 6 Prozent, Adobe, Wix und GoDaddy mehr als 2 Prozent. Nach Kriegers Austritt erholte sich Figma wieder um 5 Prozent — Erleichterung über die saubere Trennung. Analysten sprechen von einer zweiten Welle des „SaaSpocalypse“, einer These, die im Februar 2026 nach dem Launch von Claude Cowork Karriere machte und seither die Q1-Bewertungen im B2B-SaaS-Sektor prägt: Wenn ein Foundation-Model-Anbieter beschließt, vertikal in einen SaaS-Markt hineinzuwachsen, sind die etablierten Spieler strukturell angreifbar — nicht weil das erste KI-Tool das beste ist, sondern weil das Modell selbst den Wettbewerbsvorteil darstellt.

Figma-CEO Dylan Field hat im Februar, als Figma und Anthropic noch die „Code to Canvas“-Partnerschaft verkündeten, eine defensive Positionierung formuliert: „In a world where AI can help build any possibility you can articulate, your core work is to find the best possible solutions in a nearly infinite possibility space.“ Design werde zur Kunst der kuratorischen Auswahl aus einem unendlichen Möglichkeitsraum. Ob Geschmack und redaktionelles Urteilsvermögen ausreichen, um ein Tool wie Figma gegen Modelle zu verteidigen, die selbst Alternativen generieren können, ist die offene Frage dieses Jahres. Kriegers Austritt zeigt zumindest: Auch Figmas Board glaubt nicht mehr an Koexistenz auf gleicher Augenhöhe.

KI-Politik · UK

Großbritannien startet 500-Millionen-Pfund-Fonds für souveräne KI

Hintergrund & Analyse

Am 16. April startete das britische Department for Science, Innovation and Technology (DSIT) eine neue „Sovereign AI Unit“ mit einem Volumen von 500 Millionen Pfund. An der Spitze steht James Wise, Partner beim Londoner VC Balderton — er behält seinen VC-Job und signalisiert damit den ungewöhnlichen Betriebsmodus der Einheit: Sie soll mit dem Tempo eines Wagniskapitalgebers arbeiten, nicht mit dem einer Behörde. Das Instrumentarium ist drei-teilig: direkte Eigenkapitalbeteiligungen, Compute-Gutscheine von bis zu einer Million GPU-Stunden pro Startup über die staatliche AI Research Resource, sowie schnelle Visa und Zugang zu Regierungsdaten.

Die erste Kohorte umfasst sieben Unternehmen, von denen nur eines — Callosum, ein Londoner Infrastruktur-Startup für Multi-Chip-Architekturen — eine direkte Kapitalbeteiligung erhält. Die anderen sechs bekommen Compute-Zugang: Prima Mente (Foundation-Modelle für Hirnerkrankungen), Cosine (On-Prem-Coding-Agent für Verteidigung), Cursive (Infrastruktur), Doubleword (Inferenz und Governance), Twig Bio (Foundation-Modell für Biomanufacturing) und Odyssey (World Models für Verteidigung und Autonomie). Weitere 30 Unternehmen werden laut DSIT verhandelt.

Der Kontext ist direkter, als es in offiziellen Verlautbarungen wirken soll. Am 9. April pausierte OpenAI das Stargate-UK-Projekt (ursprünglich 8.000 GPUs, skalierbar auf 31.000) wegen hoher Energiepreise und dem Zurückziehen einer geplanten Copyright-Ausnahme für KI-Training. AI-Minister Kanishka Narayan widersprach OpenAI in Bloomberg-Interviews: An den Energiekosten habe sich gegenüber dem Vertragsschluss nichts geändert. Eine Woche später antwortet die Regierung mit dem Sovereign-AI-Fonds — eine Mischung aus Trotzreaktion und strategischem Pivot weg von der Abhängigkeit von US-Hyperscalern.

Parallel meldet Anthropic: Das Unternehmen hat im Londoner Knowledge Quarter ein Büro für bis zu 800 Mitarbeiter angemietet — eine Vervierfachung der aktuellen rund 200 UK-Kräfte, von denen etwa 60 Sicherheitsforscher sind. Das Timing ist politisch abgestimmt und signalisiert, dass Starmer und Kendall trotz des Stargate-Dämpfers weiterhin AI-Champions anziehen können. Die Rolle Großbritanniens als dritter Pol neben USA und EU wird damit greifbarer. Welche praktischen Implikationen sich für Unternehmen ergeben — und was Europa dagegensetzt — beleuchten wir ausführlich in unserer Reportage dieser Ausgabe.

Robotik

Physical Intelligence π0.7: Ein Roboterhirn, das improvisiert

Hintergrund & Analyse

Das Startup Physical Intelligence, gegründet 2024 in San Francisco von Karol Hausman (Ex-Google-DeepMind), Sergey Levine (UC Berkeley) und Chelsea Finn (Stanford), verfolgt eine bewusst hardwareneutrale Strategie: Statt eigene Roboter zu bauen, entwickelt das Unternehmen Foundation-Modelle, die auf jeder Plattform laufen — von Franka-Armen über ALOHA-Doppelarm-Setups bis zu mobilen Manipulatoren. Laut Bloomberg und TechCrunch befindet sich Physical Intelligence gerade in Gesprächen für eine neue Finanzierungsrunde bei einer Bewertung von rund 11 Milliarden Dollar, nachdem die Vorgehensrunde mit 5,6 Milliarden abgeschlossen wurde.

Das am 16. April vorgestellte π0.7 ist das dritte Modell der Reihe nach π0 und π0.5. Der Begriff, den die Firma für den Fortschritt wählt, lautet „compositional generalization“ — zu deutsch etwa: kombinatorische Verallgemeinerung. Gemeint ist ein Szenario, das die bisherigen VLA-Modelle (Vision-Language-Action) überforderte: Der Roboter bekommt eine Aufgabe, für die im Trainingsdatensatz nur einzelne, isolierte Fragmente existieren, und muss diese sinnvoll kombinieren.

Ein Beispiel aus der Demonstration: Ein Air-Fryer-Task — der Roboter soll eine Süßkartoffel in einer Heißluftfritteuse zubereiten. Im Trainingsdatensatz gab es genau zwei relevante Fragmente: einmal eine Klappe schließen, einmal eine Flasche abstellen. Daraus plus allgemeinem Web-Vorwissen soll der Roboter nun eine längere Sequenz bewältigen. Die Erfolgsquote beim ersten Versuch: magere 5 Prozent. Wenn der Roboter aber schrittweise sprachlich angeleitet wird — „Öffne die Klappe“, „Lege die Kartoffel hinein“, „Schließe die Klappe“ — steigt die Erfolgsrate auf 95 Prozent. Der Roboter wird gewissermaßen zum Lehrling, der kein neues Training braucht, sondern gute Anweisungen.

Die Grenzen sind klar benannt und sollten nicht übersehen werden. Karol Hausman sagt gegenüber TechCrunch: „You can’t tell it, ‘Hey, go make me some toast.’“ Autonome Multi-Schritt-Aufgaben ohne menschliche Führung gelingen noch nicht. Und im Gegensatz zu π0 und π0.5, die Physical Intelligence im Februar 2025 als openpi-Projekt auf GitHub unter einer offenen Lizenz veröffentlichte, gibt es für π0.7 vorerst keinen Open-Source-Plan. Wer das Modell haben will, wird auf Lizenzdeals und Partnerschaften angewiesen sein — eine Entwicklung, die die Robotik-Community aufmerksam beobachtet. Für Industriekunden ist die Botschaft dennoch klar: Die nächste Generation von Warehouse- und Manufacturing-Robotern wird nicht mehr für jede Task neu programmiert, sondern angelernt wie ein Auszubildender.

KI-Infrastruktur

TSMC: Rekordgewinn +58 %, 2nm ausgebucht — KI-Nachfrage „extrem robust“

Hintergrund & Analyse

TSMC veröffentlichte die Zahlen am 16. April vor Börsenbeginn in Taipeh. Der Umsatz lag bei 1,134 Billionen neuen Taiwan-Dollar, umgerechnet 35,71 Mrd. US-Dollar und damit am oberen Ende der eigenen Prognose. Das Plus gegenüber dem Vorjahresquartal beträgt 35,1 Prozent. Der Nettogewinn stieg sogar um 58,3 Prozent auf 18 Milliarden Dollar — die vierte Rekordquartalsmeldung in Folge. Bruttomarge 66,2 Prozent, operative Marge 58,1 Prozent, beide über der eigenen Guidance. Für das Gesamtjahr 2026 hebt TSMC die Umsatzprognose auf über 30 Prozent Wachstum an — vorher waren es „mid-20s“.

Der Treiber ist eindeutig: das HPC-Segment (High Performance Computing, de facto KI und Cloud) macht 61 Prozent des Quartalsumsatzes aus und wächst 20 Prozent zum Vorquartal. Smartphones, früher TSMCs Zugpferd, schrumpfen um 11 Prozent auf 26 Prozent Anteil. Die Hauptkunden hinter dieser Verschiebung sind NVIDIA mit der Blackwell- und kommenden Rubin-Generation, AMD mit der MI-Serie, Broadcom mit Custom-ASICs für Hyperscaler und Apple mit den A20-Chips. Advanced Nodes (7nm und feiner) machen mittlerweile drei Viertel des Wafer-Umsatzes aus.

C.C. Weis zentrale Aussagen im Earnings Call waren knapp und unüblich konfident: KI-Nachfrage „extrem robust“, man sei im „multi-year AI megatrend“, die Nachfrage übersteige das Angebot weiterhin deutlich. Die 2-nm-Produktion läuft in mehreren Wellen in Hsinchu und Kaohsiung hoch und ist bis Ende 2026 ausgebucht. Ein Wafer in 2nm kostet laut TrendForce über 30.000 US-Dollar — rund 50 Prozent mehr als N3. Preiserhöhungen zwischen 3 und 10 Prozent für alle Sub-5nm-Prozesse sind zum 1. Januar 2026 in Kraft getreten, mit weiteren Steigerungen bis 2029 im Plan.

Der Iran-Konflikt, seit dem 4. März mit effektiver Sperrung der Straße von Hormuz, erzeugt laut TSMC bislang keine Produktionsstörung. Taiwan hält LNG-Reserven für mindestens bis Mai vor, Spezialgase bezieht die Insel aus mehreren Regionen. Allerdings haben sich die Helium-Preise seit Kriegsbeginn verdoppelt, nachdem das Ras-Laffan-Terminal in Katar (etwa 33 Prozent Weltangebot) nach iranischen Angriffen Anfang März ausfiel. Strukturell bleibt Taiwan verwundbar: Die Insel importiert 97 Prozent ihrer Energie, 37 Prozent des Strommixes stammen aus Middle-East-LNG, die Reserve reicht ohne Nachlieferung nur 11 Tage.

Parallel treibt TSMC die US-Fabs voran: Die Arizona-Fab21 hat den Ramp auf H2 2027 vorgezogen, bei einer Gesamtinvestition von 165 Milliarden Dollar für bis zu 12 Fabs. Capex 2026: 52 bis 56 Milliarden Dollar. Für das Q2 rechnet TSMC mit 39 bis 40,2 Milliarden Dollar Umsatz — erneut ein Plus von 10 Prozent zum Vorquartal. Die Botschaft an Investoren: Der KI-Boom stützt die Industrie auch im zweiten Jahr in Folge, die Kapazitäten sind für 2026 fast komplett verkauft, der Iran-Krieg bislang ein Risiko ohne Realisierung.

Reportage

Souveräne KI — Europas verspäteter Wettlauf um eigene Modelle, Chips und Rechenzentren

Weiterlesen →

Tool-Radar

Neue und bemerkenswerte KI-Tools der Woche

OpenAI Logo
Nächste Evolution von OpenAIs Agent-Framework: native Sandbox-Ausführung, konfigurierbares Memory, Codex-artige Filesystem-Tools, standardisierte Tool-Integrationen — Agenten greifen isoliert auf Files und Code zu, System-Integrität bleibt geschützt.
15. April 2026. OpenAI.
Google DeepMind Logo
Embodied-Reasoning-Modell für Roboter: räumliches Verständnis, Task-Planung, Erfolgs-Detektion aus mehreren Blickwinkeln. Neue Fähigkeit: analoge Manometer und Anzeigen lesen — läuft im Spot-Roboter von Boston Dynamics in Industrieanlagen.
14. April 2026. Google DeepMind.
Databricks Logo
AI Gateway wandert in Unity Catalog: einheitliche Governance für LLM- und MCP-Zugriffe mit Rate Limits, PII-Redaktion und Prompt-Injection-Erkennung. On-Behalf-Of-Access für MCP-Server, End-to-End-Observability, Kosten-Attribution.
15. April 2026. Databricks.
Augment Code Logo
Workspace für Agent-Orchestrierung: Ein Koordinator-Agent plant, mehrere Implementor-Agenten schreiben Code in Wellen, ein Verifier-Agent prüft gegen die Spec. Kernkonzept „Living Specs“ — Markdown-Specs, die mit dem Code automatisch weiterwachsen.
Mitte April 2026. Augment Code.
Lovable Logo
Native macOS-App für den AI-Fullstack-Builder Lovable — Multi-Project-Tabs, native Shortcuts. Erstmals mit Support für lokale MCP-Server (Figma Desktop, Custom HTTP), die im Browser wegen Sandboxing nicht möglich waren.
15. April 2026. Lovable.
Libretto Logo
Open-Source-Toolkit, das KI-Browser-Automationen deterministisch macht: Das System inspiziert Live-Seiten, reverse-engineered Netzwerk-Requests und baut daraus robuste Workflows. 95 Prozent Erfolgsrate bei Wiederholungen gegenüber rund 70 Prozent bei Standard-Agents.
14. April 2026. Saffron Health, Open Source.

Aus der Werkstatt

Sehenswerte KI-Tutorials und Analysen auf YouTube

Matthew Berman Opus 4.7 Analyse Thumbnail
Tutorial · 18 Min.
Matthew Berman (594.000 Subs) · 16. April 2026
Matthew Berman führt einen skeptischen Praxis-Check mit Opus 4.7 durch und prüft, ob die Benchmark-Ansprüche (Vision von 54 auf 98 Prozent, SWE-bench Pro-Sprung) in echten Tests halten. Seine Kernfrage: Ist das wirklich ein bedeutender Sprung gegenüber 4.6 — oder ein Punktsieg um Nuancen?
Two Minute Papers DeepMind AI Thumbnail
Tutorial · 12 Min.
Two Minute Papers (1,8 Mio. Subs) · 16. April 2026
Károly Zsolnai-Fehér analysiert die Architekturentscheidungen hinter Googles Gemma-4-Modell und ordnet die Benchmark-Ergebnisse ein. Wie üblich bei Two Minute Papers: dichte technische Aufarbeitung, ohne Hype — gut für PMs und Tech Leads, die die neue Open-Source-Welle verstehen wollen.