Die Inferenz — 17. April 2026

KI-Modelle · Anthropic

Claude Opus 4.7: Das neue Flaggschiff, das Anweisungen wörtlich nimmt

16. April 2026 · Quellen: Anthropic, heise online, VentureBeat, The Decoder, llm-stats

Anthropic hat mit Opus 4.7 ein neues Spitzenmodell freigegeben. Der auffälligste Fortschritt steckt nicht in einem Benchmark, sondern in einer Charaktereigenschaft: Das Modell befolgt Anweisungen nun „substanziell besser“ — wortwörtlich und ohne eigenmächtige Interpretationen. Für Entwickler bedeutet das: Alte Prompts funktionieren teilweise nicht mehr.

Hintergrund & Analyse

Am späten Nachmittag des 16. April veröffentlichte Anthropic Opus 4.7 als allgemein verfügbares Modell. Die Preise bleiben gegenüber Opus 4.6 unverändert bei 5 Dollar pro Million Input-Token und 25 Dollar pro Million Output-Token, das Kontextfenster beträgt eine Million Token, das Modell ist sofort auf Claude.ai, über die API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry und Snowflake Cortex verfügbar.

In den Benchmarks legt Opus 4.7 deutlich zu. Auf SWE-bench Pro, das reale Software-Engineering-Aufgaben testet, erreicht das Modell laut llm-stats 64,3 Prozent — ein Sprung gegenüber 53,4 Prozent bei Opus 4.6, vor GPT-5.4 (57,7 Prozent) und Gemini 3.1 Pro (54,2 Prozent). Auf SWE-bench Verified klettert der Wert von 80,8 auf 87,6 Prozent, Terminal-Bench 2.0 steigt von 65,4 auf 69,4 Prozent. OSWorld-Verified (78 Prozent) und MCP-Atlas (77,3 Prozent) zeigen stärkere Werkzeugnutzung. Die Bildverarbeitung akzeptiert nun Bildkanten bis 2.576 Pixel — das Dreifache des Vorgängers. Anthropic selbst nennt Opus 4.7 „state-of-the-art“ für Coding und Long-Context-Aufgaben.

Der eigentliche Paradigmenwechsel steckt im Namen des Release: „substanziell besser bei der Befolgung von Anweisungen“. Opus 4.6 war bekannt dafür, Prompts proaktiv umzuinterpretieren — wenn etwa ein Entwickler bat, eine Funktion zu löschen, räumte das Modell mit oft auch verwandten Code auf. Opus 4.7 tut das nicht mehr. Anthropic weist explizit darauf hin, dass bestehende Prompts „unerwartete Ergebnisse“ liefern können und überarbeitet werden müssen. In der Community auf Hacker News wird das gemischt aufgenommen: Wörtlichkeit erhöht die Verlässlichkeit für Agenten-Workflows, verringert aber die „magische“ Erfahrung, wenn ein Modell Zusammenhänge eigenständig erkennt.

Opus 4.7 tritt in ein spezielles Verhältnis zu Anthropics Mythos-Preview, dem Cyber-Security-Modell, das wir in unserer Ausgabe vom 8. April vorstellten. Anthropic hat Opus 4.7 bewusst schwächer bei offensiven Cyberaufgaben trainiert („differentially reduce these capabilities“) und zusätzliche Safeguards eingebaut. Die Botschaft: Opus ist das Arbeitspferd für breite Anwendung, Mythos bleibt elitenzugänglich. VentureBeat titelt „narrowly retaking lead for most powerful generally available LLM“ — eine typisch amerikanische Formulierung für: Das Modell ist knapp vorn, aber Anthropic räumt selbst ein, dass Mythos intern stärker ist.

Für Entwickler ändern sich zwei Details, die nicht in den Pressemitteilungen stehen, aber in der Praxis Wirkung entfalten. Erstens nutzt Opus 4.7 einen neuen Tokenizer, der je nach Text bis zu 1,35-mal mehr Tokens erzeugt als der Vorgänger — die effektiven Kosten steigen damit trotz gleichem Pro-Token-Preis. Zweitens ist das „Adaptive Thinking“ standardmäßig aktiv: Das Modell entscheidet selbst, ob es ausführlich denkt oder nicht. Wer die Gedankenspur sehen will, muss display: summarized setzen. GitHub Copilot berechnet Opus 4.7 mit 7,5 Premium-Requests pro Aufruf — ein Aufschlag, der zu kontroversen Diskussionen in der Developer-Community führt.

KI-Entwicklung · OpenAI

OpenAI kontert: Codex übernimmt den Mac — parallel, im Hintergrund

16. April 2026 · Quellen: TechCrunch, VentureBeat, The New Stack, OpenAI Blog

Während Anthropic Opus 4.7 veröffentlicht, dreht OpenAI am selben Tag den nächsten Angriff auf Claude Code: Codex steuert jetzt Desktop-Apps, öffnet Fenster, klickt und tippt — parallel, im Hintergrund, ohne den aktiven Nutzer auszubremsen. Dazu kommen Memory, ein integrierter Browser und 90+ Plugin-Integrationen.

Hintergrund & Analyse

Der zeitliche Zufall könnte passender nicht sein. Noch am selben 16. April, an dem Anthropic Opus 4.7 freigab, rollte OpenAI ein großes Update seiner Codex-Desktop-App aus. Das Leitfeature: Computer Use. Codex kann Desktop-Anwendungen öffnen, mit einem eigenen Cursor klicken, Text eintippen und mehrere Aufgaben parallel bearbeiten. Laut OpenAI läuft das Ganze im Hintergrund, ohne dass der Mac blockiert wird — ein Vorteil gegenüber Anthropics Computer-Use-Research-Preview, bei dem der Rechner während der Agent-Aktion praktisch gesperrt ist. Intern nutzt OpenAI das Feature bereits für Qualitätssicherung.

Neu sind außerdem: Ein integrierter Atlas-Browser, in dem Codex einzelne DOM-Elemente kommentieren und später ganze Web-Anwendungen steuern können soll. Ein Memory-System, das sich über Sessions hinweg den Tech-Stack, Workflows und Präferenzen merkt. Multi-Agent-Workflows, in denen spezialisierte Agenten für Schreiben, Debugging und Testing parallel laufen. Und Heartbeat Automations: Codex kann sich selbst zukünftige Aufgaben schedulen und tagelange Vorhaben wiederaufnehmen. Dazu ein eingebauter Bildgenerator (gpt-image-1.5), 90+ Plugin-Integrationen von Atlassian Rovo über CircleCI und CodeRabbit bis GitLab, Microsoft Suite und Neon.

Der Haken für europäische Entwickler: Computer Use und Memory sind zum Launch nicht in der EU und in Großbritannien verfügbar. OpenAI begründet das nicht explizit, Branchenkenner vermuten DSA- und AI-Act-Unsicherheiten. Wer heute produktiv in der EU mit autonomen Desktop-Agenten arbeiten will, muss weiter auf Claude Code oder alternative Harnesses ausweichen — ein nicht zu unterschätzender Nachteil im Wettbewerb um Software-Engineering-Produktivität.

Die Nutzerzahlen zeigen, warum OpenAI diesen Push unternimmt. Anfang April verkündete Sam Altman 3 Millionen wöchentliche Codex-Nutzer und setzte aus diesem Anlass die Nutzungslimits zurück — ein Geschenk, das OpenAI bei jeder weiteren Millionen-Marke bis 10 Millionen wiederholen will. Intern nutzen laut The New Stack bereits 80 Prozent aller OpenAI-Mitarbeitenden Codex. Das Unternehmen baut aus der Desktop-App systematisch eine „Super-App“, wie The New Stack es nennt — eine einzige Schaltzentrale für alles, was früher in separaten Tools stattfand: IDE, Terminal, Browser, Projektmanagement.

Pikant: Codex und Claude Code werden von TechCrunch explizit als Konkurrenten um denselben Markt beschrieben, aber gleichzeitig existiert ein offizielles Codex-Plugin für Claude Code. Die Tools interoperieren auf technischer Ebene, während ihre Anbieter sich medial bekämpfen — ein typisches Muster der aktuellen KI-Entwicklungsphase. Für Teams bedeutet das: Vendor-Lock-in lässt sich durch Harnesses wie OpenRouter, LiteLLM oder gen-lock-freie Agent-Frameworks heute weitgehend vermeiden. Wer direkt auf OpenAI-SDK oder Anthropic-SDK baut, zahlt später höhere Switching-Kosten.

KI & Wirtschaft

Anthropic plant Design-Tool: Figma verliert Boardmitglied und 6 % Kurs

16. April 2026 · Quellen: TechCrunch, The Information, CNBC, Simply Wall St

Mike Krieger, Chief Product Officer bei Anthropic und Instagram-Co-Gründer, verlässt den Figma-Vorstand. Der Grund: Opus 4.7 kommt nicht nur als Modell — Anthropic liefert parallel ein AI-Design-Tool aus, das Websites, Landing Pages und Präsentationen aus natürlicher Sprache generiert. Figma, Adobe, Wix und Canva geraten zeitgleich unter Druck.

Hintergrund & Analyse

Die SEC-Einreichung datiert auf den 14. April, veröffentlicht wurde die Nachricht am 16. April von TechCrunch. Mike Krieger, seit Mai 2024 Chief Product Officer bei Anthropic, trat mit sofortiger Wirkung aus dem Figma-Board zurück, dem er gemeinsam mit Duolingo-CEO Luis von Ahn keine zwölf Monate angehört hatte. Figmas offizielle Begründung — „nicht aufgrund von Meinungsverschiedenheiten“ — ist die diplomatische Formel für einen klassischen Interessenkonflikt. Krieger hatte als Boardmitglied Einblick in Figmas strategische Roadmap, während Anthropic im Stillen an einem Konkurrenzprodukt arbeitete.

Dieses Produkt leakte The Information am 14. April: Opus 4.7 werde mit einem eigenständigen AI-Design-Tool ausgeliefert, das Websites, Landing Pages, Präsentationen und Prototypen aus natursprachigen Prompts generiert. Zielgruppe sind ausdrücklich auch Nicht-Designer. Anthropic positioniert sich damit frontal gegen Figma, Adobe, Wix, GoDaddy, Gamma, Canva und Googles Stitch. Kein Assistenz-Werkzeug für existierende Designer, sondern ein Ersatz für den Start-Workflow.

Die Markt-Reaktion war unmissverständlich. Figma verlor am Tag der Gerüchte rund 6 Prozent, Adobe, Wix und GoDaddy mehr als 2 Prozent. Nach Kriegers Austritt erholte sich Figma wieder um 5 Prozent — Erleichterung über die saubere Trennung. Analysten sprechen von einer zweiten Welle des „SaaSpocalypse“, einer These, die im Februar 2026 nach dem Launch von Claude Cowork Karriere machte und seither die Q1-Bewertungen im B2B-SaaS-Sektor prägt: Wenn ein Foundation-Model-Anbieter beschließt, vertikal in einen SaaS-Markt hineinzuwachsen, sind die etablierten Spieler strukturell angreifbar — nicht weil das erste KI-Tool das beste ist, sondern weil das Modell selbst den Wettbewerbsvorteil darstellt.

Figma-CEO Dylan Field hat im Februar, als Figma und Anthropic noch die „Code to Canvas“-Partnerschaft verkündeten, eine defensive Positionierung formuliert: „In a world where AI can help build any possibility you can articulate, your core work is to find the best possible solutions in a nearly infinite possibility space.“ Design werde zur Kunst der kuratorischen Auswahl aus einem unendlichen Möglichkeitsraum. Ob Geschmack und redaktionelles Urteilsvermögen ausreichen, um ein Tool wie Figma gegen Modelle zu verteidigen, die selbst Alternativen generieren können, ist die offene Frage dieses Jahres. Kriegers Austritt zeigt zumindest: Auch Figmas Board glaubt nicht mehr an Koexistenz auf gleicher Augenhöhe.

KI-Politik · UK

Großbritannien startet 500-Millionen-Pfund-Fonds für souveräne KI

16. April 2026 · Quellen: GOV.UK, Wired, Bloomberg, CNBC

Eine Woche nachdem OpenAI das Stargate-UK-Projekt pausierte, reagiert die britische Regierung: Ein 500-Millionen-Pfund-Fonds (rund 675 Mio. Dollar) für sieben erste KI-Startups. Anthropic unterschreibt parallel einen Bürovertrag für bis zu 800 Mitarbeitende in London — eine Vervierfachung der aktuellen Belegschaft.

Hintergrund & Analyse

Am 16. April startete das britische Department for Science, Innovation and Technology (DSIT) eine neue „Sovereign AI Unit“ mit einem Volumen von 500 Millionen Pfund. An der Spitze steht James Wise, Partner beim Londoner VC Balderton — er behält seinen VC-Job und signalisiert damit den ungewöhnlichen Betriebsmodus der Einheit: Sie soll mit dem Tempo eines Wagniskapitalgebers arbeiten, nicht mit dem einer Behörde. Das Instrumentarium ist drei-teilig: direkte Eigenkapitalbeteiligungen, Compute-Gutscheine von bis zu einer Million GPU-Stunden pro Startup über die staatliche AI Research Resource, sowie schnelle Visa und Zugang zu Regierungsdaten.

Die erste Kohorte umfasst sieben Unternehmen, von denen nur eines — Callosum, ein Londoner Infrastruktur-Startup für Multi-Chip-Architekturen — eine direkte Kapitalbeteiligung erhält. Die anderen sechs bekommen Compute-Zugang: Prima Mente (Foundation-Modelle für Hirnerkrankungen), Cosine (On-Prem-Coding-Agent für Verteidigung), Cursive (Infrastruktur), Doubleword (Inferenz und Governance), Twig Bio (Foundation-Modell für Biomanufacturing) und Odyssey (World Models für Verteidigung und Autonomie). Weitere 30 Unternehmen werden laut DSIT verhandelt.

Der Kontext ist direkter, als es in offiziellen Verlautbarungen wirken soll. Am 9. April pausierte OpenAI das Stargate-UK-Projekt (ursprünglich 8.000 GPUs, skalierbar auf 31.000) wegen hoher Energiepreise und dem Zurückziehen einer geplanten Copyright-Ausnahme für KI-Training. AI-Minister Kanishka Narayan widersprach OpenAI in Bloomberg-Interviews: An den Energiekosten habe sich gegenüber dem Vertragsschluss nichts geändert. Eine Woche später antwortet die Regierung mit dem Sovereign-AI-Fonds — eine Mischung aus Trotzreaktion und strategischem Pivot weg von der Abhängigkeit von US-Hyperscalern.

Parallel meldet Anthropic: Das Unternehmen hat im Londoner Knowledge Quarter ein Büro für bis zu 800 Mitarbeiter angemietet — eine Vervierfachung der aktuellen rund 200 UK-Kräfte, von denen etwa 60 Sicherheitsforscher sind. Das Timing ist politisch abgestimmt und signalisiert, dass Starmer und Kendall trotz des Stargate-Dämpfers weiterhin AI-Champions anziehen können. Die Rolle Großbritanniens als dritter Pol neben USA und EU wird damit greifbarer. Welche praktischen Implikationen sich für Unternehmen ergeben — und was Europa dagegensetzt — beleuchten wir ausführlich in unserer Reportage dieser Ausgabe.

Robotik

Physical Intelligence π0.7: Ein Roboterhirn, das improvisiert

16. April 2026 · Quellen: TechCrunch, Physical Intelligence, Bloomberg, arXiv

Das Robotik-Startup Physical Intelligence hat sein neues Foundation-Modell π0.7 vorgestellt. Die Kernfähigkeit: Der Roboter kombiniert Fragmente aus verschiedenen Trainingskontexten zu neuen Aufgaben, die er nie gelernt hat — und lässt sich durch natürliche Sprache wie ein Lehrling coachen. Die Bewertung der Firma: rund 11 Milliarden Dollar.

Hintergrund & Analyse

Das Startup Physical Intelligence, gegründet 2024 in San Francisco von Karol Hausman (Ex-Google-DeepMind), Sergey Levine (UC Berkeley) und Chelsea Finn (Stanford), verfolgt eine bewusst hardwareneutrale Strategie: Statt eigene Roboter zu bauen, entwickelt das Unternehmen Foundation-Modelle, die auf jeder Plattform laufen — von Franka-Armen über ALOHA-Doppelarm-Setups bis zu mobilen Manipulatoren. Laut Bloomberg und TechCrunch befindet sich Physical Intelligence gerade in Gesprächen für eine neue Finanzierungsrunde bei einer Bewertung von rund 11 Milliarden Dollar, nachdem die Vorgehensrunde mit 5,6 Milliarden abgeschlossen wurde.

Das am 16. April vorgestellte π0.7 ist das dritte Modell der Reihe nach π0 und π0.5. Der Begriff, den die Firma für den Fortschritt wählt, lautet „compositional generalization“ — zu deutsch etwa: kombinatorische Verallgemeinerung. Gemeint ist ein Szenario, das die bisherigen VLA-Modelle (Vision-Language-Action) überforderte: Der Roboter bekommt eine Aufgabe, für die im Trainingsdatensatz nur einzelne, isolierte Fragmente existieren, und muss diese sinnvoll kombinieren.

Ein Beispiel aus der Demonstration: Ein Air-Fryer-Task — der Roboter soll eine Süßkartoffel in einer Heißluftfritteuse zubereiten. Im Trainingsdatensatz gab es genau zwei relevante Fragmente: einmal eine Klappe schließen, einmal eine Flasche abstellen. Daraus plus allgemeinem Web-Vorwissen soll der Roboter nun eine längere Sequenz bewältigen. Die Erfolgsquote beim ersten Versuch: magere 5 Prozent. Wenn der Roboter aber schrittweise sprachlich angeleitet wird — „Öffne die Klappe“, „Lege die Kartoffel hinein“, „Schließe die Klappe“ — steigt die Erfolgsrate auf 95 Prozent. Der Roboter wird gewissermaßen zum Lehrling, der kein neues Training braucht, sondern gute Anweisungen.

Die Grenzen sind klar benannt und sollten nicht übersehen werden. Karol Hausman sagt gegenüber TechCrunch: „You can’t tell it, ‘Hey, go make me some toast.’“ Autonome Multi-Schritt-Aufgaben ohne menschliche Führung gelingen noch nicht. Und im Gegensatz zu π0 und π0.5, die Physical Intelligence im Februar 2025 als openpi-Projekt auf GitHub unter einer offenen Lizenz veröffentlichte, gibt es für π0.7 vorerst keinen Open-Source-Plan. Wer das Modell haben will, wird auf Lizenzdeals und Partnerschaften angewiesen sein — eine Entwicklung, die die Robotik-Community aufmerksam beobachtet. Für Industriekunden ist die Botschaft dennoch klar: Die nächste Generation von Warehouse- und Manufacturing-Robotern wird nicht mehr für jede Task neu programmiert, sondern angelernt wie ein Auszubildender.

KI-Infrastruktur

TSMC: Rekordgewinn +58 %, 2nm ausgebucht — KI-Nachfrage „extrem robust“

16. April 2026 · Quellen: TSMC, CNBC, DataCenterDynamics, TrendForce, heise online

Der taiwanische Chipauftragsfertiger TSMC meldet für das erste Quartal 2026 einen Umsatz von 35,7 Milliarden Dollar (+35 Prozent) und einen Nettogewinn von 18 Milliarden Dollar (+58 Prozent). CEO C.C. Wei bezeichnet die KI-Nachfrage als „extrem robust“. Der Iran-Konflikt erzeugt bisher keine Delle — wohl aber Helium-Engpässe und Höchstrisiken im H2.

Hintergrund & Analyse

TSMC veröffentlichte die Zahlen am 16. April vor Börsenbeginn in Taipeh. Der Umsatz lag bei 1,134 Billionen neuen Taiwan-Dollar, umgerechnet 35,71 Mrd. US-Dollar und damit am oberen Ende der eigenen Prognose. Das Plus gegenüber dem Vorjahresquartal beträgt 35,1 Prozent. Der Nettogewinn stieg sogar um 58,3 Prozent auf 18 Milliarden Dollar — die vierte Rekordquartalsmeldung in Folge. Bruttomarge 66,2 Prozent, operative Marge 58,1 Prozent, beide über der eigenen Guidance. Für das Gesamtjahr 2026 hebt TSMC die Umsatzprognose auf über 30 Prozent Wachstum an — vorher waren es „mid-20s“.

Der Treiber ist eindeutig: das HPC-Segment (High Performance Computing, de facto KI und Cloud) macht 61 Prozent des Quartalsumsatzes aus und wächst 20 Prozent zum Vorquartal. Smartphones, früher TSMCs Zugpferd, schrumpfen um 11 Prozent auf 26 Prozent Anteil. Die Hauptkunden hinter dieser Verschiebung sind NVIDIA mit der Blackwell- und kommenden Rubin-Generation, AMD mit der MI-Serie, Broadcom mit Custom-ASICs für Hyperscaler und Apple mit den A20-Chips. Advanced Nodes (7nm und feiner) machen mittlerweile drei Viertel des Wafer-Umsatzes aus.

C.C. Weis zentrale Aussagen im Earnings Call waren knapp und unüblich konfident: KI-Nachfrage „extrem robust“, man sei im „multi-year AI megatrend“, die Nachfrage übersteige das Angebot weiterhin deutlich. Die 2-nm-Produktion läuft in mehreren Wellen in Hsinchu und Kaohsiung hoch und ist bis Ende 2026 ausgebucht. Ein Wafer in 2nm kostet laut TrendForce über 30.000 US-Dollar — rund 50 Prozent mehr als N3. Preiserhöhungen zwischen 3 und 10 Prozent für alle Sub-5nm-Prozesse sind zum 1. Januar 2026 in Kraft getreten, mit weiteren Steigerungen bis 2029 im Plan.

Der Iran-Konflikt, seit dem 4. März mit effektiver Sperrung der Straße von Hormuz, erzeugt laut TSMC bislang keine Produktionsstörung. Taiwan hält LNG-Reserven für mindestens bis Mai vor, Spezialgase bezieht die Insel aus mehreren Regionen. Allerdings haben sich die Helium-Preise seit Kriegsbeginn verdoppelt, nachdem das Ras-Laffan-Terminal in Katar (etwa 33 Prozent Weltangebot) nach iranischen Angriffen Anfang März ausfiel. Strukturell bleibt Taiwan verwundbar: Die Insel importiert 97 Prozent ihrer Energie, 37 Prozent des Strommixes stammen aus Middle-East-LNG, die Reserve reicht ohne Nachlieferung nur 11 Tage.

Parallel treibt TSMC die US-Fabs voran: Die Arizona-Fab21 hat den Ramp auf H2 2027 vorgezogen, bei einer Gesamtinvestition von 165 Milliarden Dollar für bis zu 12 Fabs. Capex 2026: 52 bis 56 Milliarden Dollar. Für das Q2 rechnet TSMC mit 39 bis 40,2 Milliarden Dollar Umsatz — erneut ein Plus von 10 Prozent zum Vorquartal. Die Botschaft an Investoren: Der KI-Boom stützt die Industrie auch im zweiten Jahr in Folge, die Kapazitäten sind für 2026 fast komplett verkauft, der Iran-Krieg bislang ein Risiko ohne Realisierung.

Reportage

Souveräne KI — Europas verspäteter Wettlauf um eigene Modelle, Chips und Rechenzentren

Am 16. April startet Großbritannien einen 500-Millionen-Pfund-Fonds, Anthropic vervierfacht London, OpenAI pausiert Stargate UK, Microsoft übernimmt ein gescheitertes OpenAI-Rechenzentrum in Norwegen. Die EU hat 4,8 Prozent der globalen KI-Compute, keinen einsetzbaren KI-Beschleuniger und einen zahlenden AI Act ab August. Was CTOs jetzt tun sollten — und warum die Antwort selten „on-prem trainieren“ ist. Von Stefan Lange-Hegermann.

Weiterlesen →

Tool-Radar

Neue und bemerkenswerte KI-Tools der Woche

OpenAI Agents SDK 2.0

Nächste Evolution von OpenAIs Agent-Framework: native Sandbox-Ausführung, konfigurierbares Memory, Codex-artige Filesystem-Tools, standardisierte Tool-Integrationen — Agenten greifen isoliert auf Files und Code zu, System-Integrität bleibt geschützt.

15. April 2026. OpenAI.

Gemini Robotics-ER 1.6

Embodied-Reasoning-Modell für Roboter: räumliches Verständnis, Task-Planung, Erfolgs-Detektion aus mehreren Blickwinkeln. Neue Fähigkeit: analoge Manometer und Anzeigen lesen — läuft im Spot-Roboter von Boston Dynamics in Industrieanlagen.

14. April 2026. Google DeepMind.

Databricks Unity AI Gateway

AI Gateway wandert in Unity Catalog: einheitliche Governance für LLM- und MCP-Zugriffe mit Rate Limits, PII-Redaktion und Prompt-Injection-Erkennung. On-Behalf-Of-Access für MCP-Server, End-to-End-Observability, Kosten-Attribution.

15. April 2026. Databricks.

Intent (Augment Code)

Workspace für Agent-Orchestrierung: Ein Koordinator-Agent plant, mehrere Implementor-Agenten schreiben Code in Wellen, ein Verifier-Agent prüft gegen die Spec. Kernkonzept „Living Specs“ — Markdown-Specs, die mit dem Code automatisch weiterwachsen.

Mitte April 2026. Augment Code.

Lovable Desktop App

Native macOS-App für den AI-Fullstack-Builder Lovable — Multi-Project-Tabs, native Shortcuts. Erstmals mit Support für lokale MCP-Server (Figma Desktop, Custom HTTP), die im Browser wegen Sandboxing nicht möglich waren.

15. April 2026. Lovable.

Libretto

Open-Source-Toolkit, das KI-Browser-Automationen deterministisch macht: Das System inspiziert Live-Seiten, reverse-engineered Netzwerk-Requests und baut daraus robuste Workflows. 95 Prozent Erfolgsrate bei Wiederholungen gegenüber rund 70 Prozent bei Standard-Agents.

14. April 2026. Saffron Health, Open Source.

Aus der Werkstatt

Sehenswerte KI-Tutorials und Analysen auf YouTube

Tutorial · 18 Min.

Opus 4.7 Just Dropped… and I’m Confused

Matthew Berman (594.000 Subs) · 16. April 2026

Matthew Berman führt einen skeptischen Praxis-Check mit Opus 4.7 durch und prüft, ob die Benchmark-Ansprüche (Vision von 54 auf 98 Prozent, SWE-bench Pro-Sprung) in echten Tests halten. Seine Kernfrage: Ist das wirklich ein bedeutender Sprung gegenüber 4.6 — oder ein Punktsieg um Nuancen?

Tutorial · 12 Min.

Why DeepMind’s New AI Broke the Internet

Two Minute Papers (1,8 Mio. Subs) · 16. April 2026

Károly Zsolnai-Fehér analysiert die Architekturentscheidungen hinter Googles Gemma-4-Modell und ordnet die Benchmark-Ergebnisse ein. Wie üblich bei Two Minute Papers: dichte technische Aufarbeitung, ohne Hype — gut für PMs und Tech Leads, die die neue Open-Source-Welle verstehen wollen.

Ausgabe vom 17. April 2026

Souveräne KI — Europas verspäteter Wettlauf um eigene Modelle, Chips und Rechenzentren

Tool-Radar

Aus der Werkstatt