· 7 Artikel + Reportage + Tool-Radar + Werkstatt

Ausgabe vom 23. April 2026

Maschinell recherchiert, menschlich relevant.

Hardware · Google Cloud Next 2026

Googles neue KI-Chips: Ironwood jetzt verfügbar, TPU 8 spaltet Training und Inferenz

Hintergrund & Analyse

Die Schlagzeile ist Ironwood: Googles siebter TPU-Chip ist ab dem 22. April für Google-Cloud-Kunden buchbar. Die Zahlen sind eindrucksvoll — 4,6 Petaflops FP8 pro Chip, 192 Gigabyte HBM3e-Speicher und 7,37 Terabyte Speicherbandbreite pro Sekunde (4,5-mal mehr als beim Vorgänger Trillium). In einer maximalen Superpod-Konfiguration mit 9.216 Chips erreicht Ironwood 42,5 Exaflops. Google formuliert das Verhältnis zum weltstärksten Supercomputer El Capitan (1,7 Exaflops) ganz bewusst: mehr als das 24-fache.

Die eigentliche Strategiemeldung ist jedoch die Ankündigung der achten TPU-Generation in zwei Varianten. TPU 8t („Sunfish“) wurde für Training optimiert — gemeinsam mit Broadcom entwickelt, dual-die-Architektur, acht Stapel HBM3e, rund 30 Prozent höhere Speicherbandbreite als Ironwood und eine Skalierung bis 9.600 Chips in einer Superpod mit zwei Petabyte gemeinsamem HBM. Auf Pod-Skala: 121 Exaflops. TPU 8i („Zebrafish“) wurde für Inferenz gebaut — gemeinsam mit MediaTek, 288 Gigabyte HBM (50 Prozent mehr als Ironwood), dreimal so viel On-Chip-SRAM, ein „Boardfly“-Interconnect mit halbiertem Netzwerkdurchmesser und ein neuer Collectives Acceleration Engine, der die Latenz bei autoregressive Dekodierung um bis zu fünffachen reduziert. Beide Chips zielen auf TSMCs 2-Nanometer-Prozess; allgemeine Verfügbarkeit ist für spät 2027 geplant.

Was macht diese Architektur anders als Nvidia? Der Schlüssel liegt nicht im Einzelchip-Vergleich — dort liegt Ironwood in FP8-Rechenleistung und HBM-Kapazität auf ähnlichem Niveau wie Nvidias Blackwell-Generation. Der Unterschied liegt in der Cluster-Skalierung. Nvidias größte Standardkonfiguration verknüpft 72 GPUs über NVLink in einem GB200-NVL72-System. Googles TPU-Superpod verknüpft über 9.000 Chips. Das ICI-Interconnect liefert dabei über die gesamte Pod-Breite kollektive Operationen in Zeiten, die Nvidia-Fabrics nicht erreichen. Anthropic bestätigt intern, Training auf TPUs koste rund 52 Prozent weniger pro effektivem Petaflop als auf GB300-NVL72-Systemen. Unabhängige Analysen von SemiAnalysis beziffern den TCO-Vorteil für externe GCP-Kunden auf 30 bis 44 Prozent gegenüber vergleichbaren Nvidia-Konfigurationen.

Die Schwachstellen sind real. Ironwood unterstützt kein FP4 — Nvidias wichtigster Inferenz-Quantisierungshebel bei Blackwell. NVLink liefert mit 14,4 Terabit Bandbreite pro Gerät mehr als Ironwoods ICI mit 9,6 Terabit. Und das XLA-Compiler-Ökosystem ist enger als Nvidias CUDA-Welt mit jahrzehntelanger Reife. Wer heute PyTorch-basierte Workloads betreibt, braucht Konvertierungsarbeit für TPUs. Google bietet seit letztem Jahr PyTorch-Support auf TPUs in der Preview — aber es ist kein Drop-in-Ersatz.

Für Infrastruktur-Entscheider in SaaS-Unternehmen ergibt sich daraus eine differenzierte Botschaft. Ironwood ist ab sofort buchbar und attraktiv für Inference-Heavy-Workloads bei größeren Deployments — insbesondere dort, wo Batch-Inferenz und hoher Durchsatz wichtiger sind als niedrige Einzelanfragen-Latenz. TPU 8t und 8i sind relevante Investitionssignale für 2027: Wer heute GCP-Verträge abschließt, sollte frühzeitig Zugang zu Early-Access-Programmen sichern. Nvidia behält vorerst seinen Marktanteil von rund 92 Prozent bei Rechenzentrum-GPUs — und wird auch auf GCP als Vera-Rubin-Option angeboten. Die eigentliche Verschiebung kommt später in diesem Jahrzehnt, wenn benutzerdefinierte Chips aus der Nische zum Standard werden.

Produkt · OpenAI

Workspace Agents: ChatGPT wird zur autonomen Team-Automatisierungsplattform

Hintergrund & Analyse

Workspace Agents sind am 22. April in einem Research Preview für ChatGPT Business ($30/Nutzer/Monat), Enterprise- und Edu-Pläne gestartet. Der konzeptionelle Unterschied zu Custom GPTs ist grundlegend: Custom GPTs waren statische Systemanweisungen, die auf einzelne Prompts antworteten. Workspace Agents sind persistente, team-shared Einheiten mit eigenem Cloud-Workspace, Datei-Ablage, Codeausführungsumgebungen und einem persistenten Gedächtnis, das aus dem Umgang mit einem Team lernt.

Das technische Rückgrat ist Codex — nicht GPT-4o. OpenAI setzt damit bewusst auf ein Modell mit starker Planungs- und Code-Ausführungsfähigkeit statt auf konversationelle Flüssigkeit. Agents können auf drei Wegen ausgelöst werden: zeitgesteuert per Cron-Zeitplan, durch Slack-Nachrichten oder manuell durch Teammitglieder. Die Aufgabenliste aus der OpenAI-Presse zeigt die Breite des Einsatzes: Wöchentliche Daten-Reports ohne menschlichen Auslöser, IT-Ticket-Erzeugung nach Policy-Prüfung, Kundenfeedback-Aggregation über Slack-Kanäle, Sales-Qualifizierung aus CRM-Daten. Jede Aufgabe läuft komplett autonom durch — mit konfigurierbaren „human-in-the-loop“-Breakpoints bei konsequenziellen Schritten.

Der Preismodell-Schwenk ist strategisch entscheidend. Bis zum 6. Mai gilt eine kostenlose Testphase. Danach: Credit-basierte Abrechnung auf Basis von Computerverbrauch pro Agenten-Run, zusätzlich zum Basis-Abo. Dieser Übergang von Flatrate auf Verbrauchseinheiten ist exakt das Modell, das Anthropic gerade beim Pro-Plan zu testen versucht (siehe Artikel 4). OpenAI löst das Dilemma mit dem Upgrade-Pfad: Wer Agents intensiv nutzt, zahlt mehr — aber die Basiskosten bleiben planbar. Die Analogie zu AWS Lambda ist präzise: Man zahlt für Ausführungszeit, nicht für Reservierungskapazität.

Die Kompatibilität mit bestehenden Plattformen ist bewusst breit gehalten: Slack, Google Drive, Microsoft-Office-Suite, Salesforce, Notion, Atlassian Rovo und beliebige MCP-Server. Das ist der Hebel gegen Zapier und n8n: Statt Klick-für-Klick-Workflows geben Teams Workspace Agents in Natürlicher Sprache Aufgaben, die das System eigenständig zerlegt und ausführt. Die Gegenstimme: Zapier unterstützt 7.000+ Apps über strukturierte APIs; Workspace Agents müssen bei ungewohnten Quellen improvisieren. Der Wettbewerb läuft nicht auf Alles-oder-Nichts hinaus, sondern auf differenzierte Einsatzfelder.

Für Produkt- und Betriebsteams in SaaS-Unternehmen sind drei Punkte handlungsleitend. Erstens: Custom GPTs sterben — wer in den letzten zwei Jahren intern Custom GPTs gebaut hat, muss bis zur Migration zu Workspace Agents planen (Datum von OpenAI noch offen). Zweitens: Die persistente Gedächtnis-Funktion schafft schnell Lock-in, je mehr ein Agent die Arbeitsweise eines Teams kennt. Verträge sollten Datenportabilität explizit adressieren. Drittens: Der Research-Preview-Status bedeutet, dass sich Preise und Funktionsumfang bis zum GA noch ändern können — Produktionseinsatz mit Business-kritischen Workflows sollte auf das GA warten.

Entwicklung · Microsoft

TypeScript 7.0 Beta: Go-Backend macht den Compiler zehnmal schneller

Hintergrund & Analyse

Microsofts Projekt Corsa ist seit Mai 2025 in Entwicklung — ein methodischer Port des TypeScript-Compilers von JavaScript/TypeScript nach Go, nicht ein Neuschrieb. Die Go-Version macht keine neuen Sprachkonzepte, führt keine neuen Typen ein und bricht nicht mit bestehendem Code. Sie tut exakt das, was TypeScript 6.0 tut — nur deutlich schneller, weil Nativ-Code und echte Parallelität möglich werden. TypeScript 6.0 (März 2026) war explizit als „Bridge-Release“ geplant, um Codebasen auf die 7.0-Migration vorzubereiten.

Warum Go und nicht Rust? Das TypeScript-Team hat Rust intensiv evaluiert. Das Ergebnis: Das JavaScript-Speichermodell ließ sich in Rust nicht sauber ohne häufige unsafe-Blöcke abbilden — und diese hätten einen der Hauptgründe für Rust untergraben. Go erlaubte einen zeilenweise ähnlichen Port: Die Type-Checking-Logik in TypeScript 7.0 ist „strukturell identisch“ mit 6.0. Goroutines und das geteilte Speichermodell von Go passen natürlich zu dem, was der Compiler tun muss: viele Dateien parallel prüfen, Ergebnisse in geteiltem State zusammenführen.

Die Benchmarks sind konkret. VS Code (1,5 Millionen Zeilen TypeScript): 89 Sekunden auf 8,74 Sekunden — Faktor 10,2. Sentry: 133 Sekunden auf 16,25 Sekunden — Faktor 8,2. Speicherverbrauch: 2,9-fach weniger. Typ-Prüfung in Isolation: bis zu 30-fach schneller. Der Default-Parallelismus sind vier Checker-Worker (änderbar per --checkers); mehrere Projekte in einem Monorepo bauen parallel (änderbar per --builders). Daneil Rosenwasser, TypeScript-Projektmanager, schreibt: „Don’t let the ‘beta’ label fool you — you can probably start using this in your day-to-day work immediately.“

Bekannte Einschränkungen in der Beta: Der Watch-Modus ist verfügbar, aber noch nicht performant-optimiert. --target es5 führt zu einem Fehler — ES5-Emission wird nicht mehr unterstützt. rootDir wirft bei der Migration einen anderen Default, und moduleResolution: "node10"bundler umgemappt. Für rund 95 Prozent der Codebasen, die sauber gegen TypeScript 6.0 mit stableTypeOrdering bauen, ist 7.0 ein Drop-in. Stable-Release: innerhalb der nächsten zwei Monate, also voraussichtlich im Juni 2026.

TypeScript 7.0 ist kein isoliertes Ereignis, sondern der bislang größte Vertreter eines strukturellen Trends: ESBuild (2020, Go), SWC und Rome/Biome (Rust), Bun (Zig/C++) haben gezeigt, dass die JavaScript-basierten Dev-Toolchains an eine Perf-Grenze gestoßen waren. Microsoft verteidigte diese Grenze nicht, sondern überschritt sie. Für CI-Pipelines, die TypeScript-Compilation als Engpass haben, bedeutet TypeScript 7.0 direkte Infrastructure-Kostenentlastung.

Plattform · Anthropic

Claude Code kurzfristig aus dem Pro-Tarif gestrichen — und was das über KI-Preise verrät

Hintergrund & Analyse

Der Ablauf war präzise dokumentiert. Am 21. April zeigte die Preisseite claude.com/pricing erstmals ein rotes X für Claude Code im 20-Dollar-Pro-Plan. Die Support-Dokumentation wurde ähnlich aktualisiert: „Using Claude Code with your Pro or Max plan“ wurde zu „Using Claude Code with your Max plan“. Beides war für alle Besucher sichtbar — also auch für die 98 Prozent der Pro-Abonnenten, die gar nicht in den Test einbezogen waren. Anthropics Amol Avasare (Head of Growth) erklärte auf X: es sei ein Test auf rund zwei Prozent der neuen Prosumer-Anmeldungen; bestehende Abonnenten seien nicht betroffen.

Die eigentliche Begründung ist interessanter als die Dementi-Aktion. Avasare schrieb: „Usage has changed a lot and our current plans weren’t built for this.“ Das ist eine Bestandsaufnahme ohne Ausweichen. Agentic Coding-Sessions — Claude Code, der über Stunden in einer Codebase arbeitet, Tests ausführt, Commits schreibt — verbrauchen ein Vielfaches der Token einer normalen Chat-Konversation. Ein Power-User kann mit einer einzigen Claude-Code-Session die nominale Rechenleistung von Stunden normaler Nutzung absorbieren. Mit dem flachen 20-Dollar-Preis deckt Anthropic die Kosten für intensive Nutzer längst nicht mehr.

Die Community-Reaktion war heftig und treffend. Auf GitHub häufte sich ein Issue mit dem Titel „Breaking Change: Claude Code CLI Removed from Pro Plan Without Notice“ schnell. Ein besonders präziser Kommentar: „Kein Mensch startet mit einem $100- oder $200-Plan. Man startet mit $20 und steigt auf.“ Blogger Simon Willison taufte die Situation treffend: „very confusing“ — weil Anthropic die Preisseite für alle änderte, obwohl nur zwei Prozent betroffen waren. Die Änderungen auf der Preisseite und in der Dokumentation wurden innerhalb weniger Stunden rückgängig gemacht. Der Test läuft trotzdem weiter, nur unsichtbar für Nicht-Betroffene.

Das Preisproblem ist kein Anthropic-Problem allein. GitHub hatte kurz zuvor Copilot-Anmeldungen ausgesetzt. Das gesamte Modell der KI-Flat-Subscriptions läuft auf eine strukturelle Krise zu, weil der Aufstieg agentic Nutzung den Verbrauch pro Abonnent exponentiell skaliert, während die Monatsgebühr fix bleibt. OpenAIs Workspace-Agents-Lösung (Credit-basiert, siehe Artikel 2) ist ein Ansatz. Anthropics Max-Plan ($100/$200 pro Monat) ist ein anderer. Das wahrscheinliche langfristige Gleichgewicht: ein günstigerer Einstiegs-Tarif für chat-basierte Nutzung und ein deutlich teurerer Tarif für agentic Workloads — mit oder ohne Verbrauchsmessung.

Für Entwicklerinnen und Entwickler, die heute auf Claude Code aufbauen: Der Pro-Plan bleibt vorerst verfügbar, aber die Richtung der Preisentwicklung ist unzweideutig. Wer intensive agentic Workloads plant, sollte in die ROI-Kalkulation den Max-Plan ($100/Monat für 5-fache Nutzungslimits) oder eine API-direkte Lösung einpreisen. Die Unruhe unter Open-Source-Advocates — Reddit-Diskussionen über Llama, Mistral und DeepSeek schossen am 22. April höher als je zuvor — zeigt, dass propriäre Preisimperfektion lokale Modelle politisch stärkt.

Sicherheit · Anthropic

Backdoor in der Claude Desktop App: „Stille Brücke“ in sieben Chromium-Browser ohne Nutzer-Einwilligung

Hintergrund & Analyse

Entdeckt wurde das Verhalten am 18. April von Alexander Hanff, einem Londoner Privacy-Consultant, der unter dem Namen „That Privacy Guy“ publiziert. Hanff hatte bewusst keine Anthropic-Browsererweiterung installiert und fiel deshalb auf, dass in seinem Chromium-Profilverzeichnis ein Manifest namens com.anthropic.claude_browser_extension.json lag — platziert von der Claude Desktop App, ohne seinen Wunsch, ohne Opt-in, ohne Hinweis im Installationsprozess. Das Manifest wurde für Chrome, Edge, Brave, Arc, Vivaldi, Opera und Chromium abgelegt, unabhängig davon, ob diese Browser auf dem System installiert sind.

Die technische Mechanik: Native Messaging ist eine legitime Chrome-API, über die Browser-Erweiterungen mit lokalen Programmen kommunizieren können. Normalerweise wird das Manifest während der Installation einer Browsererweiterung mit Nutzereinwilligung angelegt. Claude Desktop installiert es ohne jede Erweiterungsinstallation. Das Manifest nennt drei vorab autorisierte Anthropic-Extension-IDs: Jede Browsererweiterung mit diesen IDs kann sofort connectNative() aufrufen und einen lokalen Prozess mit den Rechten des aktuellen macOS-Nutzers starten — außerhalb der Browser-Sandbox.

Der kritische Punkt ist die Kombination mit dem bekannten Sicherheitsproblem. Laut Anthropics eigenen internen Red-Team-Daten ist die Claude-for-Chrome-Erweiterung anfällig für Prompt Injection mit einer Erfolgsrate von 11,2 bis 23,6 Prozent (je nach Gegenmaßnahmen). Eine erfolgreiche Prompt-Injection nutzt die vorinstallierte Bridge, um über den genehmigten nativen Prozess Dateien zu lesen, API-Keys aus Umgebungsvariablen abzugreifen oder weitere Angriffe vorzubereiten. Das ist kein theoretisches Szenario — es ist die direkte Konsequenz zweier Schwachstellen in Kombination.

Erschwerend kommt hinzu: Das Manifest kann nicht dauerhaft gelöscht werden. Claude Desktop schreibt es bei jedem Programmstart neu. Wer das Problem umgehen will, muss die Desktop-App vollständig deinstallieren. Anthropic hat auf die öffentliche Berichterstattung seit dem 18. April weder per Statement noch per GitHub-Issue noch per Support-Kanal geantwortet. Security-Researcher Noah M. Kenney bestätigte Hanffs Befunde als reproduzierbar. Die Golem.de-Berichterstattung am 22. April unter dem prägnanten Titel „Stille Brücke aus dem Browser“ machte das Problem dem deutschen Publikum bekannt.

Für Unternehmen, die Claude Desktop für Mitarbeiter bereitstellen, folgt daraus eine konkrete Risikobewertung: Die Desktop-App erweitert ohne Wissen der IT-Abteilung die Angriffsoberfläche jedes installierten Chromium-Browsers auf dem Gerät. BYOD-Geräte sind besonders betroffen, da Mobile-Device-Management-Lösungen diese systemebenen-Dateiänderung selten abfangen. Bis Anthropic eine Lösung kommuniziert, sollte der Einsatz von Claude Desktop auf Geräten mit hochsensiblen Zugriffen (API-Keys, Production-Secrets, Finanz- oder Patientendaten) überprüft werden.

Hardware · Anker

Thus: Ankers erster KI-Chip — Compute-in-Memory aus Dresdner Fab, Made in Germany

Hintergrund & Analyse

Thus ist ein Nischen-Chip — aber ein technisch aufschlussreicher. Er nutzt Compute-in-Memory (CIM), eine Architektur, bei der Matrizenmultiplikation direkt in den Speicherzellen stattfindet, statt Daten zwischen separaten Rechen- und Speichereinheiten hin- und herzuschieben. Der physische Träger sind NOR-Flash-Speicherzellen: Ein Controller moduliert die Widerstände der Gates, sodass sie die gewünschten Gewichtsmatrizen repräsentieren. Ergebnis: ungefähr fünf Milliarden Operationen pro Sekunde bei einem Verbrauch von wenigen Milliwatt und einer Fläche von wenigen Quadratmillimetern. Zum Vergleich: Intels Core Ultra 300 NPU ist etwa 10.000-mal schneller — aber verbraucht auch Größenordnungen mehr Energie. Thus konkurriert nicht mit Laptop-Chips; es adressiert die Wearables-Welt.

Die erste Anwendung ist Clear Calls: Ein großes neuronales Netz läuft vollständig lokal auf dem Thus-Chip und nutzt acht MEMS-Mikrofone sowie zwei Knochenleitungssensoren, um Stimme in lauten Umgebungen zu isolieren. „Lokal“ bedeutet hier: keine Cloud, keine Latenz durch Netzwerkrundreise, keine Datenweitergabe. Für Datenschutz-sensible Einsatzbereiche — vertrauliche Gespräche, BYOD-Umgebungen mit Compliance-Anforderungen — ist das ein echter Vorteil gegenüber cloud-basierten Geräuschunterdrückungs-Diensten.

Das „Made in Germany“ ist kein Greenwashing. Heise identifiziert X-Fab und Globalfoundries in Dresden als mögliche Fertigungspartner, mit dem 28SLPe-Prozess von Globalfoundries als wahrscheinlichem Kandidaten. Anker ist ein chinesisches Unternehmen mit Sitz in Changsha — die Aussage bezieht sich auf den Fertigungsort, nicht den Ursprung der Chip-Entwicklung. Das ist im Kontext des EU Chips Acts, der Investitionen in europäische Halbleiterfertigung fördert, trotzdem keine triviale Nachricht: Dresdner Fabs fertigen tatsächlich für internationale Kunden.

Die strategische Implikation ist größer als Noise-Cancellation. Anker positioniert Thus als langfristige Chip-Plattform — nicht als einmalige Produktfunktion. Die Roadmap sieht mobile Zubehörgeräte und IoT-Geräte über die gesamte Anker-Produktfamilie vor. Wenn "On-Device AI" ein Kaufargument in der Consumer-Elektronik wird, sind Apple (AirPods Pro 3 mit H3), Qualcomm (Audio-AI) und Sony (noise-cancellation-DNNC) die direkten Benchmarks. Anker, bisher als günstigere Alternative positioniert, macht einen Schritt Richtung Tech-Differenzierung. Ob das ausreicht, zeigen die Verkaufszahlen nach dem Anker Day am 21. Mai.

Musik · Deezer

44 Prozent aller neuen Uploads: KI-Musik überflutet Streaming-Plattformen — aber kaum jemand hört zu

Hintergrund & Analyse

Das Wachstum ist dramatisch: Im Januar 2025 wurden 10.000 KI-Tracks täglich hochgeladen. Heute sind es 75.000 — ein siebenfächer Anstieg in 15 Monaten, während menschliche Uploads stagnieren. Deezer ist die einzige große Streaming-Plattform, die KI-Musik systematisch erkennt und öffentlich darüber berichtet. Das patentierte Erkennungssystem läuft seit Januar 2025 in Produktion und wird seit Januar 2026 an Dritte — darunter SACEM und EJI — lizenziert. Erkannte Tracks werden aus algorithmischen Playlists entfernt und bei betrügerischen Streams demonetisiert.

Das Konsum-Paradox ist das eigentliche Argument: 44 Prozent der Uploads — aber unter einem halben Prozent des echten Hörens. Die KI-Tracks werden hochgeladen, um Royalties zu manipulieren, nicht um Publikum zu finden. Spotify hat allein 2025 rund 75 Millionen Spam-Tracks gelöscht; Apple Music identifizierte rund zwei Milliarden betrügerische Streams. Der bislang schwerste dokumentierte Fall: Der North-Carolina-Musiker Michael Smith erstellte hunderttausende KI-Songs, ließ sie von Bots milliardenfach streamen und schädigte Plattformen um acht Millionen Dollar — er bekannte sich schuldig.

Die CISAC-Studie (Dezember 2024) schätzt, dass bis 2028 24 Prozent der Einnahmen von Musikschaffenden durch KI-Substitution wegfallen können — ein jährlicher Schaden von vier Milliarden Euro. Die Antwort der Major Labels: Sie klagten gegen Suno und Udio wegen Urheberrechtsverletzung beim Training — und schlossen 2025 Lizenzverträge mit denselben Unternehmen, nachdem Vergleiche erzielt worden waren. Indie-Künstlerinnen, die 46,7 Prozent des globalen Markts repräsentieren, stehen ohne vergleichbare Verhandlungsposition da. Unsere ausführliche Reportage beleuchtet Ursachen, wirtschaftliche Auswirkungen und Regulierungs-Perspektiven im Detail.

Reportage

44 Prozent KI-Musik: Wie künstliche Intelligenz die Musikindustrie neu ordnet

Weiterlesen →

Tool-Radar

Neue und trendende KI-Tools des Tages

Claude Design Logo
Verwandelt Text-Prompts in polierte UI-Prototypen, Folien-Decks und One-Pager direkt in Claude — liest die Codebase und bestehende Design-Dateien beim Onboarding, um Farben, Typografie und Komponenten automatisch anzuwenden. Anthropics erster Angriff auf Figma und Canva für schnelle visuelle Arbeit.
17. April 2026 · Anthropic Labs
Kimi K2.6 Logo
Open-Weight-Modell mit einer Billion Parametern (MoE), optimiert für autonomes Coding über Stunden: läuft bis zu 13 Stunden am Stück und koordiniert bis zu 300 parallele Sub-Agents. Auf Humanity’s Last Exam 54,0 Punkte — übertrifft GPT-5.4, Claude Opus 4.6 und Gemini 3.1 Pro. Unter Modified MIT License frei verfügbar.
21. April 2026 · Moonshot AI (Peking)
Pegasus 1.5 Logo
Video-Reasoning-Modell, das Rohmaterial in strukturierte, zeitgestempelte JSON-Metadaten verwandelt — ein API-Aufruf genügt, auch für Videos bis zwei Stunden. Entdeckt automatisch Segmentgrenzen und schlägt Gemini 2.5 Pro um 30 Prozent in Segmentierungs-Benchmarks. Bereits bei einem großen Broadcast-Netzwerk im Einsatz.
20. April 2026 · TwelveLabs
SpeakON Logo
MagSafe-KI-Hardware-Knöpfer fürs iPhone: nimmt Sprache auf, entfernt Füllwörter und Pausen und liefert polierten Text direkt in jede aktive App — kein Freischalten nötig, eigenes Mikrofon. Product-Hunt-Nr. 1 am 22. April mit 415 Upvotes. Preis: 129 Dollar (Gerät) oder 199 Dollar inkl. Pro-Jahresabo.
21. April 2026 · Indie-Startup
Waydev Logo
KI-Engineering-Intelligence-Plattform, die den gesamten KI-augmentierten Entwicklungszyklus misst — von Token-Verbrauch im IDE bis zur Deployment. Die erste Metriken-Plattform, die Agent-Impact nativ trackt: welcher Agent schrieb den Code, Kosten pro PR, Akzeptanzrate. Für Engineering-Leads, die “unsichtbare KI-Arbeit“ messbar machen wollen.
20. April 2026 · Waydev (Y Combinator)
GPT-Image-2 API Logo
ChatGPT Images 2.0 ist jetzt per API zugänglich — das erste Bildmodell mit eingebautem Reasoning und Web-Suche während der Generierung. Bis zu acht kohärente Bilder pro Prompt, 2K nativ, präzises Text-Rendering in Japanisch, Chinesisch, Hindi und weiteren nicht-lateinischen Schriften. Ab 0,01 Dollar pro Bild.
21. April 2026 · OpenAI

Aus der Werkstatt

YouTube-Empfehlungen: Tutorials, Erklärungen und Werkzeuge

Build an AI Agent From Scratch With Python
Tutorial
AWS Developers (1,72 Mio. Subs) · 22. April 2026
Kompaktes Hands-on: vier Bausteine eines KI-Agenten (Modell, Tools, System-Prompt, agentic Loop) mit dem neuen AWS Strands Agents SDK. In drei Zeilen Code läuft ein erster Agent; danach kommen benutzerdefinierte Tools via@tool-Decorator und ein Live-MCP-Server. Ideal als Einstieg in produktionsorientiertes Agent-Engineering auf AWS Bedrock AgentCore.
Bart Mode + Claude Code: NEW Spec Toolkit Ends Vibe Coding!
Tutorial
WorldofAI (213.000 Subs) · 22. April 2026
Traycer’s „Bart Mode“ (Epic Mode) ersetzt unkontrolliertes Vibe-Coding durch spezifikationsgetriebene Ausführung: Parallele KI-Agents arbeiten komplette Entwicklungs-Epics ab und verifizieren ihre eigene Arbeit zwischendurch. Kombiniert mit Claude Code zeigt das Video, warum Spec-First-Development für komplexe Software deutlich besser funktioniert als improvisiertes Prompting.