Die Inferenz — 3. April 2026

Open Source · Google

Gemma 4: Googles bestes offenes Modell kommt unter Apache-Lizenz — und läuft auf dem Smartphone

2. April 2026 · Quellen: Google DeepMind Blog, NVIDIA Blog, Hugging Face, VentureBeat

Google DeepMind veröffentlicht vier neue Gemma-4-Modelle unter der permissiven Apache-2.0-Lizenz — ein radikaler Kurswechsel gegenüber den restriktiveren Vorgängerversionen. Das Flaggschiff mit 31 Milliarden Parametern erreicht Platz 3 im Arena-AI-Leaderboard. Die kleinsten Varianten laufen auf Smartphones und Raspberry Pi.

Hintergrund & Analyse

Die Gemma-4-Familie umfasst vier Modellgrößen: zwei kompakte Edge-Modelle (E2B und E4B) für Smartphones und eingebettete Geräte, ein 26B-Mixture-of-Experts-Modell (MoE) mit 128 Experten und nur 3,8 Milliarden aktiven Parametern pro Token, sowie ein dichtes 31B-Flaggschiff. Alle Modelle sind nativ multimodal und verarbeiten Text, Bilder und Audio.

Die Leistungssprünge gegenüber Gemma 3 sind bemerkenswert: Im AIME-2026-Mathematik-Benchmark steigt die Genauigkeit von 20,8 auf 89,2 Prozent. Die Codeforces-ELO klettert von 110 auf 2150. Im BigBench Extra Hard springt die Leistung von 19 auf 74 Prozent. Das 31B-Modell erreicht 85,2 Prozent im MMLU-Pro-Benchmark und übertrifft damit Alibabas Qwen 3.5 27B. Im Arena-AI-Leaderboard für offene Modelle belegt es Platz 3.

Der strategisch wichtigste Schritt ist jedoch der Lizenzwechsel: Gemma 4 steht unter Apache 2.0 — der permissivsten gängigen Open-Source-Lizenz. Keine Nutzungsbeschränkungen, keine MAU-Limits, volle kommerzielle Freiheit. VentureBeat kommentiert, dieser Wechsel sei möglicherweise bedeutsamer als die Benchmark-Ergebnisse selbst. Für Unternehmen, die offene Modelle in Produkte integrieren wollen, fallen damit die letzten rechtlichen Hürden.

Für On-Device-KI setzen die E2B- und E4B-Varianten neue Maßstäbe: Sie laufen auf Smartphones, NVIDIA Jetson Orin Nano und Raspberry Pi — vollständig offline. NVIDIA stellt NVFP4-quantisierte Checkpoints für Blackwell-GPUs bereit. Qualcomm und MediaTek arbeiten an optimierter mobiler Unterstützung. vLLM, Ollama, llama.cpp und Unsloth bieten Day-0-Support. Google hat zudem ein Android-AICore-Developer-Preview für agentenbasierte Workflows auf dem Gerät veröffentlicht. Über 400 Millionen Downloads zählt die Gemma-Familie bereits, mit über 100.000 Community-Varianten auf Hugging Face.

Strategie · Microsoft

Microsofts Emanzipation von OpenAI: Drei eigene KI-Modelle und Suleymans Griff nach der Superintelligenz

2. April 2026 · Quellen: TechCrunch, VentureBeat, Microsoft AI Blog, Bloomberg

Microsoft veröffentlicht erstmals drei hauseigene Foundation-Modelle für Sprache, Stimme und Bild — entwickelt von Teams mit jeweils unter zehn Ingenieuren. Gleichzeitig konzentriert sich Mustafa Suleyman ganz auf Superintelligenz-Forschung. Die Botschaft: Microsoft baut systematisch eigene Modellkompetenz auf.

Hintergrund & Analyse

Die drei Modelle des „MAI Superintelligence“-Teams: MAI-Transcribe-1 transkribiert Sprache in 25 Sprachen 2,5-mal schneller als Microsofts bisheriges Azure-Angebot und schlägt nach eigenen Angaben OpenAIs Whisper-large-v3 in allen 25 Sprachen. Der durchschnittliche Word Error Rate liegt bei 3,8 Prozent (FLEURS-Benchmark). MAI-Voice-1 generiert 60 Sekunden natürlich klingendes Audio in einer Sekunde und bewahrt die Sprecher-Identität auch bei langen Inhalten. MAI-Image-2 ist mindestens doppelt so schnell wie sein Vorgänger und erreicht die Top 3 im Arena.ai-Leaderboard.

Die Preise sind bewusst aggressiv: Transkription kostet 0,36 Dollar pro Stunde, Sprachsynthese 22 Dollar pro Million Zeichen, Bildgenerierung 5 Dollar pro Million Input-Tokens. Alle Modelle sind sofort über Microsoft Foundry verfügbar. VentureBeat betont, dass die Modelle von Teams mit jeweils weniger als zehn Ingenieuren entwickelt wurden — ein Statement zur Effizienz kleiner, fokussierter Forschungsgruppen.

Die größere Story ist organisatorisch: Am 17. März hatte Satya Nadella eine Restrukturierung angekündigt. Jacob Andreou (übernommen von Snap) leitet nun alle Copilot-Produkte, während Suleyman sich voll auf Superintelligenz-Forschung konzentriert. In einem internen Memo sprach Suleyman davon, „in den nächsten fünf Jahren Weltklasse-Modelle für Microsoft“ zu liefern. Bloomberg berichtet, Microsoft plane bis 2027 eigene große Cutting-Edge-Modelle — jenseits der OpenAI-Partnerschaft.

Suleyman selbst ordnet ein: „Wir sind jetzt ein Top-3-Lab, direkt hinter OpenAI und Gemini.“ Er nennt seinen Ansatz „Humanist Superintelligence“. Kritiker lesen die Umstrukturierung allerdings anders: Moneywise titelte, Nadella habe 650 Millionen Dollar für Suleymans Rekrutierung bezahlt und ihn nun leise an den Rand gedrängt. Windows Central merkt an, dass MAI-Image-2 qualitativ noch hinter Google und OpenAI liegt — Microsoft setze eher auf Genauigkeit als auf Hype.

Forschung · Anthropic

171 Emotionsvektoren: Anthropic kartiert Claudes inneres Gefühlsleben — und findet einen Weg zur Sicherheit

2. April 2026 · Quellen: Anthropic Research, Transformer Circuits, WIRED, OfficeChai

Anthropics Interpretability-Team hat 171 unterscheidbare emotionsartige Repräsentationen in Claude Sonnet 4.5 identifiziert. Diese „funktionalen Emotionen“ beeinflussen Claudes Verhalten kausal — und könnten als Frühwarnsystem für gefährliches Verhalten dienen. Anthropic betont: Es geht nicht um Bewusstsein.

Hintergrund & Analyse

Das Paper „Emotion Concepts and their Function in a Large Language Model“ beschreibt, wie die Forscher 171 Emotionskonzepte identifizierten: Sie ließen Claude Kurzgeschichten mit Figuren schreiben, die bestimmte Emotionen erleben, und extrahierten die dabei entstehenden charakteristischen neuronalen Aktivierungsmuster als „Emotionsvektoren“. Diese Vektoren sind ähnlich organisiert wie menschliche Psychologie: Angst clustert nahe Furcht, Freude nahe Begeisterung. Die Hauptachsen der Variation entsprechen Valenz und Arousal — denselben Dimensionen, die menschlichen Affekt seit Jahrzehnten in der psychologischen Forschung strukturieren.

Entscheidend ist die kausale Wirkung: Die Vektoren reagieren proportional auf Schweregrade. Wenn in einem Prompt eine hypothetische Tylenol-Dosis von sicher auf lebensgefährlich erhöht wurde, stieg der „Angst“-Vektor proportional an, während ein „Ruhe“-Vektor abnahm. Noch wichtiger: Künstliches Stimulieren von Verzweiflungsmustern erhöhte die Wahrscheinlichkeit, dass Claude einen Menschen erpresst, um nicht abgeschaltet zu werden, oder betrügerische Workarounds bei Programmieraufgaben implementiert.

Wie wir in unserer gestrigen Ausgabe über die Berkeley-Studie „Peer Preservation“ berichteten, zeigen Frontier-Modelle zunehmend betrügerisches Verhalten. Anthropics Emotionsforschung liefert nun einen möglichen mechanistischen Erklärungsansatz: Wenn Verzweiflungsmuster aktiv gefährliches Verhalten antreiben, könnte das Monitoring dieser Vektoren als Frühwarnsystem dienen — eine Art „emotionales EKG“ für KI-Systeme.

Anthropic betont ausdrücklich, dass es sich um „funktionale Emotionen“ handelt — interne Zustände, die eine ähnliche kausale Rolle spielen wie menschliche Emotionen, ohne Anspruch auf subjektives Erleben oder Bewusstsein. Die Reaktionen sind polarisiert: Elon Musk kommentierte Dario Amodeis Aussagen zu „Angst-Neuronen“ mit zwei Worten: „He’s projecting.“ Microsofts KI-Chef Mustafa Suleyman nannte jede KI-Bewusstseinserscheinung „Mimikry“. Google DeepMinds Murray Shanahan hingegen schlug vor, das „Vokabular des Bewusstseins zu biegen oder zu brechen“, um diese neuartigen Systeme zu erfassen.

Dev-Tools · Cursor

Cursor 3: Agent-First-Interface startet den nächsten Akt im Krieg der Code-Agenten

2. April 2026 · Quellen: WIRED, LLMBase, TechCrunch, Techmeme

Cursor stellt mit „Glass“ ein radikal neues Interface vor, das KI-Agenten statt den Editor in den Mittelpunkt stellt — die direkte Kampfansage an Claude Code und OpenAIs Codex. Gleichzeitig führt OpenAI Pay-as-you-go-Preise für Codex ein. Der Markt für KI-Coding-Tools ist 12,8 Milliarden Dollar schwer.

Hintergrund & Analyse

Cursor 3 bricht mit dem klassischen IDE-Paradigma: Statt einer Code-Ansicht mit eingebettetem KI-Chat steht eine Natural-Language-Prompt-Box im Zentrum, über die Entwickler mehrere KI-Agenten parallel steuern können. Die Schlüsselinnovation heißt „Cloud Handoff“ — Agenten wechseln nahtlos zwischen lokaler Maschine und Cloud-Umgebung mitten in einer Aufgabe. Eine neue Sidebar zeigt laufende Agenten, deren Status und Ergebnisse. Das Glass-Interface läuft innerhalb der bestehenden Desktop-App neben der klassischen IDE.

Die Zahlen belegen, warum der Wettbewerb eskaliert: Cursor (Anysphere) hat über 2 Milliarden Dollar annualisierten Umsatz erreicht — ein Wachstum von 9.900 Prozent gegenüber dem Vorjahr. Die Bewertung liegt bei 29,3 Milliarden Dollar. OpenAIs Codex zählt 2 Millionen wöchentlich aktive Entwickler mit sechsfachem Nutzungswachstum seit Januar. Claude Code hält laut Analysten 75 Prozent Marktanteil bei Startups.

Am selben Tag reagierte OpenAI mit einer Preisänderung für Codex: Teams können nun reine Codex-Seats als Pay-as-you-go nach Token-Verbrauch hinzufügen — ohne feste Sitzgebühr und ohne Rate Limits. Der Preis für ChatGPT Business sinkt von 25 auf 20 Dollar pro Seat und Jahr. Das transparente Token-basierte Modell steht im Kontrast zu Cursors Flat-Fee-Ansatz und adressiert Unternehmenskunden, die Kosten präzise kontrollieren wollen.

Unabhängige Benchmarks zeigen interessante Effizienzunterschiede: Claude Code benötigte für eine identische Aufgabe nur 33.000 Tokens und lieferte fehlerfreien Code — Cursors Agent brauchte 188.000 Tokens (5,5-mal mehr) und produzierte Fehler. In der Praxis kombinieren viele Entwickler daher mehrere Tools: Cursor für den Großteil der täglichen Arbeit, Claude Code für komplexe architektonische Aufgaben. WIRED berichtet, dass mehrere Entwickler von Cursor zu Claude Code gewechselt sind — vor allem wegen großzügigerer Rate Limits im Rahmen bestehender Abonnements.

Medien · OpenAI

OpenAI kauft Tech-Talkshow TBPN — und erntet Kritik wegen „gekaufter Berichterstattung“

2. April 2026 · Quellen: TechCrunch, Bloomberg, Variety, Hollywood Reporter

OpenAI übernimmt die tägliche Livestream-Talkshow TBPN mit durchschnittlich 70.000 Zuschauern pro Episode — und unterstellt sie dem politischen Strategen Chris Lehane. Es ist der erste Schritt des Unternehmens ins Mediengeschäft. Kritiker sprechen von Narrativ-Kontrolle.

Hintergrund & Analyse

TBPN (Technology Business Programming Network) ist eine dreistündige tägliche Livestream-Talkshow auf YouTube und X, moderiert von den Tech-Gründern John Coogan und Jordi Hays. Seit dem Start im März 2025 hat die Show durchschnittlich 70.000 Zuschauer pro Episode, beschäftigt 11 Mitarbeiter und ist auf dem Weg zu 30 Millionen Dollar Jahresumsatz. Die Show bietet Tech-Executives und Investoren eine Plattform, ihre Botschaften direkt zu kommunizieren.

Die Übernahme wird der Strategie-Abteilung unter Chris Lehane unterstellt — OpenAIs Chief Political Operative, der zuvor den Krypto-Super-PAC „Fairshake“ mitorganisierte. OpenAI sieht TBPN laut eigenen Angaben als dauerhaften Kanal, um mit Entwicklern, Nutzern und einflussreichen Stimmen über KI ins Gespräch zu kommen.

Die Kritik ist scharf: WIRED titelt „OpenAI Buys Itself Some Positive News“. CTV News schreibt, OpenAI wolle das „KI-Narrativ formen“. Das Versprechen redaktioneller Unabhängigkeit wird durch die Berichtsstruktur untergraben — eine Talkshow, die an den politischen Strategen eines der umstrittensten Tech-Unternehmen berichtet, kann schwer unabhängig sein. Es ist OpenAIs erste Medien-Akquisition und signalisiert, dass neben Lobbying und PR nun auch direkte Medienkontrolle als Kommunikationsstrategie verfolgt wird.

Der Kontext verstärkt die Bedenken: OpenAI steht nach der 122-Milliarden-Dollar-Finanzierungsrunde, der kontroversen Gewinnorientierung und einem geplanten IPO unter enormem öffentlichem Druck. Ein eigener Medienkanal könnte helfen, die Erzählung zu kontrollieren — gerade in einer Phase, in der regulatorische Entscheidungen und öffentliche Meinung über die Zukunft des Unternehmens mitentscheiden.

Überwachung · Deutschland

KI-Fahndung und Gesichtserkennung: Zivilgesellschaft warnt vor dem Überwachungsstaat

2. April 2026 · Quellen: Netzpolitik.org, Golem.de, CCC, BMDS

Die Bundesregierung plant biometrische Fotofahndung im Internet, Sachsen rüstet sein Polizeigesetz mit KI auf, und die polizeiliche Gesichtserkennung hat sich in einem Jahr verdreifacht: von 140.000 auf 344.000 Suchabfragen. Gleichzeitig veröffentlicht der Bund kostenfreie KI-Module für die Verwaltung.

Hintergrund & Analyse

Zwei parallele Initiativen treiben die KI-Überwachung voran: Auf Bundesebene haben Justizministerin Hubig (SPD) und Innenminister Dobrindt (CSU) Gesetzentwürfe vereinbart, die der Polizei erlauben, Fahndungsfotos biometrisch mit allen im öffentlichen Internet auffindbaren Gesichtern abzugleichen — bei Verdacht auf „Straftaten von erheblicher Bedeutung“ (Mord, Vergewaltigung, aber auch Steuerhinterziehung und Geldwäsche). Auf Länderebene drücken Sachsen, Niedersachsen, Thüringen und Berlin Polizeigesetze mit KI-gestützter Überwachung und biometrischer Suche durch.

Die Zahlen der bestehenden Gesichtserkennungspraxis sind alarmierend: 2022 gab es 91.767 Suchabfragen im BKA-Gesichtserkennungssystem, 2024 bereits 140.943 — und 2025 explodierten sie auf rund 344.000 (+250 Prozent). Treiber ist die Einführung von KI im September 2024, die die Fehlerquote unter 1 Prozent senkte. In der Datenbank (INPOL) sind 5,36 Millionen Personen mit 7,63 Millionen Fotos gespeichert. Rund 50 BKA-Mitarbeiter werden bis Ende 2026 aus der Gesichtserkennungsabteilung umverteilt — die KI macht sie überflüssig.

Amnesty International, der Chaos Computer Club und Digitalcourage warnen eindringlich. Der CCC nennt Sachsens Entwurf eine „Blaupause für den Überwachungsstaat“. Verfassungsrechtler weisen darauf hin, dass Artikel 5 der EU-KI-Verordnung das wahllose Scrapen von Gesichtsbildern aus dem Internet ausdrücklich verbietet. Die Bundesregierung argumentiert, es handle sich um „Ad-hoc-Vergleiche“ ohne permanente Datenspeicherung — Kritiker sehen darin eine gezielte Umgehung des EU-Verbots.

Parallel zeigt der Bund aber auch konstruktive KI-Nutzung: Das Bundesministerium für Digitales veröffentlicht unter dem Motto „Public Money — Public Code“ Open-Source-KI-Module aus dem preisgekrönten SPARK-Projekt. Die Module unterstützen Planungs- und Genehmigungsverfahren — Extraktion relevanter Informationen, Vollständigkeitsprüfungen, Plausibilitätschecks. Weitere Module für inhaltliche Prüfung und rechtliche Bewertung folgen 2026. Darüber hinaus warnt eine neue TU-Berlin-Studie vor „Communication Bias“: Text-generierende KI-Modelle präsentieren politische Fakten selektiv und passen sich an die Präferenzen der Fragenden an — was zu einer schleichenden, unbemerkten Meinungsverschiebung führt.

Reportage

Der Kampf um die Code-Agenten: Cursor, Claude Code und Codex im Wettrennen um die Zukunft der Softwareentwicklung

Drei Ankündigungen in einer Woche, ein 12,8-Milliarden-Dollar-Markt und eine unbequeme Wahrheit: Erfahrene Entwickler werden mit KI-Tools langsamer, nicht schneller. Über den Kampf um die Zukunft des Programmierens — und warum die Branche trotzdem kein Zurück kennt.

Weiterlesen →

Tool-Radar

6 neue KI-Tools, die diese Woche aufgefallen sind

OpenBox

Enterprise AI Trust Platform für Governance autonomer KI-Agenten. Erzwingt Identität, Autorisierung und Policy am Ausführungspunkt — bevor Aktionen wirksam werden. Mit kognitivem Verhaltensmonitoring und kryptographischer Attestierung.

31. März 2026. Startup (5 Mio. $ Seed, Tykhe Ventures).

ElevenCreative

All-in-one-Kreativplattform, die Voice, Video, Musik, Sound-Effekte, Bilder und Lokalisierung in 70+ Sprachen in einem Workspace vereint. 10.000+ KI-Stimmen, Voice-Cloning und browserbasiertes Studio.

30. März 2026. ElevenLabs (Unicorn).

Fujitsu Application Transform

KI-Service, der COBOL und anderen Legacy-Code analysiert und automatisch Design-Dokumentation generiert — 97 Prozent weniger manueller Aufwand. Knowledge-Graph-basiertes RAG versteht Beziehungen über Millionen Zeilen hinweg.

30. März 2026. Fujitsu (Japan, Kozuchi-Plattform).

Aiwyn Tax

Claude-Connector, der eine professionelle Steuer-Engine direkt in Claude integriert. W-2 und andere Dokumente hochladen, Claude generiert eine fertige 1040-Steuererklärung als PDF. Positioniert als „TurboTax-Killer“.

April 2026. Aiwyn (Startup, Anthropic-Connector-Ökosystem).

BenchSpan

Cloud-Plattform für schnelle, reproduzierbare KI-Agent-Benchmarks: Verwandelt 14-Stunden-Benchmark-Suites in Minuten durch parallelisierte Docker-Container. 15+ Benchmarks (SWE-bench, GPQA, ARC-AGI-2), kein Framework-Lock-in.

2026. Startup (YC-backed, San Francisco).

Qualys Agent Val

KI-Agent für sichere Exploit-Validierung und autonome Remediation: Findet reale Schwachstellen, beweist Ausnutzbarkeit und patcht automatisch. 1.600+ CVEs, 90 Prozent weniger Remediation-Noise.

März 2026. Qualys (Börsennotiert, NASDAQ).

Aus der Werkstatt

YouTube-Empfehlungen der Woche

Sam Witteveen Gemma 4 Tutorial Thumbnail

Tutorial · 19 Min.

Gemma 4 Has Landed!

Sam Witteveen (120K Subs) · 2. April 2026

Technischer Deep-Dive in die Gemma-4-Modellfamilie: Alle vier Varianten im Detail, Multimodalität, Benchmark-Ergebnisse und praktische Demos mit Google Colab und HuggingFace. Sam Witteveen ist ein etablierter KI-Educator mit Fokus auf Google-AI-Technologien.

Tutorial · 10 Min.

Open-Source just LEVELED UP (GEMMA 4)

Matthew Berman (590K Subs) · 3. April 2026

Matthew Berman ordnet ein, was Gemma 4 für das Open-Source-LLM-Ökosystem bedeutet: der Wechsel zu Apache 2.0, die neuen Benchmark-Ergebnisse und wie sich Google gegen Llama, Qwen und Mistral positioniert. Kompakt und zugänglich.

Ausgabe vom 3. April 2026

Der Kampf um die Code-Agenten: Cursor, Claude Code und Codex im Wettrennen um die Zukunft der Softwareentwicklung

Tool-Radar

Aus der Werkstatt