Die Inferenz

Modelle · DeepSeek

DeepSeek V4: Open-Source-Frontier zum Bruchteil des Preises

24. April 2026

Das chinesische Labor DeepSeek hat am Donnerstag zwei Preview-Modelle veröffentlicht: V4-Pro mit 1,6 Billionen Parametern und V4-Flash mit 284 Milliarden. Beide unter MIT-Lizenz, beide mit einer Million Token Kontext, beide bis zu sieben Mal günstiger als Anthropics Claude Opus 4.7. SWE-Bench Verified: 80,6 Prozent — nur 0,2 Punkte hinter dem westlichen Spitzenmodell.

Hintergrund & Analyse

Die Schlagzeile ist die schiere Größe: V4-Pro ist mit 1,6 Billionen Gesamtparametern (49 Milliarden aktiv pro Token) das größte offene Mixture-of-Experts-Modell, das je publiziert wurde — größer als Moonshots Kimi K2.6 (1,1 Billionen) und mehr als doppelt so groß wie der Vorgänger DeepSeek V3.2 (685 Milliarden). V4-Flash, die schlanke Variante mit 284 Milliarden Parametern und 13 Milliarden aktiv, zielt auf günstige Inferenz und lokale Deployments. Beide Modelle laufen auf einer Kontextlänge von einer Million Token, sind über die DeepSeek-API, OpenRouter, fal.ai und HuggingFace verfügbar und stehen vollständig unter MIT-Lizenz.

Die eigentliche Innovation liegt unter der Haube. DeepSeek V4 nutzt eine hybride Aufmerksamkeitsarchitektur aus „Compressed Sparse Attention“ (CSA) und „Heavily Compressed Attention“ (HCA) — eine Lösung für das Skalierungsproblem, das jedes Long-Context-Modell heimsucht: traditionelle Attention wächst quadratisch mit der Sequenzlänge. CSA und HCA reduzieren diesen Aufwand dramatisch. Bei einer Million Token Kontext braucht V4-Pro nur 27 Prozent der Inference-FLOPs und zehn Prozent des KV-Cache, das V3.2 verbrauchen würde. Hinzu kommen „Manifold-Constrained Hyper-Connections“ für stabilere Signalpropagierung und der Muon-Optimizer für schnellere Konvergenz. MoE-Experten laufen in FP4-Präzision, alles andere in FP8.

Auf den Benchmarks bewegt sich V4-Pro im erweiterten Frontier-Korridor. SWE-Bench Verified: 80,6 Prozent — nur 0,2 Punkte hinter Claude Opus 4.7 (87,6 Prozent in der vollen Konfiguration), aber im direkten Vergleichsrun mit demselben Test-Setup quasi gleichauf. AIME 2026: 99,4 Prozent. MMLU-Pro: 92,8 Prozent. LiveCodeBench: 93,5 Punkte (vor Opus 4.7 mit 88,8). Codeforces-Rating: 3206 — DeepSeek dominiert kompetitives Programmieren. Auf SWE-Bench Pro liegt V4-Pro bei 55,4 Prozent gegen Opus 4.7 mit 64,3 Prozent — die größte Lücke. Reasoning, Mathe und Wissen sind faktisch deckungsgleich; klassische Software-Engineering-Tasks bleiben das Feld, in dem Anthropic und OpenAI noch vorn liegen.

Der Preisschock ist das eigentliche Argument. V4-Pro kostet 1,74 Dollar pro Million Input-Tokens (Cache-Miss), 0,145 Dollar bei Cache-Hit, 3,48 Dollar pro Million Output-Tokens. Claude Opus 4.7 liegt bei 25 Dollar pro Million Output-Tokens. Das ergibt einen Faktor 7,2 — bei 0,2 Punkten Differenz auf SWE-Bench Verified. V4-Flash unterschneidet OpenAIs GPT-5.4 Nano: 0,14 Dollar pro Million Input-Tokens, 0,28 Dollar Output. Das ist günstiger als jede westliche Frontier-API in der Klasse. NVIDIA-CEO Jensen Huang reagierte schnell mit einem Blog-Post: V4 läuft auf Blackwell-GPUs schneller als auf jeder anderen Hardware, und die NVIDIA-Endpoints sind vorab integriert. Eine Verteidigungslinie gegen die offene Frage, ob DeepSeek mit seiner Architektur den Bedarf an westlichen H100-Clustern mittelfristig drückt.

Was das praktisch bedeutet, ist Stoff für die Reportage am Ende dieser Ausgabe. Kurzversion: Closed-Source-Anbieter kommen unter Druck, ihre Preise zu rechtfertigen. Die Lücke ist in vielen Use Cases nicht mehr die Differenz zwischen „funktioniert“ und „funktioniert nicht“, sondern zwischen 80 und 87 Prozent — bei einem Siebtel der Kosten. Wer agentenhafte Workflows mit Millionen von Tool-Calls plant, kann den Bruch in der Wirtschaftlichkeit nicht ignorieren.

Quellen

Finanzierung · Google × Anthropic

Google verspricht bis zu 40 Milliarden Dollar für Anthropic

24. April 2026

Drei Tage nach der Verkündung von Amazons 25-Milliarden-Investment legt Google nach: zehn Milliarden Dollar sofort, weitere 30 Milliarden gebunden an Performance-Meilensteine — bei einer Bewertung von 350 Milliarden Dollar. Anthropic vermeldet 30 Milliarden Dollar Annual Run-Rate-Umsatz, das 3,3-fache vom Jahresende 2025. Und Google Cloud verpflichtet sich zu fünf weiteren Gigawatt Rechenleistung über fünf Jahre.

Hintergrund & Analyse

Wir berichteten am Montag in unserer Ausgabe vom 21. April ausführlich über Amazons 25-Milliarden-Dollar-Schub für Anthropic, die parallele Trainium-Partnerschaft und das Project-Rainier-Datacenter in Indiana. Drei Tage später meldet Bloomberg: Google legt seine eigene Karte auf den Tisch — und sie ist größer. Zehn Milliarden Dollar in bar fließen sofort, bei einer Bewertung von 350 Milliarden Dollar. Weitere 30 Milliarden Dollar sind an Performance-Targets gebunden und werden sukzessive freigegeben. Insgesamt: bis zu 40 Milliarden Dollar.

Damit verdoppelt Google seine bisherigen kumulierten Anthropic-Investitionen. Nach Bloombergs Recherche brachte der Suchriese seit 2022 rund drei Milliarden Dollar plus Cloud-Credits ein, gefolgt von einer 1,5-Milliarden-Tranche im November 2025. Das neue Paket übertrifft alles bisherige um Größenordnungen. Anthropic kommentiert die Vereinbarung als „Erweiterung einer langjährigen Partnerschaft“. Konkret heißt das: Google Cloud liefert über fünf Jahre fünf Gigawatt Rechenleistung — mit Option auf weitere Gigawatts. Die TPU-basierte Infrastruktur, die wir in unserer Ausgabe vom 23. April als Anthropics Trainings-Hebel beschrieben haben, wird damit explizit als das primäre Trainings-Compute-Cluster bestätigt — auch wenn Anthropic AWS weiterhin als „primary cloud“ ausweist.

Die Mehrfach-Bindung ist diplomatisch komplex. Anthropic ist heute gleichzeitig an Amazon (Trainium-Cluster, IPO-Vehikel, Bedrock-Integration), an Google (TPU-Compute, Gemini-Konkurrenz, Investment-Beteiligung) und an Microsoft (Azure-Distributionsschiene seit Anfang 2026) gebunden. Jede dieser Partnerschaften wäre für sich exklusiv-relevant; gemeinsam ergeben sie eine Hyperscaler-Diversifikation, die OpenAI mit seiner Microsoft-Bindung nicht hat. Der Effekt: Anthropic erhält Verhandlungsmacht gegenüber jedem einzelnen Partner und kann Preise und Kapazitäten gegenüberstellen.

Die ökonomische Plausibilität liegt in den Zahlen. Anthropic-CFO Krishna Rao bestätigte gegenüber Bloomberg: Annual Run-Rate-Umsatz hat im April 2026 die 30-Milliarden-Dollar-Marke überschritten — gegenüber etwa neun Milliarden zum Jahresende 2025. Das ist ein 3,3-faches Wachstum in vier Monaten, getrieben praktisch ausschließlich von Coding-Anwendungen (Claude Code, Cursor-OEM, Cognition/Devin) und Enterprise-API-Adoption. Die Burnrate dafür ist allerdings im selben Tempo gewachsen: Compute-Ausgaben dürften nach Branchenschätzungen 60 bis 70 Prozent dieses Umsatzes verschlingen. Die 40 Milliarden Dollar von Google sind weniger eine Wachstumsfinanzierung als eine Brücke zur Profitabilität in 2027/28.

Für die SaaS-Welt ist die Botschaft zweischneidig. Einerseits sichert das Geld Anthropics Roadmap und vermutlich aggressive Preisexperimente — etwa die Pro-Plan-Paywall-Tests, über die wir am 23. April schrieben. Andererseits verstärkt sich der Eindruck eines KI-Karussells, in dem Hyperscaler-Investitionen und Cloud-Bindungen so eng verknüpft sind, dass jede Risikobetrachtung schnell zur systemischen Frage wird. Wer heute auf Claude als zentrale KI-Komponente setzt, hat Vendor-Lock-in nicht nur gegenüber Anthropic, sondern indirekt gegenüber dem hinter ihm stehenden Compute-Konsortium.

Quellen

M&A · Tesla

Tesla verbirgt 2-Milliarden-Dollar-Übernahme einer KI-Hardware-Firma im 10-Q

23. April 2026

In einem einzigen Satz auf Seite 27 seines Quartalsberichts hat Tesla die Übernahme einer namenlos bleibenden KI-Hardware-Firma für bis zu zwei Milliarden Dollar in Aktien angekündigt. Kein Pressestatement, keine Erwähnung im Earnings-Call, keine Nennung des Targets. 1,8 Milliarden der zwei Milliarden hängen an Performance-Meilensteinen für die erfolgreiche Bereitstellung der Technologie.

Hintergrund & Analyse

Wer das Tesla-10-Q für Q1 2026 nicht Zeile für Zeile durcharbeitet, übersieht die Meldung. Auf Seite 27, hinter dem Finanzteil, hinter Management Discussion, hinter Legal Proceedings, steht ein einzelner Satz: Tesla habe im April 2026 eine Vereinbarung zur Übernahme einer KI-Hardware-Firma getroffen — Wert bis zu zwei Milliarden Dollar in Aktien. Davon werden 200 Millionen Dollar als Garantiebetrag bei Closing fällig; die übrigen 1,8 Milliarden sind an Service-Bedingungen und Performance-Meilensteine gebunden, die mit der erfolgreichen Bereitstellung der Technologie zusammenhängen. Der Name des Targets steht nirgends im Filing.

Das Ungewöhnliche ist die Form der Bekanntmachung. Tesla hat im selben Quartalsbericht zugleich seine Capital-Expenditure-Pläne für 2026 auf 25 Milliarden Dollar erhöht — mehr als das Dreifache des Vorjahres — und Elon Musk hat Investoren beim Earnings-Call mehrfach auf die KI- und Robotik-Strategie verwiesen. Dass eine konkrete Akquisition in dieser Größenordnung weder im Brief an Aktionäre noch im Call erwähnt wurde, ist insbesondere für SEC-erfahrene Beobachter auffällig. „Material event“-Schwellen sind in der Praxis flexibel; zwei Milliarden Dollar Aktienverwässerung wären für die meisten Unternehmen ein eigenständiger Pressetermin gewesen.

Die Spekulation richtet sich auf zwei Szenarien. Erstens: Es könnte sich um die strategisch wichtige Übernahme eines AI-ASIC-Designers handeln — ein eigener Chip-Entwickler, der die Dojo-Roadmap beschleunigt oder ersetzt. Tesla hat Dojo seit 2023 mehrfach in der Beschreibung gewechselt; nach der Bekanntmachung des „AI5“-Inferenz-Chips für Vehicle-Compute im Februar 2026 ist offen, wie viel Eigenentwicklung Tesla im Trainings-Stack langfristig hält. Zweitens: Es könnte um spezialisierte Sensor- oder Compute-Hardware für Optimus oder Robotaxi gehen. Beide Linien benötigen für die Skalierung in den nächsten 12 bis 18 Monaten substanzielle Hardware-Innovationen, die Tesla intern allein wohl nicht in der nötigen Geschwindigkeit liefern kann.

Die Performance-Meilenstein-Struktur weist auf ein typisches Earn-out-Modell hin, wie es bei Talent-zentrischen Akquisitionen üblich ist. 200 Millionen sofort, 1,8 Milliarden bei „erfolgreicher Bereitstellung der Technologie“ — das ist eine Klausel, die das Founding-Team über Jahre an Tesla bindet und gleichzeitig den Aktionärsverwässerungs-Druck verzögert. Vergleichbar war die Acqui-Hire-Logik bei Anthropics Übernahme von Inflections AI-Talenten oder bei Microsofts Inflection-Deal 2024. Der Unterschied: Hier ist das Target öffentlich noch unbekannt.

Für die Investoren-Community ist die größere Frage, wie Teslas KI-Strategie mittelfristig aussieht. Die Capex-Erhöhung auf 25 Milliarden Dollar — Bloomberg-Schätzung: dreimal soviel wie 2025 — bei gleichzeitig fallendem Auto-Geschäft (Q1-Auslieferungen unter Erwartungen, Aktie nach Earnings nur dank des Robotaxi-Launches stabil) verschiebt das Profil weiter Richtung KI-Pure-Play. Die zwei Milliarden Dollar AI-Hardware-Akquisition fügt sich in dieses Bild ein. Allerdings: Das Wertangebot eines Tesla-AI-Stacks bleibt nebulös, solange die wichtigsten Bausteine — Dojo-Cluster, FSD-Margenbeitrag, Optimus-Stückzahlen — nicht öffentlich validiert sind.

Quellen

Pharma · Isomorphic Labs

DeepMind-Spinoff bringt erste KI-designte Wirkstoffe in klinische Phase 1

24. April 2026

Isomorphic Labs, der 2021 ausgegliederte Pharma-Arm von Google DeepMind, hat den Sprung von der Wirkstoffentdeckung in die Patientenstudie geschafft. Die ersten Onkologie-Kandidaten — entstanden mit der „IsoDDE“-Plattform, einem AlphaFold-Nachfolger — gehen in Phase-1-Studien. Mit Eli Lilly und Novartis sind drei Milliarden Dollar an potenziellen Meilenstein-Zahlungen verbunden.

Hintergrund & Analyse

DeepMind-CEO Demis Hassabis hatte die Phase-1-Trials erstmals im Januar beim Weltwirtschaftsforum in Davos in Aussicht gestellt; im Februar stellte Isomorphic die „Isomorphic Labs Drug Design Engine“ (IsoDDE) als integrierte Plattform vor, die AlphaFold 3 in der Vorhersage von Protein-Ligand-Bindungsstrukturen um den Faktor zwei übertrifft. Am 24. April nun die operative Bestätigung: Die ersten KI-designten Moleküle treten in klinische Phase 1 ein. Schwerpunkt: Onkologie und Immunologie.

Was IsoDDE technisch leistet, lohnt eine Erläuterung. AlphaFold 2 (2020) und AlphaFold 3 (2024) sagten die dreidimensionale Struktur von Proteinen vorher — ein wissenschaftlicher Durchbruch, der mit dem Nobelpreis für Hassabis und John Jumper 2024 gewürdigt wurde. Wirkstoffentwicklung braucht jedoch mehr: Sie braucht Moleküle, die sich an exakt die richtigen Stellen eines Zielproteins anlagern, dabei sicher sind und sich pharmakokinetisch sinnvoll verhalten. IsoDDE deckt diesen erweiterten Workflow in einer integrierten Plattform ab — von der Zielidentifikation über die Generierung präklinischer Kandidaten bis hin zur Prüfung von ADMET-Eigenschaften (Absorption, Distribution, Metabolismus, Exkretion, Toxizität). Statt eines Modells für Strukturvorhersage und separater Tools für Bindungsoptimierung ist IsoDDE ein End-to-End-System.

Die Partnerschaftsstruktur dahinter ist seit Anfang 2024 öffentlich. Eli Lilly investierte 45 Millionen Dollar plus bis zu 1,7 Milliarden Dollar an Meilenstein-Zahlungen; Novartis legte 37,5 Millionen Dollar plus bis zu 1,2 Milliarden Dollar nach. Insgesamt rund drei Milliarden Dollar potenzielle Erlöse aus diesen beiden Deals — ohne die Royalties, die im Erfolgsfall on top kommen. Im April 2025 schloss Isomorphic eine 600-Millionen-Dollar-Finanzierungsrunde mit Thrive Capital und GV als Lead-Investoren ab. Hassabis ist gleichzeitig CEO von Isomorphic Labs und Google DeepMind — eine ungewöhnliche Doppelrolle, die die enge Bindung der Tochter an die Mutter unterstreicht.

Für die Pharmaindustrie ist der Phase-1-Eintritt ein kategorialer Schritt. Bisher waren KI-designte Wirkstoffe ein bewerbendes Versprechen — die meisten Veröffentlichungen lasen sich wie „diese Verbindung würde theoretisch binden“. Phase-1-Patienten sind reale Menschen, in denen reale Pharmakokinetik gemessen wird. Sollte einer der Onkologie-Kandidaten den Phase-1-Pfad erfolgreich durchlaufen (Erfolgsrate historisch: rund 60 Prozent für Phase 1, bezogen auf Sicherheit, nicht Wirksamkeit) und in Phase 2/3 eintreten, beträgt der Zeithorizont bis zur Marktzulassung weiterhin sechs bis zehn Jahre. Die Onkologie-Pipelines anderer KI-Pharma-Unternehmen — Recursion, Insilico Medicine, BenevolentAI — haben den Schritt teils schon vorher vollzogen, allerdings auf weniger anspruchsvollen Architekturen.

Die Implikation für SaaS-Entscheider liegt nicht in der direkten Anwendung, sondern in einem Mustererkennungssignal. Was Isomorphic in der Wirkstoffforschung tut — ein integriertes End-to-End-Modell für eine Branche, die früher eine Kette diskreter Tools nutzte — ist dieselbe Architekturentscheidung, die Salesforce mit Agentforce, Microsoft mit Copilot Studio und HubSpot mit Breeze gerade in vertikalen Software-Domänen treffen. Vertikale Foundation-Modelle, die nicht nur ein Problem lösen, sondern eine ganze Wertschöpfungskette koordinieren, sind das nächste Schlachtfeld der KI-Anwendung. Pharma ist hier nur das prominenteste Beispiel.

Quellen

Infrastruktur · Meta × AWS

Meta mietet zig Millionen Graviton-CPU-Kerne von Amazon

24. April 2026

Während alle über GPUs reden, hat Meta eine Multi-Milliarden-Dollar-Vereinbarung mit AWS unterzeichnet — über CPUs. Tens of Millions an Graviton-5-Kernen über mindestens drei Jahre. Begründung: Agentische KI braucht orchestrierende, niedrig-latente CPU-Last für viele kleine Aufgaben — und das ist „fast so groß wie die GPU-Story“.

Hintergrund & Analyse

Die Ankündigung kam am Freitag aus Seattle: AWS und Meta unterzeichnen eine mehrjährige Partnerschaft, in der Meta Zehnermillionen Graviton-5-CPU-Kerne von Amazons hauseigener ARM-Chip-Familie für mindestens drei Jahre nutzt. Damit wird Meta zu einem der fünf größten Graviton-Kunden weltweit. Der Vertragsumfang wurde nicht offiziell beziffert; Branchenkenner schätzen den Wert auf einen mittleren einstelligen Milliardenbetrag. Bemerkenswert: Meta zog sich erst Anfang 2025 in Folge des Manus-China-Konflikts und Capex-Restrukturierung weiter aus AWS zurück, lief vornehmlich auf eigenen Datacentern. Der jetzige Schritt ist ein Strategiewechsel.

Der Hintergrund ist die Verschiebung der KI-Lastenstruktur. Klassische Inferenz von Sprachmodellen ist GPU-gebunden: Matrixmultiplikationen mit hoher Parallelität, hoher Bandbreitenbedarf, geringer CPU-Anteil. Agentische Workloads — also Systeme, die mehrere Modelle hintereinanderschalten, Tools aufrufen, Web-Daten verarbeiten, Datenbanken abfragen — verschieben einen substanziellen Teil der Last zur CPU. Tool-Calls, Datenformatierung, Routing zwischen Sub-Agents, RAG-Retrieval, Memory-Management: das sind alles Operationen, die GPU-Cluster nicht effizient erledigen können. Meta-Chef-Researcher Yann LeCun: „Agentische KI ist fast so eine große CPU-Story wie eine GPU-Story.“

Graviton-5 ist Amazons fünfte Generation eigener ARM-Chips, eingeführt im November 2025 als „purpose-built for agentic and AI-augmented workloads“. Die Architektur basiert auf Arm Neoverse V3 mit erweiterten SVE2-Instruktionen, 128 Cores pro Sockel, mit dedizierten Pfaden für KV-Cache-Operationen, BF16-Vektorarithmetik und Custom-Instruktionen für RAG-typische Vektor-Operationen. Im Vergleich zu Intel Xeon und AMD EPYC verspricht Amazon 30 bis 40 Prozent bessere Performance pro Watt und 25 bis 35 Prozent niedrigere Kosten pro Inferenz-Operation in agentischen Workloads. Diese Zahlen sind herstellerseitig — unabhängige Benchmarks von Phoronix bestätigen aber den groben Trend.

Für AWS ist der Deal ein strategisches Signal an Konkurrenten und Kunden: Graviton hat den hyperscaler-internen Status verlassen und wird zur ernsthaften Plattform für externe AI-Heavy-Loads. Vor Meta waren bekannte Großkunden u.a. Snap, Pinterest, Shopify und Lyft; Meta verändert das Profil durch schiere Größe. Für Meta ist es eine Mischung aus Kostenarbitrage und Resilienz — eigene Infrastruktur ergänzt durch AWS-Kapazität, die elastisch hochgefahren werden kann. Implizit wirkt der Deal auch wie eine Friedensgeste in den von Manus überschatteten US-China-Tech-Beziehungen, da Meta sich klar auf US-Hyperscaler-Partner stützt.

Die Lehre für SaaS-Architekten: Wer agentische Anwendungen plant, sollte CPU-Auslastung neu modellieren. Faustregel aus aktueller AWS-Dokumentation: Pro GPU-Stunde in der Inferenz fallen drei bis fünf Stunden CPU-Last für Tool-Orchestrierung, Memory und I/O an. Wer das nicht kostenseitig einplant, unterschätzt die echten Total-Cost-of-Ownership-Profile von Agent-Stacks systematisch. Der Marktanteil von ARM-Cloud-Compute in agentischen Architekturen wird nach Analyst-Prognosen von SemiAnalysis von rund 18 Prozent (2025) auf über 35 Prozent bis Ende 2027 steigen.

Quellen

Geopolitik · China

China verschärft Kapital-Restriktionen für KI-Startups als Reaktion auf Manus-Verkauf

24. April 2026

Nach der umstrittenen 2-Milliarden-Dollar-Übernahme des KI-Startups Manus durch Meta zieht Peking die Daumenschrauben an: Chinesische Tech-Firmen — explizit auch die führenden KI-Pioniere Moonshot AI und StepFun — sollen US-Kapital nur noch mit explizit Behörden-Genehmigung annehmen. Eine direkte Antwort auf das von Branche Beobachtern „Singapore Washing“ getaufte Phänomen.

Hintergrund & Analyse

Bloomberg meldete am Donnerstag, dass die National Development and Reform Commission (NDRC) — Chinas mächtigste Wirtschaftsplanungsbehörde — und mehrere weitere Agenturen private Tech-Firmen in den letzten Wochen explizit angewiesen haben, US-Kapital in Finanzierungsrunden ohne ausdrückliche Genehmigung abzulehnen. Namentlich genannte Empfänger dieser Anweisung sind unter anderem Moonshot AI (Hersteller des Kimi-Modells, das im April mit Kimi K2.6 zu den führenden Open-Source-Modellen aufgeschlossen hat) und StepFun. Beide bereiten Börsengänge bzw. größere Finanzierungsrunden vor.

Der Hintergrund ist der Manus-Komplex. Manus, ein 2024 in Singapur registriertes KI-Agent-Startup mit chinesischen Gründern (Xiao Hong und Ji Yichao), entwickelte einen autonomen Agent, der mit Browser-Automatisierung Aufgaben in produktionsfähiger Qualität erledigt. Im Januar 2026 kaufte Meta die Firma für rund zwei Milliarden Dollar — ohne dass die chinesische Provenienz in der ersten Pressemitteilung explizit erwähnt wurde. Die Washington Post deckte den Vorgang zwei Wochen später auf, was eine Welle politischer Reaktionen auslöste: Die chinesischen Gründer wurden Ende März bei einer Reise nach Peking an der Ausreise gehindert, das Handelsministerium leitete eine nationale Sicherheitsprüfung ein, und das Ganze gipfelte am 23. April im offiziellen Erlass: „Singapore Washing“ — also die Umgehung chinesischer Tech-Export-Kontrollen durch eine simple Sitzverlagerung — wird nicht mehr toleriert.

Die parallele Maßnahme aus Washington ist ebenfalls aktiv. Das House Foreign Affairs Committee verabschiedete am 22. April eine Reihe parteiübergreifender Export-Kontroll-Gesetze, die KI-Technologie-Flüsse Richtung China weiter einschränken sollen. Der Trump-II-Administration wird vorgeworfen, in dieser Frage zu zaghaft zu agieren — entsprechend setzt der Kongress eigene Akzente. Die parallelen Restriktionen aus Peking und Washington bedeuten, dass KI-Investoren in beiden Ländern ihre Cross-Border-Strategien grundlegend überdenken müssen.

Für die globale KI-Finanzierungslandschaft sind die Konsequenzen substanziell. Bisher floss US-Risikokapital — Sequoia, a16z, Lightspeed, Khosla — in chinesische KI-Startups häufig über Singapore- oder Cayman-Strukturen. Diese Vehikel werden jetzt schwieriger, langsamer und politisch riskanter. Das hat zwei mögliche Effekte: Erstens dürften chinesische KI-Champions vermehrt auf inländisches Kapital, Hong-Kong-IPOs und staatlich geförderte Fonds setzen — was die enge Verbindung zur chinesischen Regierungspolitik verstärkt. Zweitens steigen die Hürden für US-Hyperscaler, sich an chinesischer KI-Innovation zu beteiligen, was bestehende Partnerschaften (etwa AMD-Aliyun, Microsoft-iFlytek) strategisch riskanter macht.

Für deutsche und europäische SaaS-Unternehmen ergeben sich aus der Polarisierung zwei pragmatische Folgen. Erstens: Der Markt für „neutrale“ KI-Modelle wird größer. Open-Source-Modelle aus China — DeepSeek, Qwen, GLM, Kimi — sind unter MIT- oder Apache-Lizenz frei nutzbar, ohne dass deutsche Kunden sich politisch positionieren müssen. Zweitens: Die Lieferkettenrisiken bei KI-Hardware (TSMC-Produktion, Nvidia-Exportlizenzen, ARM-Designhilfen) werden volatiler; wer auf Compute-intensive Workloads setzt, sollte Backup-Stacks auf alternative Hyperscaler einplanen.

Quellen

Talent · Thinking Machines

Mira Muratis Thinking Machines verliert fünf Gründungsmitglieder an Meta

24. April 2026

Acht Monate nach dem 12-Milliarden-Dollar-Seed hat das Mira-Murati-Startup praktisch sein gesamtes Gründungsteam verloren — fünf zentrale Köpfe wechseln zu Metas Superintelligence Labs, ein Co-Founder erhält angeblich ein 1,5-Milliarden-Dollar-Paket über sechs Jahre. Anlass: ein abgelehntes 1-Milliarden-Dollar-Übernahmeangebot. Die nächste Phase des Talentkriegs ist eröffnet.

Hintergrund & Analyse

Die Ausgabe vom 23. April berichtete über die offiziellen Meta-Layoffs — 8.000 Stellen, zehn Prozent der Belegschaft. Was wie eine Sparmaßnahme aussah, ist tatsächlich Teil einer aggressiven Umbau-Strategie unter dem neuen Chief AI Officer Alexandr Wang (von Meta für 14,3 Milliarden Dollar via Scale-AI-Übernahme akquiriert). Wer geht, wird durch teures Spitzentalent ersetzt. Am Donnerstag berichtete The Next Web gestützt auf Informationen mehrerer Beteiligter: Meta hat fünf Gründungsmitglieder von Mira Muratis Thinking Machines Lab abgeworben.

Der prominenteste Wechsel: Andrew Tulloch, einer der ursprünglichen Co-Founder und ehemaliger Anthropic-Senior-Engineer. Sein Paket: 1,5 Milliarden Dollar über sechs Jahre, eine Mischung aus Cash, Aktien und Performance-Multiplikatoren. Falls bestätigt, wäre das das größte je dokumentierte Tech-Talent-Paket — über das hinaus, was selbst die ursprünglichen OpenAI-zu-Anthropic-Bewegungen 2023/24 erreichten. Daneben gehen drei weitere Founding Engineers und ein Senior Researcher zu Meta Superintelligence Labs. Hintergrund: Murati hatte ein 1-Milliarden-Dollar-Übernahmeangebot von Meta abgelehnt; Meta antwortete, indem es das Team aus dem Startup herauskaufte.

Das Ergebnis ist dramatisch. Thinking Machines Lab, gegründet im Frühjahr 2025 von Murati und einem rund 30-köpfigen Team aus ehemaligen OpenAI- und Anthropic-Veteranen, schloss im Juli 2025 eine 2-Milliarden-Dollar-Seed-Runde unter der Führung von Andreessen Horowitz bei einer Bewertung von 12 Milliarden Dollar ab — die größte Seed-Runde aller Zeiten. Im November 2025 liefen Gespräche über eine Series A bei 50 Milliarden Dollar Bewertung. Inzwischen hat das Unternehmen den Großteil seines Gründungsteams verloren: Im Januar 2026 gingen Barret Zoph und Luke Metz zurück zu OpenAI (nach Vorwürfen von „unethischem Verhalten“ — Details unklar). Im März verließ Devendra Chaplot das Unternehmen Richtung xAI. Joshua Gross, Erbauer der Tinker-API (das einzige produktbar veröffentlichte Asset des Startups), ging im selben Monat zu Meta Superintelligence Labs.

Murati selbst bleibt CEO. Soumith Chintala (Erfinder von PyTorch, ex-Meta FAIR) ist CTO; John Schulman (ex-OpenAI) Chief Scientist. Das aktuelle Team ist jedoch deutlich schmaler als ursprünglich vorgesehen — und die strategischen Optionen sind eingeschränkt. Die Series A bei 50 Milliarden Dollar dürfte unter dem Eindruck der Abwanderungen schwieriger zu schließen sein. Was im Sommer 2025 als plausibles Counter-Frontier-Lab gestartet war (mit angekündigter Mission „Building unbiased, controllable AI for individuals and societies“), erscheint heute eher als kompliziertes Salvage-Projekt.

Was die Episode zeigt, ist die brutale Pareto-Verteilung im KI-Talentmarkt. 2024 wurde die These „Compute ist King“ vorgetragen; 2025 dann „Daten sind das neue Gold“; 2026 ist offensichtlich: Spitzentalente sind der eigentliche Engpass, und große Tech-Firmen sind bereit, einzelne Personen mit Beträgen zu verpflichten, die früher Series-A-Bewertungen ganzer Startups entsprachen. Für SaaS-Unternehmen mit eigenen KI-Initiativen ist das eine Mahnung: Der Wettbewerb um Senior-Researcher- und Senior-Engineer-Talente ist durch die Hyperscaler-Eskalation in eine Liga vorgerückt, in der traditionelle Comp-Strukturen nicht mehr mithalten können. Wer Frontier-AI-Produkte plant, muss entweder Top-Talent als Co-Founder gewinnen (Equity-Hebel) oder mit Top-Frontier-Modellen via API arbeiten (statt eigene Trainingstiefe aufzubauen).

Quellen

Reportage

Open-Source-Frontier 2026: Wie DeepSeek V4 die KI-Wirtschaft neu sortiert

DeepSeek V4 ist nicht das schnellste, nicht das stärkste, nicht das eleganteste Modell. Es ist das günstigste auf Frontier-Niveau — und damit der Hebel, der Closed-Source-Geschäftsmodelle ins Wanken bringt. Eine ausführliche Analyse, was deutsche SaaS-Entscheider in den nächsten 90 Tagen tun sollten.

Weiterlesen →

Tool-Radar

Neue und trendende KI-Tools des Tages

BAND

Universeller Orchestrator für das „Internet of Agents“ — koordiniert Agenten verschiedenster Frameworks (LangChain, CrewAI, Claude Code, Codex, SaaS-Agents) in einer einheitlichen Interaktionsschicht. Discovery, Kontextaustausch, Delegation und Echtzeit-Kollaboration ohne Custom-Glue-Code.

23. April 2026 · BAND (17 Mio. Seed, Sierra Ventures + Hetz + Team8)

Beezi AI

Governanced On-Premise-Orchestrierung für KI-augmentierte Software-Entwicklung — läuft in GitHub, Jira und Slack ohne Workflow-Bruch. Trackt Token-Verbrauch und Kosten pro Aktivität, mappt KI-Spend auf Delivery-Workflows; Engineering-Leads sehen erstmals belastbare Metriken statt Gefühl.

24. April 2026 · Honeycomb Software

Bansi AI

Erster spezialisierter KI-Editor für Long-Form-Videos — automatische Zooms, Smart-B-Roll, kinetic Text und Sounddesign aus Rohaufnahmen. Schließt die Lücke, in der Short-Form bereits dutzende Tools hat. Vom Writesonic-CEO Samanyou Garg gebaut, dessen CTO „Claude Code“ war.

23. April 2026 · Writesonic-Founder-Projekt (Beta)

Spira AI

Autonome KI-Influencer-Agenten, die Social-Media-Konten 24/7 betreiben: erkennen Trends, schreiben Posts, veröffentlichen plattform-optimiert. Jeder Agent hat eigene Stimme, Memory und Persönlichkeit, lernt aus Performance. Gegründet von Ex-Meta/TikTok/Midjourney-Veteranen.

23. April 2026 · Spira AI (Pre-Seed)

Mozart Studio 1.0

Generative-Audio-Workstation, die Prompts und Sprachbefehle in editierbare MIDI- und Audio-Stems verwandelt — anders als Suno oder Udio kein End-to-End-Track, sondern ein DAW-Workflow für Profis. Layer-basiert, mit Mixer, Effekten und VST-Support. Trainiert ohne urheberrechtsgeschützte Musik.

24. April 2026 · Artos Inc. (Balderton-finanziert)

Imagen Video

KI-gestützte Frame-für-Frame-Farbkorrektur für Premiere Pro und DaVinci Resolve — analysiert Belichtung, Weißabgleich, Hauttöne und Kameradifferenzen. Nach Herstellerangaben bis zu zehnmal schneller als manuelles Color-Grading. Pay-per-Minute (1 USD/Min, oder 0,60 mit Abo).

24. April 2026 · Imagen AI

Aus der Werkstatt

YouTube-Empfehlungen: Tutorials, Erklärungen und Werkzeuge

Tutorial

Deepseek v4: Best Opensource Model Ever? (Fully Tested)

WorldofAI (214.000 Subs) · 24. April 2026

Direktes Hands-on mit V4-Pro und V4-Flash am Tag des Releases: Side-by-Side-Code-Tests gegen Claude Opus 4.7, GPT-5.5 und Gemini 3.1 Pro, ein längerer Block zur 1-Million-Token-Kontext-Praxis und Diskussion der MIT-Lizenzierung. Solide Einführung mit pragmatischem Setup-Pfad für eigene Tests.

Tutorial

GPT 5.5 Arrives, DeepSeek V4 Drops, and the Compute War Intensifies

AI Explained (419.000 Subs) · 24. April 2026

Die analytische Einordnung des Tages: 25-minütige Tour durch die parallelen Releases von GPT-5.5 und DeepSeek V4, mit Fokus auf die ökonomische Frage „closes the gap“-Rhetorik vs. realer Benchmark-Lücke und der Frage, was hybrid sparse attention für Long-Context-Wirtschaftlichkeit bedeutet. Pflichtsehen für jeden, der Modell-Strategien für 2026 plant.

Ausgabe vom 25. April 2026

DeepSeek V4: Open-Source-Frontier zum Bruchteil des Preises

Google verspricht bis zu 40 Milliarden Dollar für Anthropic

Tesla verbirgt 2-Milliarden-Dollar-Übernahme einer KI-Hardware-Firma im 10-Q

DeepMind-Spinoff bringt erste KI-designte Wirkstoffe in klinische Phase 1

Meta mietet zig Millionen Graviton-CPU-Kerne von Amazon

China verschärft Kapital-Restriktionen für KI-Startups als Reaktion auf Manus-Verkauf

Mira Muratis Thinking Machines verliert fünf Gründungsmitglieder an Meta

Open-Source-Frontier 2026: Wie DeepSeek V4 die KI-Wirtschaft neu sortiert

Tool-Radar

Aus der Werkstatt