Die Inferenz

Generative KI · Deepfakes

Zwei Minuten bis zum eigenen Klon: Gemini Omni macht fotorealistische Deepfakes zur Massenware — und The Verge zeigt, wie trivial das ist

23. Mai 2026

Fünf Tage nach der Vorstellung auf der Google I/O hat The Verge Googles neues „Anything-to-Anything"-Modell Gemini Omni einem Praxistest unterzogen — und das Ergebnis ist beeindruckend wie beunruhigend zugleich. Mit einem Google-Konto und einer Kreditkarte lässt sich in Minuten ein überzeugendes Video von sich selbst „auf einem Flug nach Maui" erzeugen. Google flankiert das mit SynthID-Wasserzeichen und einer Identitätsprüfung fürs Avatar-Feature, hat das riskanteste Element aber bewusst deaktiviert.

Hintergrund & Analyse

Auf der Entwicklerkonferenz I/O am 19. Mai hatte Google das erste Modell einer neuen Generativ-Familie vorgestellt — wir berichteten in unserer Ausgabe vom 20. Mai. Der Anspruch steckt im Namen: „Anything to anything“. Gemini Omni nimmt beliebige Kombinationen aus Text, Bildern, Audio und Video entgegen und erzeugt daraus neue Medien. Den Anfang macht Gemini Omni Flash, das zunächst ausschließlich Video ausgibt; Bild- und Audio-Ausgabe sollen folgen. Anders als ältere Werkzeuge erlaubt Omni konversationelle Bearbeitung: Man ändert Szenen in natürlicher Sprache, fügt Elemente hinzu, und Charaktere bleiben über mehrere Schritte hinweg konsistent. DeepMind-Chef Demis Hassabis rahmt das Modell als Schritt zu einer KI, die „die Welt verstehen und simulieren“ könne.

Was die Ankündigung zur Schlagzeile dieser Woche machte, war jedoch nicht die Technik selbst, sondern der Praxistest. Am 23. Mai veröffentlichte The Verge ein Hands-on, das die gesellschaftliche Sprengkraft greifbar macht. Redakteurin Allison Johnson „deepfakte“ zunächst das Plüsch-Reh ihres Kindes auf eine Urlaubsreise, dann sich selbst: beim Spaghetti-Essen, im Flugzeugsitz, vor dem Eiffelturm. Ein Deepfake ist mit KI synthetisch erzeugtes Bild- oder Videomaterial, das eine reale Person täuschend echt darstellt. Manche der Clips waren so überzeugend, dass selbst Johnsons Ehemann sie für echt hielt und nur die unbekannte Schüssel im Spaghetti-Video hinterfragte. Ihre nüchterne Bilanz: Wer ein Google-Konto und eine Kreditkarte habe, könne sich mit minimalem Aufwand in einen Flug nach Maui hineinmontieren.

Nicht alles war perfekt. Ein Gabel-auf-Pasta-Geräusch klang künstlich, in einem Flugzeug-Video tauchte eine Frau doppelt auf, einzelne Eiffelturm-Clips wirkten cartoonhaft, und beim Plüsch-Reh wechselte eine Honigflasche zwischen den Frames die Form. Doch der Trend ist eindeutig: Gegenüber dem Vorgänger Veo hat Omni bei Charakter-Konsistenz und Weltwissen sichtbar zugelegt. Verfügbar ist Omni Flash sofort für Google-AI-Plus-, -Pro- und -Ultra-Abonnenten über die Gemini-App und Google Flow, kostenlos in YouTube Shorts und der YouTube-Create-App; eine API folgt „in den kommenden Wochen“. Die Video-Erzeugung kostet 15 bis 40 Credits — der 20-Dollar-Plan mit 1.000 Credits ist nach rund zwanzig Clips aufgebraucht.

Google hat erkennbar versucht, Schutzmechanismen einzubauen. Jedes erzeugte Video trägt ein unsichtbares SynthID-Wasserzeichen — ein in die Pixel eingebettetes Signal, das KI-Inhalte maschinell kennzeichnet und sich über Chrome oder die Google-Suche prüfen lässt. Das Avatar-Feature, mit dem man sich selbst in Videos einsetzt, verlangt ein zweiminütiges Training aus Gesichts-Capture und Stimmproben, ein Mindestalter von 18 Jahren und eine Identitätsprüfung: Der Kontoinhaber muss bei der Einrichtung physisch vor der Kamera stehen, damit man nicht ohne Weiteres fremde Personen klonen kann. Und das nach eigener Einschätzung riskanteste Feature — das Austauschen von Audio und Sprache in bestehenden Videos — hat Google zum Start bewusst deaktiviert, weil Stimmklon im bewegten Bild der zentrale Deepfake-Vektor ist.

Für Unternehmen ist die Botschaft unbequem. Wenn fotorealistisches Video mit synchron geklonter Stimme zu Centpreisen und in Echtzeit verfügbar wird, sind Stimme und Bewegtbild keine Identitätsnachweise mehr — eine Verschiebung, die unmittelbar auf CEO-Betrug, gefälschte Videocalls und Reputationsangriffe durchschlägt. Wir ordnen den Stand der KI-Video-Deepfakes 2026 und die konkreten Konsequenzen in unserer Reportage dieser Ausgabe ausführlich ein. (Hinweis: Berichte über eine Einstellung von OpenAIs Consumer-Sora-App ließen sich nicht abschließend aus einer Primärquelle bestätigen.)

Quellen

Wirtschaft · KI-Kosten

Teurer als der Mensch: Microsoft kassiert Claude-Code-Lizenzen wieder ein — und legt das Token-Paradox der agentischen KI offen

23. Mai 2026

Ein Fortune-Bericht und die viral gegangene Seite „Is AI Profitable Yet?" trafen diese Woche einen Nerv: Ausgerechnet Microsoft hat einen Großteil seiner internen Claude-Code-Lizenzen gekündigt — nur ein halbes Jahr nach Einführung, weil die Nutzung die Kosten explodieren ließ. Dahinter steckt eine kontraintuitive Mechanik: Je effizienter ein KI-Agent arbeitet, desto teurer wird er. Für Unternehmen verschiebt sich die Frage von „Was kann KI?" zu „Was kostet sie wirklich?".

Hintergrund & Analyse

Es ist eine bemerkenswerte Wendung in der KI-Erzählung. Ein Bericht des Magazins Fortune vom 22. Mai legte offen, dass Microsoft einen Großteil der direkten Claude-Code-Lizenzen seiner Entwickler gekündigt hat — nur etwa sechs Monate, nachdem das Unternehmen Tausenden Mitarbeitern den Zugang freigeschaltet hatte. Betroffen ist vor allem die Sparte Experiences + Devices, zuständig für Windows, Microsoft 365, Outlook, Teams und Surface; bis spätestens Ende Juni sollen die Teams auf Microsofts eigene GitHub Copilot CLI umsteigen. Zuerst berichtet hatte das Tom Warren in seinem Verge-Newsletter. Offiziell spricht Microsoft von „Toolchain-Vereinheitlichung“, doch mehrere Quellen nennen finanzielle Motive — und der Stichtag fällt mit dem Geschäftsjahresende zusammen. Der unbequeme Befund dahinter: Claude Code wurde intern schlicht zu beliebt und zu intensiv genutzt.

Die zugrunde liegende Mechanik ist das eigentlich Interessante. Bei token-basierter Abrechnung — ein Token ist die kleinste Verarbeitungseinheit, in die ein KI-Modell Text zerlegt — steigen die Kosten paradoxerweise mit der Qualität der Nutzung. Agentische Systeme, die Aufgaben selbstständig in viele Zwischenschritte zerlegen, recherchieren und sich selbst korrigieren, verbrauchen ein Vielfaches an Rechenlast gegenüber einem simplen Chat-Prompt. Nvidia-Vizepräsident Bryan Catanzaro formuliert es nüchtern: „Für mein Team liegen die Compute-Kosten weit über den Personalkosten.“ Goldman Sachs erwartet bis 2030 einen 24-fachen Anstieg des Token-Verbrauchs; Gartner rechnet mit rund 90 Prozent günstigeren Preisen pro Token — und gleichzeitig mit steigenden Gesamtkosten. Der Mengeneffekt frisst den Preisverfall auf.

Zeitgleich feierte die Hacker-News-Community die Seite „Is AI Profitable Yet?“ (isaiprofitable.com), die das kumulierte Ausgeben gegen die Umsätze der großen KI-Akteure stellt. Das Bild ist ein Meer roter Balken. Profitabel ist vor allem, wer im Goldrausch die Schaufeln verkauft — Nvidia und die Chip-Zulieferer. Google hält sich über Werbe-Synergien über Wasser, Meta verbrennt das Äquivalent mehrerer Jahresgewinne in Infrastruktur. Bei den reinen Modell-Laboren klafft die Lücke am weitesten: OpenAI erwartet laut eigenen Investoren-Angaben erst um 2030 schwarze Zahlen. Anthropic gilt als deutlich effizienter und steuert laut einem Bericht der Financial Times im zweiten Quartal 2026 auf sein erstes profitables Quartal zu — eine Prognose, kein testierter Abschluss. Kritiker an der Seite merken zu Recht an, dass sie Investitionsausgaben für den Infrastrukturaufbau mit den laufenden Kosten vermischt.

Für Unternehmen ist die entscheidende Frage nicht, ob KI-Anbieter irgendwann rentabel werden, sondern ob der Einsatz von KI-Agenten heute lohnt. Die Antwort lautet: Es kommt auf die Governance an. Eine viel zitierte MIT-Studie fand, dass 95 Prozent der Enterprise-Pilotprojekte keinen messbaren Return liefern — dass aber von Anbietern begleitete Projekte rund dreimal so häufig gelingen wie interne Eigenbauten. Der Fall Uber zeigt die Kehrseite ohne Kostenkontrolle: Das Unternehmen rollte Claude Code firmenweit ohne Token-Limits oder Monitoring aus und brannte sein Budget durch.

Die Lehre der Saison 2026 lautet damit weniger „KI ist zu teuer“ als vielmehr: Wer Agenten ohne Caps, Erfolgsmessung und Workflow-Integration losschickt, zahlt Lehrgeld — wer es mit Guardrails tut, erntet messbaren Nutzen. Pikant bleibt, dass ausgerechnet Microsoft, einer der größten Treiber der generativen Revolution und zugleich Anthropic-Investor, hier zum unfreiwilligen Kronzeugen wird. Die Anthropic-Modelle bleiben über Copilot CLI übrigens verfügbar — verschwindet nur die Oberfläche von Claude Code, die die Entwickler so schätzten.

Quellen

Arbeitswelt · Restrukturierung

Drei Agenten pro Mitarbeiter: ClickUp entlässt 22 Prozent der Belegschaft — und verspricht dem Rest Millionengehälter

23. Mai 2026

Die Produktivitätsplattform ClickUp hat ein Fünftel ihrer Belegschaft entlassen — und CEO Zeb Evans bestreitet, dass es ums Sparen ging. Stattdessen ruft er die „100x-Organisation" aus: rund 3.000 interne KI-Agenten, drei je verbliebenem Mitarbeiter, und Gehaltsbänder bis zu einer Million Dollar für jene, die mit KI „100-fachen Impact" erzeugen. Eine radikale Wette — und ein Lehrstück über die Grenzen solcher Versprechen.

Hintergrund & Analyse

Es ist eine der bislang radikalsten Begründungen für eine Massenentlassung im KI-Zeitalter. Die mit rund vier Milliarden Dollar bewertete Projektmanagement-Plattform ClickUp hat 22 Prozent ihrer Belegschaft entlassen — und Firmenchef Zeb Evans bestreitet, dass es dabei ums Sparen ging. „Das Geschäft war noch nie so stark“, schrieb er auf X. Der Großteil der frei gewordenen Mittel solle „direkt an die Leute zurückfließen, die bleiben“. Statt von Krise spricht Evans vom Umbau zur „100x-Organisation“.

Den Kern dieser Vision bildet ein Heer von KI-Agenten: Laut einem Fortune-Profil betreibt ClickUp inzwischen rund 3.000 interne Agenten quer durch alle Abteilungen — drei auf jeden verbliebenen Mitarbeiter. Evans teilt die Belegschaft neu ein in „Builders“ (Ingenieure und Produktmanager, die nicht mehr selbst programmieren, sondern Code schreibende Agenten dirigieren), „System Managers“, die ihre eigene Rolle automatisieren und das Ergebnis überwachen, sowie kundenseitige „Front-liners“. Die besten Ingenieure, so seine zugespitzte These, schrieben gar keinen Code mehr — sie orchestrierten Agenten.

Für die Bleibenden lockt Evans mit einer ungewöhnlichen Belohnung: Gehaltsbänder von bis zu einer Million Dollar in bar pro Jahr, offen für nahezu jeden, der durch das Bauen oder Managen von KI-Systemen „100-fachen Impact“ erzeugt. „Wer mit KI seinen eigenen Job automatisiert, wird immer einen Job haben“, lautet seine Botschaft an die Belegschaft — und an die Branche, der er prophezeit: „Nahezu jedes Unternehmen wird ähnliche Veränderungen vornehmen.“ Wie viele Menschen das Unternehmen vor den Entlassungen beschäftigte und welche Abfindungen die Betroffenen erhalten, teilte ClickUp nicht mit.

ClickUp reiht sich damit in einen Trend ein, der 2025 und 2026 die Tech-Branche prägt. Allein 2025 waren über 100.000 Beschäftigte von KI-begründeten Entlassungen betroffen. Salesforce strich rund 4.000 Support-Stellen, nachdem KI-Agenten nach Angaben von CEO Marc Benioff etwa die Hälfte aller Kundeninteraktionen übernahmen. Doch die Bilanz ist gemischt: Klarna, das früh verkündet hatte, KI könne „bereits alle menschlichen Jobs erledigen“, ruderte nach rund 700 Entlassungen zurück und räumte ein, sich „zu sehr auf Kosten“ konzentriert zu haben.

Genau hier liegt die Sollbruchstelle von Evans’ Wette. Eine Analyse der Harvard Business Review kommt zu dem Schluss, dass viele Firmen heute „wegen des Potenzials von KI entlassen — nicht wegen ihrer Performance“. Wer drei Agenten je Mitarbeiter zählt, hat noch keinen Beweis erbracht, dass diese Agenten die Arbeit der Entlassenen tatsächlich ersetzen. ClickUps 100x-Organisation ist deshalb weniger ein vollzogener Strukturwandel als ein öffentlich ausgetragenes Experiment — dessen Ergebnis erst die Quartalszahlen und die Kundenzufriedenheit der kommenden Monate zeigen werden.

Quellen

Verteidigung · KI & Hardware

Sprachmodell auf dem Gefechtsfeld: Anduril und Meta testen Llama, Gemini und Claude für Militär-Datenbrillen

22. Mai 2026

Acht Jahre nachdem Facebook ihn vor die Tür setzte, steht Palmer Luckey wieder neben Mark Zuckerberg — diesmal für KI-Datenbrillen fürs US-Militär. Eine Reportage der MIT Technology Review enthüllte, dass Anduril für die Sprachsteuerung der Brillen gleich drei große KI-Modelle parallel testet. Am 22. Mai zeigte Anduril zudem frisches Nachtsicht-Material seines EagleEye-Headsets. Dieselben Modelle, die im Chatbot Mails formulieren, sollen künftig Befehle im Einsatz interpretieren.

Hintergrund & Analyse

Andurils Militär-Datenbrillen sollen Soldaten eine erweiterte Sicht verschaffen: Bedrohungserkennung in Echtzeit, Drohnensteuerung per Blick, Geländedaten direkt im Sichtfeld. Das Detail, das die Geschichte im Mai neu befeuert hat, stammt aus einer Reportage der MIT Technology Review vom 18. Mai: Anduril probiert für die Sprachsteuerung gleich drei große Sprachmodelle parallel aus — Metas Llama, Googles Gemini und Anthropics Claude. Soldaten sollen künftig in normaler Sprache Befehle erteilen („Evakuierung anfordern“, „Route ohne Sperrzonen planen“), die ein Modell in Maschinenkommandos übersetzt. Welches Modell am Ende zum Einsatz kommt, ist offen — es ist ausdrücklich eine Testphase.

Hinter dem Vorhaben stehen zwei leicht zu verwechselnde Programme. Das eine ist SBMC (Soldier Borne Mission Command), ein Army-Programm, für das Anduril und Meta einen 159-Millionen-Dollar-Prototyping-Vertrag halten — AR-Brillen, die an bestehende Helme andocken. Das andere ist EagleEye, Andurils selbstfinanzierter Alleingang: ein kompletter Helm mit integrierter Sensorik, gespeist von Andurils Lattice-Software, mit ballistischem Schutz und einer Batterie, die in der Panzerplatte steckt. Zu EagleEye gab es am 22. Mai frisches Material: Anduril zeigte die Nachtsicht-Funktion mit 4K-Display und einem Sichtfeld von rund 84 bis 90 Grad und stellte sie demonstrativ der klassischen Röhren-Nachtsichtbrille PVS-31 gegenüber.

Der Schatten über dem Ganzen heißt IVAS. Microsoft führte das Army-Brillenprogramm jahrelang auf HoloLens-Basis — ein Vertrag mit einem Volumen von bis zu 22 Milliarden Dollar. Es wurde zum Lehrstück des Scheiterns: Soldaten berichteten von Kopfschmerzen, Augenbelastung und Übelkeit. Anfang 2025 reichte Microsoft das Programm an Anduril weiter, im April genehmigte die Army die Übertragung formell. Microsoft bleibt im Hintergrund als Cloud-Anbieter. Anduril vermarktet sich seither als der schnellere Akteur — Software-Updates, die früher ein halbes Jahr brauchten, erreichten die Truppe nun in unter 18 Stunden, so die eigene Darstellung.

Ob daraus mehr wird als teure Prototypen, ist offen — und hier lohnt Nüchternheit. Rund 100 Prototypen gehen im zweiten Quartal 2026 an ausgewählte Einheiten zur Feldtestung; eine Produktionsentscheidung der Army fällt frühestens 2028, „falls überhaupt“. Anduril hat bereits angekündigt, das System notfalls an verbündete Militärs zu verkaufen. Die Milliardenbeträge, die durch manche Schlagzeile geistern, beziehen sich teils auf andere Anduril-Aufträge, nicht auf die Datenbrillen selbst.

Die eigentliche Dimension ist die Verschmelzung von Consumer-KI und Kriegsführung. Dass dieselben Sprachmodelle, die im Chatbot Termine planen, künftig auf dem Gefechtsfeld Befehle interpretieren sollen, wirft Fragen nach Zuverlässigkeit, Halluzinationen und Verantwortung auf — wenn ein Modell einen gesprochenen Befehl falsch übersetzt, steht mehr auf dem Spiel als ein fehlerhafter Kalendereintrag. Zugleich markiert die öffentliche Versöhnung zwischen Luckey und Zuckerberg einen Stimmungsumschwung: Das Silicon Valley, das jahrelang Distanz zum Pentagon hielt, drängt nun offensiv in den Rüstungsmarkt.

Quellen

Autonomes Fahren · China

Chinas erstes Serien-Robotaxi: Xpeng baut den fahrerlosen Wagen selbst — ganz ohne Lidar

18. Mai 2026

In Guangzhou ist das erste serienproduzierte Robotaxi von Xpeng vom Band gelaufen — laut Hersteller das erste Mal, dass ein chinesischer Autobauer ein vollständig selbst entwickeltes Robotaxi in Serie fertigt. Technisch geht Xpeng einen für China untypischen Weg: reine Kameralösung, kein Lidar, vier hauseigene KI-Chips. Im kommerziellen Fahrgastbetrieb ist allerdings noch kein einziger Wagen — und für Deutschland gelten ganz andere Pläne.

Hintergrund & Analyse

Am 18. Mai lief im chinesischen Guangzhou das erste serienproduzierte Robotaxi von Xpeng vom Band — nach Darstellung des Herstellers der erste Fall, in dem ein chinesischer Autobauer ein vollständig selbst entwickeltes Robotaxi in Serie fertigt. Anders als bei den etablierten Robotaxi-Pionieren handelt es sich nicht um ein nachgerüstetes Serienauto, sondern um ein von Grund auf für den fahrerlosen Betrieb konstruiertes Fahrzeug auf Xpengs neuer GX-Plattform, ausgelegt auf Autonomiestufe Level 4 (fahrerloser Betrieb in einem definierten Gebiet). Es ist das erste von drei für 2026 angekündigten Modellen — einem Fünf-, einem Sechs- und einem Siebensitzer.

Technisch wählt Xpeng einen in China seltenen Weg: Das Robotaxi fährt mit einer reinen Kameralösung, ganz ohne Lidar (Laser-Abstandssensoren) und ohne hochauflösende Karten — eine Strategie, die sonst vor allem Tesla verfolgt, während Baidu, Pony.ai und WeRide auf teure Lidar-Sensorik setzen. Die Rechenarbeit übernehmen vier hauseigene Turing-KI-Chips mit zusammen 3.000 TOPS, die Fahrentscheidungen trifft das End-to-End-Modell VLA 2.0 mit einer Systemlatenz unter 80 Millisekunden. Den selbst entwickelten Turing-Chip und VLA 2.0 liefert Xpeng inzwischen auch an Volkswagen, das mit rund fünf Prozent beteiligt ist und als erster externer Kunde gilt.

Bei aller Symbolkraft der „Serienproduktion“ gilt es einzuordnen: Im kommerziellen Fahrgastbetrieb hat Xpeng noch kein einziges Robotaxi. Der bemannte Pilotbetrieb mit Sicherheitsfahrer soll erst in der zweiten Jahreshälfte 2026 starten, den vollautonomen Betrieb peilt das Unternehmen für Anfang 2027 an, die Expansion auf fünf weitere Städte ebenfalls für 2027. Konkrete Stückzahlen nannte Xpeng nicht. Damit ist das Unternehmen rund drei Jahre hinter den Marktführern: Baidus Apollo Go fährt bereits mit über 1.000 Fahrzeugen in gut 20 Städten und hat mehr als 17 Millionen Fahrten absolviert.

Für Deutschland und Europa verfolgt Xpeng vorerst andere Pläne — nämlich das klassische Endkundengeschäft, nicht den Robotaxi-Betrieb. Die für Europa bestimmten Modelle G6 und G9 laufen seit September 2025 bei Magna Steyr im österreichischen Graz vom Band, um die hohen EU-Zölle auf in China gebaute E-Autos zu umgehen. Im Mai 2026 wurde bekannt, dass Xpeng mit Volkswagen über eine eigene Europa-Fabrik verhandelt. Das günstige Einstiegsmodell Mona M03, ausgestattet mit einem Turing-Chip für Assistenzfunktionen, soll Ende 2026 nach Europa kommen — vom fahrerlosen Robotaxi-Betrieb auf deutschen Straßen ist dabei nicht die Rede.

Der Vorstoß fällt in eine entscheidende Phase des globalen Robotaxi-Rennens. In den USA dominiert Waymo mit rund 500.000 bezahlten Fahrten pro Woche in elf Städten; Teslas CyberCab-Robotaxi ist noch im Aufbau, und das Fahrassistenzsystem FSD startete erst am 21. Mai in China — die volle behördliche Freigabe wird dort frühestens für das dritte Quartal erwartet. Genau diese Konstellation prägt die Schlagzeilen: Während Tesla in China noch auf grünes Licht wartet, schickt Xpeng dort bereits sein erstes Serien-Robotaxi ins Rennen. Firmenchef He Xiaopeng nennt 2026 das „erste Jahr des globalen autonomen Fahrens“.

Quellen

Reportage

Zwei Minuten bis zum Klon: Der Stand der KI-Video-Deepfakes 2026 — und was Unternehmen jetzt tun müssen

Mit Gemini Omni, Sora 2, Seedance und Kling ist fotorealistisches Video zur Centware geworden. Ein Deepfake-Videocall kostete die Firma Arup 25 Millionen Dollar; Deloitte erwartet bis 2027 KI-Betrugsschäden von 40 Milliarden. Was die Modelle 2026 wirklich können, warum Wasserzeichen und Detektoren kein Verlass sind, was ab August die EU vorschreibt — und das konkrete Playbook gegen den Betrug. Von Stefan Lange-Hegermann.

Weiterlesen →

Tool-Radar

Neue und trendende KI-Tools des Tages

Contextberg

Lokale Memory-App, die im Hintergrund Bildschirm, Browser-Verlauf und Agent-Chats beobachtet und Coding-Agenten per MCP mit Kurz- und Langzeitgedächtnis versorgt.

Windows-first statt der üblichen Mac-only-Tools und komprimiert Rohdaten stündlich zu Memories — optional vollständig on-device mit lokalen LLMs.

Coding-Agent · Memory · Mai 2026

Re_gent

Versionskontrolle speziell für KI-Coding-Agenten — erfasst jeden Agent-Turn automatisch und erlaubt undo, blame, checkout und replay ganzer Sessions.

Speichert Agent-Aktivität lokal in einem .regent/-Ordner analog zu .git/; wo Git nur „fix bug" zeigt, zeigt Re_gent die komplette Konversation, die den Bug gefixt hat.

Dev-Tool · Agent-VCS · Mai 2026

Tycoon AI

„Betriebssystem für Ein-Personen-Unternehmen": eine KI-CEO namens Astra plus über zehn vorkonfigurierte Agenten (CMO, CTO und mehr), die ein ganzes Unternehmen autonom betreiben.

Man gibt Astra ein Ziel vor („10x Traffic diesen Monat"), sie plant, verteilt Aufgaben an Agenten und holt bei Bedarf Freigaben ein — ohne Setup oder API-Keys. Product of the Day auf Product Hunt am 21. Mai.

Business-Automation · Mai 2026

Mirelo SFX 1.6

Video-to-Audio-Modell, das synchrone Soundeffekte und Audiospuren passend zu Videoclips generiert.

Version 1.6 ergänzt Extend- und Inpaint-Funktionen für Audio — feingranulare Kontrolle, um Sound zu verlängern und gezielt zu überarbeiten. Mirelo will die Audio-Schicht für visuelle Inhalte werden.

Audio-Generierung · Mai 2026

Retina

Mac-Screen-Recorder für polierte Produkt-Demos mit Auto-Zoom, geglätteten Cursor-Pfaden, 4K-Export und KI-Grafiken.

Aufnahmen wirken ohne Nachbearbeitung cinematisch — der Recorder zoomt automatisch auf die Aktion und glättet Cursor-Bewegungen zu sanften Bögen. Aktuell als Beta kostenlos und ohne Wasserzeichen.

Kreativ · Demo-Video · Mai 2026

mailX by mailwarm

Kostenloses E-Mail-Deliverability-Toolkit für Menschen und KI-Agenten (API- und MCP-ready), das Domain und IP in Sekunden auf SPF, DKIM, DMARC, MX und Blacklist-Status prüft.

Statt Rohdaten liefert es Klartext-Erklärungen plus konkrete Fix-Schritte; ein KI-Agent diagnostiziert das Setup und führt Schritt für Schritt durch die Reparatur. Vom mailwarm-Team (YC S20).

Business · E-Mail-Infrastruktur · Mai 2026

Aus der Werkstatt

YouTube-Empfehlungen: Tutorials, Erklärungen und Werkzeuge

Tutorial

From 46% to 90%: Fine-Tuning Tiny LLMs for On-Device Agents

AI Engineer (486.000 Abonnenten) · 21:00

Cormac Brick (Google) zeigt, wie sich winzige Sprachmodelle für den Betrieb direkt auf dem Gerät fein-tunen lassen. Function Gemma mit 270 Millionen Parametern springt durch Fine-Tuning auf einem synthetisch erzeugten Datensatz von 46 auf 90 Prozent Genauigkeit. Konferenzvortrag mit Live-Demo (Gemma 4, LiteRT-LM) und einer produktiven Transkriptions-App — Pflichtstoff für alle, die On-Device-KI ernsthaft bauen.

Tutorial

I Rebuilt Hermes in Claude Code (It’s Ridiculously Good)

Simon Scrapes (85.900 Abonnenten) · 12:56

Agentische Systeme wie Hermes und OpenClaw boomen — doch was kostet ihr Einsatz von der Stange? Simon Scrapes baut die besten Features modular in n8n nach, um eine Architektur zu erhalten, die er selbst versteht und kontrolliert. Das Video zeigt, welche Features er nachbaute und welche er bewusst wegließ — eine Anleitung gegen das blinde Installieren fremder Agent-Stacks.

Ausgabe vom 24. Mai 2026

Zwei Minuten bis zum eigenen Klon: Gemini Omni macht fotorealistische Deepfakes zur Massenware — und The Verge zeigt, wie trivial das ist

Teurer als der Mensch: Microsoft kassiert Claude-Code-Lizenzen wieder ein — und legt das Token-Paradox der agentischen KI offen

Drei Agenten pro Mitarbeiter: ClickUp entlässt 22 Prozent der Belegschaft — und verspricht dem Rest Millionengehälter

Sprachmodell auf dem Gefechtsfeld: Anduril und Meta testen Llama, Gemini und Claude für Militär-Datenbrillen

Chinas erstes Serien-Robotaxi: Xpeng baut den fahrerlosen Wagen selbst — ganz ohne Lidar

Zwei Minuten bis zum Klon: Der Stand der KI-Video-Deepfakes 2026 — und was Unternehmen jetzt tun müssen

Tool-Radar

Aus der Werkstatt