Tabular Foundation Models — Die andere KI-Revolution für Unternehmen

GPT für Tabellen, nicht für Texte

Während die Öffentlichkeit gebannt auf jeden neuen Schritt der Sprachmodelle starrt, hat sich seit 2024 eine zweite, leisere KI-Revolution entwickelt — und sie betrifft genau die Daten, mit denen Unternehmen tatsächlich Geld verdienen. Schätzungen von Analysten und Plattformanbietern gehen davon aus, dass rund 80 Prozent aller Enterprise-Daten in tabellarischer Form vorliegen: ERP-Buchungen, CRM-Datensätze, Lieferketten-Bewegungen, IoT-Sensordaten, Personalstammdaten. Genau für diese Welt aus Zeilen und Spalten gibt es nun eine eigene Klasse von Foundation Models, sogenannte Tabular Foundation Models (TFMs).

Das technische Kernkonzept stammt aus Freiburg. Die Forschungsgruppe um Frank Hutter hat mit TabPFN — kurz für Tabular Prior-Data Fitted Network — ein Transformer-Modell entwickelt, das auf rund 130 Millionen synthetisch erzeugten Datasets vortrainiert wurde. Die im Januar 2025 in Nature publizierte Version v2 demonstrierte, dass dieses Modell ohne erneutes Training aus wenigen Beispielen lernt — sogenanntes In-Context Learning: Statt wochenlanger Modellierung mit XGBoost, scikit-learn oder klassischen AutoML-Pipelines bekommt das Modell die Daten zur Inferenzzeit, schaut sie sich an und liefert nach unter einer Sekunde eine Vorhersage. Im Originalbenchmark schlug TabPFN in 2,8 Sekunden ein vier Stunden lang trainiertes AutoML-Ensemble.

Für CEOs und PMs ist die Analogie zu Sprachmodellen hilfreich: So wie GPT Texte fortschreibt, ohne pro Aufgabe trainiert zu werden, sagt ein TFM Werte in Tabellen voraus, ohne dass ein Data-Science-Team monatelang Features baut. Wer bisher Wochen in einer Churn-Prognose oder einem Lead-Score versenkt hat, redet jetzt über Stunden. Und das ist nicht der spektakulärste Effekt — der spektakulärste Effekt ist, dass die Genauigkeit oft höher ist als das, was klassische Pipelines liefern.

Stand der Technik im Mai 2026

Die Geschwindigkeit, mit der sich TFMs entwickeln, ist bemerkenswert. Im November 2025 erschien TabPFN-2.5 mit Support für 50.000 Zeilen und 2.000 Features — eine 20-fache Steigerung der Datenmenge gegenüber v2. Bereits Anfang Dezember 2025 zeigte Prior Labs, wie das Modell bis auf 10 Millionen Zeilen skaliert werden kann — laut eigener Aussage ein 1.000-facher Sprung innerhalb eines Jahres. Auf TabArena, dem von einem internationalen Forscherteam in einem NeurIPS-2025-Paper etablierten Living Benchmark für Tabellen-ML, liegt RealTabPFN-2.5 derzeit an der Spitze; nur AutoGluon im sogenannten Extreme Mode mit vier Stunden Tuning kommt noch heran. TabPFN-2.5 erreicht in der Standardkonfiguration eine 100-Prozent-Win-Rate gegen Default-XGBoost auf kleineren Klassifikationsdatensätzen und 87 Prozent auf größeren Sets bis 100.000 Datenpunkten.

Der Wettbewerb formiert sich. Mit TabICLv2, einem Open-Source-Modell aus dem französischen Soda-Inria-Team, ist im Frühjahr 2026 ein direkter Herausforderer aufgetaucht, der laut der zugehörigen Publikation auf TabArena und TALENT ohne Tuning RealTabPFN-2.5 übertreffen kann und dabei deutlich schneller ist sowie auf Millionen-Zeilen-Datensätze skaliert. Parallel hat SAP im November 2025 mit SAP-RPT-1 ein eigenes „Relational Pretrained Transformer"-Modell vorgestellt, das speziell auf relationale Tabellenstrukturen aus dem ERP-Universum zielt und in zwei kommerziellen Varianten sowie als Open-Source-Variante über die SAP-AI-Foundation verfügbar ist. Hyperscaler wie Snowflake und Databricks bauen TFM-Funktionen in ihre AutoML-Stacks ein, ohne bisher mit eigenen Modellen die Top-Plätze auf TabArena zu erreichen.

Der SAP-Prior-Labs-Deal als europäischer Wendepunkt

Am 4. Mai 2026 hat SAP angekündigt, das erst 18 Monate alte Freiburger Startup Prior Labs zu übernehmen. Über die nächsten vier Jahre fließen mehr als eine Milliarde Euro in den Aufbau eines europäischen Frontier AI Lab, der Kaufpreis liegt laut TechCrunch bei rund 1,16 Milliarden US-Dollar — überwiegend in bar und mit erheblichem Cash-Anteil für die Gründer. Prior Labs bleibt als eigenständige Einheit erhalten; Frank Hutter führt das Lab weiter. Das Closing wird im zweiten oder dritten Quartal 2026 erwartet, vorbehaltlich kartellrechtlicher Freigaben.

Strategisch ist der Deal einer der bedeutendsten europäischen KI-Schritte überhaupt. SAP-CTO Philipp Herzig formulierte es so: Die „größte ungenutzte Chance in Enterprise-KI" liege nicht bei Sprachmodellen, sondern bei KI für die strukturierten Daten, die das Geschäft der Welt antreiben. Mit rund 80 Prozent der Fortune-500-Unternehmen als Kunden sitzt SAP auf einem Datenschatz, den keine andere Firma so vollständig adressieren kann. Die Integration ist klar geplant: Prior Labs' Modelle werden in SAP AI Core, SAP Business Data Cloud und die agentische Joule-Plattform eingebettet. Joule-Agenten können dann SAP-RPT-1 oder TabPFN auf Datasphere-Tabellen aufrufen — etwa für Demand-Forecasting, Cash-Flow-Prognosen oder Cross-Selling-Scoring direkt im Konversationsfluss, ohne Export auf separate ML-Plattformen. Parallel kauft SAP den Daten-Lakehouse-Spezialisten Dremio, was die Pipeline von Rohdaten bis zur tabellarischen Inferenz schließt.

Der Deal ist auch ein Korrektiv zur Aleph-Alpha-Geschichte. 2023 hatte SAP gemeinsam mit Schwarz-Gruppe, Bosch Ventures und HPE über 500 Millionen Dollar in Aleph Alpha investiert — als Teil einer 1-Milliarden-Dollar-Sapphire-Ventures-Initiative mit Beteiligungen auch an Anthropic und Cohere. Aleph Alpha pivotierte später weg vom Foundation-Model-Geschäft; Reste des LLM-Erbes wurden 2025 an das kanadische Cohere abgegeben. Mit Prior Labs übernimmt SAP nun erstmals selbst ein deutsches Frontier-Lab vollständig — nicht nur als Minderheits-Investor — und verankert es per Vertrag in Deutschland (Sitz Freiburg bleibt, Marke bleibt, Open-Source-Commitment bleibt). Das Scientific Advisory Board mit Yann LeCun und Bernhard Schölkopf unterstreicht den europäischen Forschungsanspruch.

Wo TFMs schon Wert schaffen

Die Praxis ist weiter, als viele Entscheider vermuten. Bei Hitachi Rail laufen TabPFN-Modelle inzwischen produktiv für die vorausschauende Wartung des spanischen Schienennetzes — Prior Labs berichtet von rund 40 Prozent niedrigerem Vorhersagefehler (RMSE) gegenüber den vorigen Baselines, wodurch Gleisprobleme früher erkannt und manuelle Inspektionen reduziert werden. Im Gesundheitswesen kombiniert das Oxford-Spin-out OXcan TabPFN mit proteomischen Liquid-Biopsy-Daten und erreicht laut Unternehmensangaben Sensitivitäten von über 90 Prozent bei der Früherkennung von Lungenkrebs (gegenüber 20 bis 48 Prozent bei klassischen Wettbewerbern). In Nature Communications wurde 2026 mit PanMETAI ein TabPFN-basiertes Modell publiziert, das Bauchspeicheldrüsenkrebs anhand von NMR-Metabolomik-Profilen mit AUCs von 0,99 (Training) und 0,93 (externe Validierung) detektiert. Im Banking nutzen Mission Lane und andere TabICL für Kreditrisiko-Modellierung; SAP nennt zudem Anwendungen in Versicherung (Schadensprognose), Energieversorgung (Lastprognose) und Telco (Churn-Prognose über 180 Tage).

Für die Praxis stellt sich die „Build-vs-Buy"-Frage neu. Wer bisher einen Data Scientist über Wochen XGBoost-Modelle bauen und tunen ließ, kann viele Use Cases mit einer TabPFN-API in Stunden abdecken — und für sensible Daten das Modell on-premise betreiben, weil TabPFN unter Apache-Lizenz auf Hugging Face und GitHub verfügbar ist. SAP-Bestandskunden bekommen mit RPT-1 ohnehin einen integrierten Pfad. Die ironische Folge: Der Engpass verschiebt sich vom Data Scientist hin zum Data Engineer, der saubere Tabellen aus heterogenen Quellen liefert. Sinnvolle Pilotkandidaten sind Use Cases mit unter 100.000 Zeilen pro Modell, klar definierten Zielgrößen und schwankender Datenqualität — typisch sind Lead-Scoring, Churn, Kreditrisiko-Vorscoring, Bestandsoptimierung und Predictive Maintenance.

Limitationen, Risiken und Ausblick

So beeindruckend die Benchmarks sind, der Reifegrad muss realistisch eingeordnet werden. Erstens: Auch mit dem Sprung auf 10 Millionen Zeilen sind echte Big-Data-Workloads (Hunderte Millionen Transaktionen, Streaming) noch nicht abgedeckt; klassisches XGBoost und tief integrierte Cloud-AutoML-Pipelines bleiben dort die erste Wahl. Zweitens: Erklärbarkeit. Tree-basierte Modelle plus SHAP gelten in regulierten Branchen als Goldstandard; bei TFMs ist Interpretierbarkeit ein aktives Forschungsfeld, auch wenn Prior Labs inzwischen eine SHAP-Integration anbietet. Drittens: Regulierung. Ab dem 2. Dezember 2027 — durch die heute besprochene EU-AI-Act-Verschiebung — gelten in der EU die Hochrisiko-Anforderungen vollständig. Kreditscoring sowie Versicherungs-Pricing fallen explizit unter Annex III, mit Verpflichtungen zu Datenqualität, Auditierbarkeit, menschlicher Aufsicht und Bußgeldern bis zu 35 Millionen Euro oder 7 Prozent des globalen Umsatzes. Wer jetzt TFMs in solchen Bereichen pilotiert, muss von Anfang an den vollen Compliance-Stack mitdenken.

Mittelfristig ist klar, wohin die Reise geht. Hutter selbst beschreibt die Roadmap: relationale Datenbanken mit Multi-Table-Joins, Zeitreihen, kausale Entdeckung und multimodale Modelle, die Tabellen mit Text und Bildern verschmelzen. Die Konsolidierung läuft schon: SAP hat sich mit Prior Labs den Standard gesichert, Salesforce und Microsoft werden mit hoher Wahrscheinlichkeit nachziehen — entweder durch Akquisition oder durch eigene Modelle in Microsoft Fabric und Salesforce Einstein. Die spannendere Frage ist, ob TFMs das XGBoost der 2030er werden. Die Ausgangslage spricht dafür: Sie kombinieren die statistische Effizienz von Boosted Trees mit dem Foundation-Model-Vorteil, einmal trainiert auf alle ähnlichen Probleme zu passen.

Was CEOs, PMs und Tech Leads jetzt tun sollten

Die praktische Konsequenz ist überschaubar. Pilot starten, jetzt: Ein Use Case mit klarer Zielgröße, unter 100.000 Zeilen, idealerweise einer, in dem heute bereits ein XGBoost-Modell läuft und Wochen pro Iteration kostet. Vergleich gegen TabPFN-2.5 oder TabICLv2 binnen 14 Tagen — die Modelle sind kostenlos verfügbar. Datenpipelines härten: Wenn der Engpass der Data Engineer wird, lohnt eine Bestandsaufnahme der ETL-/ELT-Strecke. Compliance früh mitdenken: Wer in Banking, Insurance, Healthcare oder Recruiting pilotiert, sollte die EU-AI-Act-Anforderungen für Annex-III-Anwendungen in das Pilot-Briefing aufnehmen, auch wenn die Frist erst Ende 2027 wirkt. Vendor-Strategie klären: Wer SAP-Bestandskunde ist, wartet auf die RPT-1-Joule-Integration; wer nicht, kann den Open-Source-Pfad direkt einschlagen.

Für CEOs, PMs und Tech Leads bedeutet die Lage einen klaren Imperativ — wer 2026 keinen TFM-Pilot zumindest bewertet, verschenkt absehbar Margen, weil der Wettbewerber bereits in Sekunden Antworten zieht, für die das eigene Team noch Wochen-Sprints einplant. SAP hat heute mit der Prior-Labs-Übernahme das laute Signal gesetzt. Die leise zweite KI-Revolution ist in der Enterprise-Realität angekommen.

Quellen