Gemma 4: Googles bestes offenes Modell kommt unter Apache-Lizenz — und läuft auf dem Smartphone
Die Gemma-4-Familie umfasst vier Modellgrößen: zwei kompakte Edge-Modelle (E2B und E4B) für Smartphones und eingebettete Geräte, ein 26B-Mixture-of-Experts-Modell (MoE) mit 128 Experten und nur 3,8 Milliarden aktiven Parametern pro Token, sowie ein dichtes 31B-Flaggschiff. Alle Modelle sind nativ multimodal und verarbeiten Text, Bilder und Audio.
Die Leistungssprünge gegenüber Gemma 3 sind bemerkenswert: Im AIME-2026-Mathematik-Benchmark steigt die Genauigkeit von 20,8 auf 89,2 Prozent. Die Codeforces-ELO klettert von 110 auf 2150. Im BigBench Extra Hard springt die Leistung von 19 auf 74 Prozent. Das 31B-Modell erreicht 85,2 Prozent im MMLU-Pro-Benchmark und übertrifft damit Alibabas Qwen 3.5 27B. Im Arena-AI-Leaderboard für offene Modelle belegt es Platz 3.
Der strategisch wichtigste Schritt ist jedoch der Lizenzwechsel: Gemma 4 steht unter Apache 2.0 — der permissivsten gängigen Open-Source-Lizenz. Keine Nutzungsbeschränkungen, keine MAU-Limits, volle kommerzielle Freiheit. VentureBeat kommentiert, dieser Wechsel sei möglicherweise bedeutsamer als die Benchmark-Ergebnisse selbst. Für Unternehmen, die offene Modelle in Produkte integrieren wollen, fallen damit die letzten rechtlichen Hürden.
Für On-Device-KI setzen die E2B- und E4B-Varianten neue Maßstäbe: Sie laufen auf Smartphones, NVIDIA Jetson Orin Nano und Raspberry Pi — vollständig offline. NVIDIA stellt NVFP4-quantisierte Checkpoints für Blackwell-GPUs bereit. Qualcomm und MediaTek arbeiten an optimierter mobiler Unterstützung. vLLM, Ollama, llama.cpp und Unsloth bieten Day-0-Support. Google hat zudem ein Android-AICore-Developer-Preview für agentenbasierte Workflows auf dem Gerät veröffentlicht. Über 400 Millionen Downloads zählt die Gemma-Familie bereits, mit über 100.000 Community-Varianten auf Hugging Face.