Gemini Omni: Googles multimodales Modell verarbeitet alles rein und raus
- Modell: Gemini Omni (Anything-to-Anything)
- Modalitäten: Text, Bild, Audio, Video - Input und Output kombinierbar
- Verfügbarkeit: Aktuell in ausgewählten Previews, breiter Rollout über Google AI Search geplant
- Integration: Google Search AI Overviews, Google Ads-System
- Preis: Kostenlos über Google-Produkte, API-Pricing noch nicht vollständig kommuniziert
Was Gemini Omni technisch kann
Gemini Omni arbeitet als sogenanntes Anything-to-Anything-Modell: Du kannst beliebige Kombinationen aus Text, Bild, Audio und Video als Input liefern, und das Modell generiert entsprechend gemischte Outputs. Das unterscheidet es von spezialisierten Modellen wie Stable Diffusion (Bild) oder Whisper (Audio), die jeweils nur eine Modalität bedienen. Ausserdem übernimmt das Modell Komposition, Beleuchtungsanpassung und Bewegungsintegration selbst.
Für Entwickler und Power-User bedeutet das einen deutlich kompakteren Workflow, weil keine Kette aus spezialisierten Modellen mehr nötig ist. Wie hoch der Inferenz-Aufwand und die Latenz bei komplexen Multimodal-Tasks in der Praxis liegen, hat Google bislang nicht mit konkreten Zahlen belegt.
Einordnung: KI-Suche, Ads und der Rest des Ökosystems
Gemini Omni ist nicht isoliert zu betrachten. Google baut das Modell direkt in seine Suchergebnisse ein und führt gleichzeitig neue Anzeigenformate ein - darunter Conversational Discovery und Highlighted Answers, die Werbung nahtlos in KI-generierte Antworten integrieren.
Google erklärt, dass Anzeigen in AI-generierten Suchantworten kontextuell platziert werden und sich am Gesprächsverlauf orientieren - nicht mehr nur an Keywords.
Das ist relevant für jeden, der Google-Dienste in Workflows oder Toolchains einbindet. Die bisherige Trennung zwischen organischen Suchergebnissen und Werbung wird weiter aufgeweicht, was die Qualität der Outputs bei kommerziellen Suchanfragen potenziell beeinflusst.
Alternativen wie Perplexity, Kagi oder Brave Search gewinnen dadurch an Relevanz, auch wenn keiner davon ein vergleichbares multimodales Modell im Backend betreibt.
Parallel läuft Googles Kartellrechtsberufung gegen das US-Urteil, das den Konzern als illegales Suchmonopol eingestuft hatte. Google argumentiert, den Markt fair und im Wettbewerb gewonnen zu haben - das Verfahren dürfte die mittel- bis langfristige Produktstrategie beeinflussen.
Quelle(n)