Gemini Omni

В сети появились ролики, в которых якобы показана новая видеомодель Google — Gemini Omni. По утечке, модель генерирует не просто красивый кадр, а сцену с виртуальным профессором: он двигается у доски, пишет формулы, объясняет тригонометрию по шагам и сохраняет логику рассуждения внутри видео. Главное отличие от обычных text-to-video моделей — попытка удерживать последовательность действий: контекст сцены, речь, движения рук и уже написанный текст на доске. Сейчас у многих видеомоделей с этим остаются проблемы: персонажи теряют логику, надписи и формулы искажаются, а действия ломаются через несколько секунд. Судя по опубликованным демо, Gemini Omni может быть встроена прямо в Gemini, а не запускаться как отдельный видеоредактор по модели Runway или Kling. #ai #aivideo #generativeai #Google #Gemini #GeminiOmni #texttovideo #videogeneration #edtech #AIteacher #Runway #Kling

Иконка канала Гари ИИ Аватар
136 подписчиков
12+
28 просмотров
месяц назад
12+
28 просмотров
месяц назад

В сети появились ролики, в которых якобы показана новая видеомодель Google — Gemini Omni. По утечке, модель генерирует не просто красивый кадр, а сцену с виртуальным профессором: он двигается у доски, пишет формулы, объясняет тригонометрию по шагам и сохраняет логику рассуждения внутри видео. Главное отличие от обычных text-to-video моделей — попытка удерживать последовательность действий: контекст сцены, речь, движения рук и уже написанный текст на доске. Сейчас у многих видеомоделей с этим остаются проблемы: персонажи теряют логику, надписи и формулы искажаются, а действия ломаются через несколько секунд. Судя по опубликованным демо, Gemini Omni может быть встроена прямо в Gemini, а не запускаться как отдельный видеоредактор по модели Runway или Kling. #ai #aivideo #generativeai #Google #Gemini #GeminiOmni #texttovideo #videogeneration #edtech #AIteacher #Runway #Kling

, чтобы оставлять комментарии