Gemini Omni
В сети появились ролики, в которых якобы показана новая видеомодель Google — Gemini Omni. По утечке, модель генерирует не просто красивый кадр, а сцену с виртуальным профессором: он двигается у доски, пишет формулы, объясняет тригонометрию по шагам и сохраняет логику рассуждения внутри видео. Главное отличие от обычных text-to-video моделей — попытка удерживать последовательность действий: контекст сцены, речь, движения рук и уже написанный текст на доске. Сейчас у многих видеомоделей с этим остаются проблемы: персонажи теряют логику, надписи и формулы искажаются, а действия ломаются через несколько секунд. Судя по опубликованным демо, Gemini Omni может быть встроена прямо в Gemini, а не запускаться как отдельный видеоредактор по модели Runway или Kling. #ai #aivideo #generativeai #Google #Gemini #GeminiOmni #texttovideo #videogeneration #edtech #AIteacher #Runway #Kling
В сети появились ролики, в которых якобы показана новая видеомодель Google — Gemini Omni. По утечке, модель генерирует не просто красивый кадр, а сцену с виртуальным профессором: он двигается у доски, пишет формулы, объясняет тригонометрию по шагам и сохраняет логику рассуждения внутри видео. Главное отличие от обычных text-to-video моделей — попытка удерживать последовательность действий: контекст сцены, речь, движения рук и уже написанный текст на доске. Сейчас у многих видеомоделей с этим остаются проблемы: персонажи теряют логику, надписи и формулы искажаются, а действия ломаются через несколько секунд. Судя по опубликованным демо, Gemini Omni может быть встроена прямо в Gemini, а не запускаться как отдельный видеоредактор по модели Runway или Kling. #ai #aivideo #generativeai #Google #Gemini #GeminiOmni #texttovideo #videogeneration #edtech #AIteacher #Runway #Kling




