Runway показал Aleph 2.0 — обновлённую video editing model внутри нового Edit Studio. Модель редактирует выбранный keyframe из таймлайна, показывает preview, а затем использует этот вариант как визуальный ориентир для обработки всего видео. Это ближе к контролируемому AI-композитингу, чем к обычному video-to-video.
В Edit Studio можно работать не только текстовым промптом: к кадру добавляются reference image и настройки для персонажа, продукта, объекта или стиля. Для keyframe edit указаны Nano Banana Pro, GPT Image 2 и Gen-4 Image. Aleph 2.0 поддерживает видео до 30 секунд: входной ролик должен быть длиннее 2 секунд и короче 30 секунд, а всё, что больше, автоматически обрезается. Это заметное отличие от старого Aleph, где один прогон был ограничен 5 секундами.
Модель позволяет менять персонажей, продукты, объекты, фон, одежду, погоду, свет, стиль, VFX и удалять лишние элементы в кадре. Официального бенчмарка Runway Aleph 2.0 против Google Omni пока нет, поэтому сравнение остаётся осторожным: оба инструмента целятся в одну боль — правку отдельной детали в уже созданном видео без полного пересбора клипа.
#ai #aivideo #generativeai #Runway #Aleph2 #EditStudio #videotoVideo #AIediting #keyframe #Gen4Image #NanoBananaPro #GPTImage2 #GoogleOmni
Google обновила Flow: теперь это не просто генератор, а рабочая AI-студия для идей, визуалов, видео, правок и финальных ассетов. Логика в том, чтобы не переключаться между Gemini, Veo, Nano Banana, редактором изображений и папками с референсами, а собирать весь процесс в одном пространстве.
Flow Agent помогает с брейнштормом, сценарными развилками, вариациями сцен и batch-редактированием, а также собирает ассеты в коллекции и переименовывает их. Через Flow Tools можно создавать собственные инструменты на natural language: ресайзер видео, шейдеры, image editor, storyboard studio, text overlay или пост-процессы. У Flow также появилась подписная лестница: free tier с 50 ежедневными кредитами, Google AI Plus за $7.99, Pro за $19.99 и две ступени Ultra за $99.99 и $199.99. В Plus и выше включаются Omni Flash, video-to-video editing, avatars и creation-режим для Tools.
Обновление двигает Google Flow в сторону AI-продакшн-студии: не единичная генерация, а проектная папка, агентный ассистент, кастомные инструменты и credit-based production model. Похожую логику с AI-агентом недавно внедрял Higgsfield, а Google теперь собирает её внутри собственной экосистемы.
#ai #aivideo #generativeai #Google #GoogleFlow #Gemini #Veo #NanoBanana #OmniFlash #FlowAgent #FlowTools #AIstudio #videotoVideo #Higgsfield
Google показала Pics — AI-инструмент для создания и редактирования изображений внутри Workspace. По задумке это ответ Canva, но не отдельный сервис, а часть рабочей экосистемы Google: визуалы можно править там, где они уже используются, включая Slides и Drive.
Pics работает на Nano Banana 2 и Gemini. Главная функция — точечное редактирование объектов внутри изображения: можно выбрать свитер и поменять цвет, убрать фон, сдвинуть предмет, изменить размер, поправить заголовок или перевести текст на другой язык. Отдельный акцент сделан на работе с текстом в картинке: обложки, баннеры и слайды можно адаптировать под другой рынок с сохранением визуальной логики.
В Pics также заявлена совместная работа в стиле Google Docs: несколько человек могут редактировать один визуал, оставлять правки и доводить изображение до финала внутри Workspace. Пока инструмент доступен только тестерам. Летом Google обещает открыть Pics для подписчиков Google AI Pro и Ultra, а для бизнес-аккаунтов Workspace — в превью. Отдельные цены пока не объявлены.
#ai #generativeai #Google #GooglePics #Gemini #NanoBanana2 #Workspace #Canva #imageediting #GoogleSlides #GoogleDrive
Hakam Kiki стал заметным AI-креатором благодаря роликам, где встраивает себя в культовые сцены из фильмов, сериалов и спорта. Он базируется в Кувейте и чаще всего работает не просто с появлением в кадре, а с переписыванием известных сюжетных моментов: например, в Game of Thrones ловит Брана Старка до падения с башни, спасает Неда Старка от казни и вмешивается в сцену с Оберином Мартеллом и Грегором Клиганом. Механика работает за счёт уже знакомого зрителю контекста: аудитория помнит сцену и эмоциональную реакцию на неё, а Kiki с помощью AI показывает альтернативный исход. По словам автора сценария, ролики на его аккаунтах набирают десятки миллионов просмотров, а перезаливы на других площадках — до сотен миллионов. Через ссылки в профиле он также продаёт курс за $125 ; ранее у него была страница с прайсом на коммерческую AI-рекламу, где ролики на 15–30 секунд стоили около $5 000 , но на момент записи она была отключена.
#ai #aivideo #generativeai #HakamKiki #AIcreator #GameOfThrones #deepfake #fanedit #contentcreation #personalbrand
В HeyGen для Avatar V появилась функция Custom Motion: теперь аватаром можно управлять точнее — задавать эмоции, жесты и направление взгляда в нужных текстовых блоках. Настройки находятся в AI Studio: нужно выбрать Motion Engine, поставить Avatar V и открыть параметры движения. Custom Motion делится на три группы. Expression отвечает за подачу: Calm даёт спокойный тон, Enthusiastic добавляет больше энергии. Gesture управляет жестами — например, Wave, Shrug, Point или Hand on heart. Gaze задаёт взгляд: Looking ahead оставляет нейтральное направление, а Looking at camera создаёт прямой контакт со зрителем. Эти параметры можно комбинировать в один motion-пресет, но результат лучше проверять вручную, потому что не все сочетания выглядят естественно в кадре. Avatar V остаётся платной функцией: для него нужны Premium-токены поверх ежемесячной подписки. Но с Custom Motion аватар становится не просто говорящей головой, а более управляемым цифровым ведущим для объяснений, новостей, промо и коротких видео.
#ai #aivideo #generativeai #HeyGen #AvatarV #CustomMotion #AIStudio #digitalavatar #aipresenter #shorts #reels #tiktok #contentcreation
ElevenLabs запустила Templates внутри ElevenCreative. Это готовые креативные пайплайны: пользователь выбирает шаблон, загружает входной файл, нажимает Run и получает ассет по одной и той же логике без ручной настройки всех шагов заново.
Шаблоны можно создавать самостоятельно через Create Template в Flows. Это нодовый редактор, где собирается цепочка из входного файла, текстового ввода, LLM, генерации изображения и финального результата. В примере показан шаблон для локализации YouTube-обложек: пользователь загружает thumbnail, указывает язык, а LLM пишет промпт для Edit Image, чтобы перевести текст на обложке и не менять названия ElevenLabs и ElevenCreative.
Такой шаблон можно сохранить и запускать повторно с новыми файлами и языками. По описанию, ElevenLabs развивает ElevenCreative как систему для производства контента, где в одной логике объединяются голос, изображения, видео, музыка, звуковые эффекты и шаблоны.
#ai #generativeai #ElevenLabs #ElevenCreative #templates #LLM #imagegeneration #contentcreation #creativeworkflow #aicontent #youtube #thumbnail #localization
Видео собрарано через связку из трёх AI-сервисов: одна модель пишет промпты, вторая генерирует изображения, а третья превращает всё это в полноценную сцену с анимацией и атмосферным аудио. В примере используется Syntx: сначала в разделе “Текст” через Claude загружается лицо персонажа и несколько референсов, после чего нейросеть получает задачу подготовить промпт именно под анимацию в Seedance 2.0. Автор рекомендует использовать отдельный системный промпт для более точной структуры сцен и движения камеры.
Дальше в разделе “Дизайн” используется GPT Image 2, куда загружаются те же референсы и готовые промпты. На выходе получаются изображения персонажа уже в историческом сеттинге. После этого из всех кадров собирается единый storyboard с разбивкой сцен и таймингом примерно на 15 секунд. Финальный этап — генерация видео через Seedance 2.0: туда загружается storyboard, вставляется промпт для анимации, а через @ указывается привязка действий к конкретным изображениям. Видео можно сразу делать с атмосферным аудио, а затем при необходимости переводить через HeyGen или Sync. По сравнению с Google Omni, Seedance в таких сценах показал более стабильный результат и уже выглядит как рабочий инструмент для production-контента.
#ai #aivideo #generativeai #SyntxAI #Claude #GPTImage2 #Seedance2 #HeyGen #AIvideo #storyboard #videogeneration #historicalai #AIcreator
Chloe VS History — AI-канал с историческими видео в формате влога от лица девушки, которая будто путешествует во времени. Вместо коротких роликов здесь выходят длинные видео на 12–14 минут: с сюжетом, образом персонажа, юмором и погружением в исторический контекст.
Самый заметный пример — ролик про Titanic: Chloe попадает в 1912 год, ходит по кораблю, комментирует быт и детали эпохи не как диктор, а как блогер внутри события. По сценарию, видео собрало около 2 млн просмотров, а у канала больше 200 тыс. подписчиков. На странице в Instagram также указана студия Utopia, поэтому за проектом может стоять команда, а не один автор. Оценка дохода в районе $75 тыс. в месяц по VidIQ требует проверки.
#ai #aivideo #generativeai #ChloeVSHistory #YouTube #AIcreator #history #Titanic #AIvideo #VidIQ #Utopia
Google показала Gemini Omni Flash — новую видеомодель внутри Gemini, которая умеет генерировать и редактировать ролики из текста, изображений, видео и части аудио-входов. Главная ставка сделана на multi-turn editing: сцену можно менять поэтапно через диалог, не пересобирая клип с нуля. Google отдельно продвигает world understanding — модель должна лучше держать физику, причинно-следственные связи и контекст по сравнению с обычными video models. В Gemini доступны 10-секундные ролики, работа с несколькими фото-референсами, вертикальный и горизонтальный формат, а также AI avatar. Все видео получают SynthID-водяной знак.
На практике тесты пока выглядят слабее презентации. Да, генерация быстрая, а сам диалоговый формат редактирования удобный, но стабильность персонажей остаётся проблемой: даже с загруженным референсом лицо заметно меняется от сцены к сцене. В тесте с генерацией сцены про Петра I модель не удержала образ и выдала типичный “нейрослоп” вместо цельного ролика. Тайминг сцен вручную не настраивается — паузы, движение камеры и смены действий приходится описывать текстом. Озвучка речи персонажей в тестах также не проявилась. Бесплатный доступ заявлен на ограниченный период с небольшим лимитом генераций, после чего требуется подписка Gemini.
#ai #aivideo #generativeai #Google #Gemini #GeminiOmni #OmniFlash #SynthID #AIvideo #multiturnediting #GoogleAI #videogeneration #AIavatar
В сети появились ролики, в которых якобы показана новая видеомодель Google — Gemini Omni. По утечке, модель генерирует не просто красивый кадр, а сцену с виртуальным профессором: он двигается у доски, пишет формулы, объясняет тригонометрию по шагам и сохраняет логику рассуждения внутри видео.
Главное отличие от обычных text-to-video моделей — попытка удерживать последовательность действий: контекст сцены, речь, движения рук и уже написанный текст на доске. Сейчас у многих видеомоделей с этим остаются проблемы: персонажи теряют логику, надписи и формулы искажаются, а действия ломаются через несколько секунд. Судя по опубликованным демо, Gemini Omni может быть встроена прямо в Gemini, а не запускаться как отдельный видеоредактор по модели Runway или Kling.
#ai #aivideo #generativeai #Google #Gemini #GeminiOmni #texttovideo #videogeneration #edtech #AIteacher #Runway #Kling
Gracia показала стриминг 4D Gaussian Splatting прямо в браузере: объёмные записи людей можно открывать по ссылке без отдельного приложения и загрузки файлов. По словам команды, формат работает как онлайн-видео, но вместо плоской картинки показывает человека в 3D, которого можно рассматривать с разных сторон.
В примере Gracia базовый поток составляет 75 Мбит/с и 120 тысяч сплатов на кадр, после сжатия — около 17 Мбит/с. Заявлена работа на Apple Vision Pro, смартфонах и ноутбуках, а также отсутствие ограничений по длине ролика. Отдельно команда показала автоматическое удаление фона: система сама отделяет человека от студийного пола и стен, чтобы его можно было вставлять в другие сцены.
#ai #aivideo #generativeai #Gracia #4DGaussianSplatting #GaussianSplatting #volumetricvideo #webxr #AppleVisionPro #3Dvideo #spatialvideo
Ponder показал AI-монтажку для работы с сырым видео: интервью, влогами, talking head и длинными записями с дублями. Сервис разбирает материал по смыслу, ищет удачные тейки, эмоции, затянутые паузы и места, где может понадобиться B-roll, а затем собирает монтаж в агентском режиме.
Редактирование происходит текстовыми командами: можно попросить ускорить темп, оставить больше напряжения или добавить эмоциональные реакции, и таймлайн перестраивается автоматически. По словам авторов, Ponder анализирует не только тишину, но и композицию кадра, движение камеры, интонацию и «человеческие моменты». Экспорт заявлен в Premiere, DaVinci и Final Cut.
#ai #aivideo #generativeai #Ponder #PonderAI #AIediting #videoediting #YouTube #PremierePro #DaVinciResolve #FinalCutPro #CapCut
Higgsfield выпустил Virality Predictor — бета-инструмент для оценки коротких роликов перед публикацией. Сервис принимает видео до 15 секунд и рассчитывает Viral Potential, Hook Score и Hold Rate, а также показывает тепловую карту реакции зрителя: где ролик может удержать внимание, а где есть риск свайпа.
В тесте автор загрузил ролик, сделанный через Add to Reference в Higgsfield, и получил 45 баллов из 100. Для сравнения был загружен вирусный ролик с YouTube с примерно 290 миллионами просмотров, и Virality Predictor оценил его ниже — в 41 балл. Поэтому инструмент может быть полезен как подсказка по слабым местам, но одну итоговую оценку пока рано воспринимать как точный прогноз вирусности.
#ai #aivideo #generativeai #Higgsfield #HiggsfieldAI #ViralityPredictor #viralvideo #HookScore #HoldRate #Reels #Shorts #TikTok
Higgsfield добавил Ad Reference — функцию в Marketing Studio для генерации рекламы по видеореференсу. Пользователь загружает ролик через Add Reference, добавляет свой продукт и аватара, после чего сервис анализирует структуру видео: кадры, темп, движение, появление товара и поведение человека в сцене.
Инструмент не делает копию один в один: фоны, текстуры и ракурсы могут отличаться. По описанию автора, Ad Reference скорее вытаскивает рекламный каркас — подачу продукта, акценты, смену сцен и визуальные крючки. Сгенерированный промпт можно редактировать вручную; в тесте нестандартная сцена была понята сервисом, но результат получился спорным. Одна генерация обошлась автору в 75 токенов, а сама функция, предположительно, работает на базе Seedance.
#ai #aivideo #generativeai #Higgsfield #HiggsfieldAI #AdReference #MarketingStudio #AIads #videoads #Seedance #AIavatar #productvideo
Музыкальные AI-клипы стали отдельной нишей внутри AI-видео: это уже не реклама и не короткометражки, а формат с собственными задачами. Разбираем как собрать клип с цифровым аватаром, чтобы он пел заданным голосом, попадал в липсинг, работал на нужном языке, включая русский, и сочетался с управляемыми фонами.
В разборе Kling AI, Seedance и HeyGen с аватаром пятого поколения. Отдельно стоит отметить LTX: там можно получить хорошие кадры, но часто приходится запускать процесс локально, а рендер отдельных сцен остаётся долгим даже на мощном MacBook. В качестве альтернативы есть Dreamina Omnihuman: там лучше управляется камера при пении аватара с липсингом, но картинка местами выглядит пластиковой. Главная проблема ниши пока не решена: нет универсальной связки, которая без сложной настройки закрывает голос, липсинг, камеру, язык и качество изображения.
#ai #aivideo #generativeai #AIclips #musicvideo #KlingAI #Seedance #HeyGen #LTX #Dreamina #Omnihuman #lipsync #AIavatar
В новом тесте собираю исторический ролик через связку Syntx, Claude, GPT Image 2 и HeyGen Shot. Сначала в Syntx создаётся короткий сценарий на историческую тему, затем в GPT Image 2 генерируются кадры про взятие Казани Иваном Грозным и сториборд для будущего видео. После этого сториборд загружается в HeyGen Shot с аватаром и режимом Seedance 2.
Результат оказался нестабильным: после нескольких попыток видео всё равно выглядело как «нейрослоп», а качественный стартовый кадр заметно терял детализацию в процессе генерации. Думаю, HeyGen может использовать fast-версию Seedance 2, а не Pro. В Syntx же версию модели можно выбрать вручную: быстрее и дешевле через Fast или дольше и качественнее через Pro. Для исторических роликов с аватаром HeyGen Shot пока выглядит спорным вариантом.
#ai #aivideo #generativeai #HeyGen #HeyGenShot #SyntxAI #Claude #GPTImage2 #Seedance #Seedance2 #AIavatar #historicalvideo #storyboard
Krea AI представила K2 - новую модель для генерации изображений. По словам компании, это их первая базовая модель, собранная с нуля, а не надстройка над существующим генератором. Акцент сделан не на привычный AI-глянец с «идеальными» лицами, а на более выразительный визуальный язык: стилизацию, эстетику, абстракцию и сюрреализм. По ощущениям K2 ближе к инструментам, где важен не только реализм, но и собственный художественный почерк.
Ключевая функция K2 - Moodboards. Пользователь загружает 10-15 референсов, после чего модель генерирует изображения в близкой стилистике без отдельного обучения и долгой настройки LoRA. Это можно использовать как быстрый способ протестировать визуальное направление, сохранить удачный стиль и затем перенести его в другие генерации внутри Krea. Отдельно отмечается, что K2 адекватно работает с текстом внутри изображений - для базовой модели это редкость. Судя по позиционированию, Krea AI делает ставку на инструмент для работы со стилем, а не только на «стерильный» фотореализм.
#ии #нейросети #ai #aivideo #generativeai #KreaAI #K2 #imagegeneration #moodboard #visualstyle #midjourney #lora
В Syntx AI можно собрать ролик в формате «я на матче»: сначала сгенерировать реалистичное фото с собой на трибуне, а затем оживить его в видео. Такой формат сейчас часто используют для сторис и репортажных роликов, где человек будто бы находится на спортивном событии — например, на финале Кубка Гагарина между «Ак Барсом» и «Локомотивом».
Процесс начинается в разделе «Дизайн»: в GPT Image 2 загружается своё фото, референс болельщиков нужного клуба и дополнительный объект, например эчпочмак. Можно добавить до 10 изображений, выбрать соотношение сторон, качество и размер, после чего вставить подготовленный промпт. Получившуюся картинку нужно перенести в раздел «Видео», выбрать Seedance 2, HD-разрешение, режим Pro, горизонтальный формат, длительность 15 секунд и включить аудио. Перед генерацией в промпте нужно указать референс через @ в нужном месте по контексту.
Тот же кадр и промпт я дополнительно проверил в Kling 3.0 для сравнения. Seedance лучше сохранил консистентность персонажа на протяжении ролика даже по одной исходной фотографии. На выходе получается видео, где человек выглядит так, будто находится на матче, хотя исходный материал собран полностью через AI.
#ai #aivideo #generativeai #SyntxAI #GPTImage2 #Seedance #Seedance2 #Kling #KlingAI #AIvideo #AIstory #hockey #KHL #GagarinCup
По сети расходятся стоп-моушен-ролики японского дизайнера Tomohiro Okazaki. В них спички, бумага и канцелярские предметы двигаются как живые, собираются в механизмы и превращаются в визуальные конструкции. В сценарии отдельно подчёркивается, что это не AI: движение создаётся вручную, покадрово, через большое количество отдельных кадров.
Okazaki пришёл из графического дизайна, поэтому его ролики выглядят не только как анимация, но и как продуманные системы. По словам автора, интерес к мелким деталям у него появился ещё в детстве: он наблюдал насекомых, камни и природные формы. Сейчас тот же подход переносится на обычные предметы со стола. На фоне потока сгенерированных видео эти работы цепляют именно ощущением ручного труда и точной покадровой сборки.
#stopmotion #TomohiroOkazaki #design #animation #motiondesign #handmade #visualart #creativity #japanesedesign #shortvideo #viralvideo
Runway представила Characters — видеоагента в реальном времени, который создаётся по одной картинке. Референс загружается на вход, после чего персонаж может разговаривать с пользователем без дообучения и сложного сетапа. В сценарии говорится, что система работает на модели GWM-1 и поддерживает разные стили: фотореалистичного человека, мультяшного маскота или фэнтези-персонажа.
На выходе заявлено HD-видео в 24 кадра в секунду с мимикой, движением головы и lip-sync. По данным из сценария, один кадр занимает 37 миллисекунд модельного времени, а первый ответ после реплики пользователя появляется через 1,75 секунды на сервере. Кадры генерируются авторегрессивно и сразу стримятся клиенту: пока следующий кадр считается, предыдущий уже декодируется. Также упоминаются зрение через веб-камеру, шеринг экрана, клонирование голоса, вызов инструментов, подключение к базе знаний по API и интеграция в звонки Zoom или Google Meet.
#ai #aivideo #generativeai #Runway #RunwayCharacters #GWM1 #videoagent #avatar #realtimeai #lipSync #voicecloning #Zoom #GoogleMeet




