Когда использовать этот режим
Image to Video — правильный выбор, когда:
- У вас есть статичное изображение и вы хотите анимировать его с помощью промпта с движением («камера движется вперёд, туман надвигается»).
- Вы хотите управляемый переход между двумя изображениями (начать с общего плана, закончить на крупном плане того же объекта).
Если вы хотите видео, сгенерированное с нуля без исходного кадра, используйте Text to Video . Если вам нужен многоперсонажный или многокомпонентный композит, используйте Reference to Video .
Frame mode: единственный выбор, который вам реально нужно сделать
Когда вы кликаете плитку Image to Video, чуть ниже textarea промптов появляется переключатель Frame mode. Два варианта:
| Вариант | Что означает | Используйте когда |
|---|---|---|
| Start frame | Одно изображение на промпт. Это изображение — первый кадр видео; промпт описывает, что происходит. | Движение — это «и затем…» от одного статичного кадра. |
| Start + End frame | Два изображения на промпт. Первое — начало, второе — конец. Промпт заполняет середину. | Вы хотите управляемый переход между двумя известными состояниями. |
Как библиотека разбивается на части
Это то, что удивляет людей при первом использовании, поэтому стоит сказать прямо.
В режиме Start frame каждый промпт потребляет одно изображение из библиотеки по порядку. Библиотека из 6 изображений с 6 промптами: промпт 1 ↔ изображение 1, промпт 2 ↔ изображение 2, и так далее. Библиотека из 6 изображений с 3 промптами? Используются только первые 3 изображения.
В режиме Start + End frame каждый промпт потребляет два изображения. Библиотека из 6 изображений с 3 промптами: промпт 1 получает изображения 1+2, промпт 2 — 3+4, промпт 3 — 5+6. Библиотека из 6 изображений с 2 промптами использует только изображения 1–4.
Перетащите плитки библиотеки для изменения порядка, чтобы управлять тем, какие изображения идут с каким промптом. Порядок в зоне перетаскивания является порядком назначения.
Настройка запуска
- Нажмите плитку Image to Video.
- В зону перетаскивания Reference image(s) загрузите свои статичные изображения.
- Выберите Frame mode — Start frame или Start + End frame.
- В Prompts напишите по одному промпту на сцену (разделяя пустой строкой). Для Start + End промпт должен описывать переход между двумя кадрами.
- В Refine установите Length (6 с / 10 с), Quality (480p / 720p) и Aspect. Комбинация 480p + апскейл из Text to Video работает здесь так же.
- Нажмите Run →.
Рабочий пример: Start + End
Библиотека по порядку:
01-wideshot.jpg— широкий план пустой площади на рассвете.02-closeup.jpg— крупный план кофейной чашки на столике кафе на той же площади.
Промпты (один промпт, так как у нас один переход):
Slow dolly forward from the empty plaza, light gradually warming, ending on the steam rising from the coffee cup. Continuous take, no cuts.
Запуск. В вашу папку попадает один 10-секундный клип, который начинается с широкого плана и заканчивается на крупном плане, с серединой, заполненной Grok.
Статус каждой строки при выполнении
Список промптов в процессе работы показывает:
- Текст промпта.
- Строку небольших миниатюр используемых изображений (1 в режиме Start frame, 2 в Start + End).
- Статус: queued → generating · N% → done / failed.
Если строка показывает failed с ошибкой no image attached, ваша библиотека содержит меньше изображений, чем нужно промптам — для Start + End это означает меньше 2 × количество промптов.
Chain prompts в Image to Video
Чекбокс Chain prompts доступен и здесь. При включённых цепочках последний кадр выходного видео становится начальным кадром для следующего промпта, независимо от содержимого библиотеки. Это самый чистый способ создать последовательность из 4 сцен из одного начального изображения. Смотрите Chain prompts .