何时使用此模式
图生视频是以下情况的正确选择:
- 您有一张静态图像,想用运动提示词为其添加动效(“摄像机向前推进,薄雾滚滚而来”)。
- 您想要两张图像之间的受控转场(从广角镜头开始,结束在同一主体的特写)。
如果您想从零开始生成视频,不需要源帧,请使用文字生视频 。如果您想要多角色/多元素合成,请使用素材生视频 。
帧模式:唯一真正需要做的选择
点击图生视频模式磁贴时,提示词文本区域正下方会出现帧模式选择器。两个选项:
| 选项 | 含义 | 适用场景 |
|---|---|---|
| 起始帧 | 每条提示词对应一张图像。该图像是视频的第一帧;提示词描述接下来发生的事情。 | 从一张静态图像"继续发展"的运动。 |
| 起始帧+结束帧 | 每条提示词对应两张图像。第一张是起点,第二张是终点。提示词填充中间过程。 | 您想要在两个已知状态之间做受控转场时。 |
Screenshot pending
帧模式选择器,显示起始帧和起始帧+结束帧两个选项
图像库的分配方式
这是第一次使用时最容易出乎意料的部分,所以值得说清楚。
在起始帧模式中,每条提示词按顺序消耗图像库中的一张图像。6 张图像 + 6 条提示词 = 提示词 1 ↔ 图像 1,提示词 2 ↔ 图像 2,以此类推。6 张图像 + 3 条提示词?只使用前 3 张图像。
在起始帧+结束帧模式中,每条提示词消耗两张图像。6 张图像 + 3 条提示词 = 提示词 1 获取图像 1+2,提示词 2 获取图像 3+4,提示词 3 获取图像 5+6。6 张图像 + 2 条提示词只使用图像 1–4。
拖拽重新排列图像库磁贴,控制哪张图像对应哪条提示词。拖放区中的顺序即是分配顺序。
设置运行
- 点击图生视频磁贴。
- 在参考图像拖放区上传您的静态图像。
- 选择帧模式 —— 起始帧或起始帧+结束帧。
- 在提示词中,每个镜头写一条提示词(用空行分隔)。对于起始帧+结束帧,提示词应描述两帧之间的过程。
- 在精炼中设置时长(6 秒/10 秒)、画质(480p/720p)和宽高比。文字生视频 中的 480p + 超分组合同样适用。
- 点击 Run →。
实战示例:起始帧+结束帧
图像库,按顺序:
01-wideshot.jpg—— 黎明时分空旷广场的广角镜头。02-closeup.jpg—— 同一广场咖啡馆桌上咖啡杯的特写。
提示词(只有一条,因为只有一个转场):
Slow dolly forward from the empty plaza, light gradually warming, ending on the steam rising from the coffee cup. Continuous take, no cuts.
运行。一个 10 秒的片段落入您的文件夹,从广角镜头开始,结束在特写,中间过程由 Grok 填充。
运行时每行的状态
提示词列表运行中显示:
- 提示词文字。
- 所用图像的小缩略图行(起始帧模式 1 张,起始帧+结束帧 2 张)。
- 状态:排队中 → 生成中 · N% → 完成 / 失败。
如果某行显示 failed 并带有 no image attached 错误,说明您的图像库图像数量少于提示词所需 —— 对于起始帧+结束帧,意味着少于 2 × 提示词数量。
图生视频中的链式提示词
这里同样有链式提示词复选框。开启链式后,输出视频的最后一帧成为下一条提示词的起始帧,无论图像库中有什么。这是从单张起始图像构建 4 个镜头序列的最简洁方式。参见链式提示词 。