Grok Automation
06 · 模式 · 4 分钟阅读

图生视频

帧模式是这里唯一需要理解的新概念。其余工作流与图生图完全相同。

何时使用此模式

图生视频是以下情况的正确选择:

  • 您有一张静态图像,想用运动提示词为其添加动效(“摄像机向前推进,薄雾滚滚而来”)。
  • 您想要两张图像之间的受控转场(从广角镜头开始,结束在同一主体的特写)。

如果您想从零开始生成视频,不需要源帧,请使用文字生视频 。如果您想要多角色/多元素合成,请使用素材生视频

帧模式:唯一真正需要做的选择

点击图生视频模式磁贴时,提示词文本区域正下方会出现帧模式选择器。两个选项:

选项含义适用场景
起始帧每条提示词对应一张图像。该图像是视频的第一帧;提示词描述接下来发生的事情。从一张静态图像"继续发展"的运动。
起始帧+结束帧每条提示词对应两张图像。第一张是起点,第二张是终点。提示词填充中间过程。您想要在两个已知状态之间做受控转场时。
Screenshot pending 帧模式选择器,显示起始帧和起始帧+结束帧两个选项
起始帧每条提示词使用一张图像。起始帧+结束帧使用两张。选择器决定队列如何分配您的图像库。

图像库的分配方式

这是第一次使用时最容易出乎意料的部分,所以值得说清楚。

在起始帧模式中,每条提示词按顺序消耗图像库中的一张图像。6 张图像 + 6 条提示词 = 提示词 1 ↔ 图像 1,提示词 2 ↔ 图像 2,以此类推。6 张图像 + 3 条提示词?只使用前 3 张图像。

在起始帧+结束帧模式中,每条提示词消耗两张图像。6 张图像 + 3 条提示词 = 提示词 1 获取图像 1+2,提示词 2 获取图像 3+4,提示词 3 获取图像 5+6。6 张图像 + 2 条提示词只使用图像 1–4。

拖拽重新排列图像库磁贴,控制哪张图像对应哪条提示词。拖放区中的顺序即是分配顺序。

设置运行

  1. 点击图生视频磁贴。
  2. 参考图像拖放区上传您的静态图像。
  3. 选择帧模式 —— 起始帧起始帧+结束帧
  4. 提示词中,每个镜头写一条提示词(用空行分隔)。对于起始帧+结束帧,提示词应描述两帧之间的过程
  5. 精炼中设置时长(6 秒/10 秒)、画质(480p/720p)和宽高比文字生视频 中的 480p + 超分组合同样适用。
  6. 点击 Run →

实战示例:起始帧+结束帧

图像库,按顺序:

  1. 01-wideshot.jpg —— 黎明时分空旷广场的广角镜头。
  2. 02-closeup.jpg —— 同一广场咖啡馆桌上咖啡杯的特写。

提示词(只有一条,因为只有一个转场):

Slow dolly forward from the empty plaza, light gradually warming, ending on the steam rising from the coffee cup. Continuous take, no cuts.

运行。一个 10 秒的片段落入您的文件夹,从广角镜头开始,结束在特写,中间过程由 Grok 填充。

运行时每行的状态

提示词列表运行中显示:

  • 提示词文字。
  • 所用图像的小缩略图行(起始帧模式 1 张,起始帧+结束帧 2 张)。
  • 状态:排队中生成中 · N%完成 / 失败

如果某行显示 failed 并带有 no image attached 错误,说明您的图像库图像数量少于提示词所需 —— 对于起始帧+结束帧,意味着少于 2 × 提示词数量

图生视频中的链式提示词

这里同样有链式提示词复选框。开启链式后,输出视频的最后一帧成为下一条提示词的起始帧,无论图像库中有什么。这是从单张起始图像构建 4 个镜头序列的最简洁方式。参见链式提示词


Grok Automation 是面向 Grok 用户的独立浏览器扩展,与 xAI 无关。