Image to Video | Grok Automation

इस मोड का उपयोग कब करें

Image to Video सही विकल्प है जब:

आपके पास एक still image है और आप उसे motion prompt के साथ animate करना चाहते हैं (“camera dolly forward, mist rolling in”)।
आप दो इमेज के बीच नियंत्रित transition चाहते हैं (एक wide shot में शुरू, same subject के close-up पर खत्म)।

अगर आप बिना किसी source frame के scratch से वीडियो जनरेट करना चाहते हैं, Text to Video उपयोग करें। अगर आप multi-character / multi-component composite चाहते हैं, Reference to Video उपयोग करें।

Frame मोड: एकमात्र choice जो आपको वास्तव में करनी है

जब आप Image to Video मोड टाइल क्लिक करते हैं, प्रॉम्प्ट textarea के ठीक नीचे एक Frame mode picker दिखता है। दो विकल्प:

विकल्प	इसका अर्थ	कब उपयोग करें
Start frame	प्रति प्रॉम्प्ट एक इमेज। वह इमेज वीडियो का पहला frame है; prompt describe करता है क्या होता है।	मोशन एक single still से “और फिर…” है।
Start + End frame	प्रति प्रॉम्प्ट दो इमेज। पहली start है, दूसरी end है। Prompt बीच में भरता है।	आप दो ज्ञात states के बीच नियंत्रित transition चाहते हैं।

Screenshot pending Frame mode picker जिसमें Start frame और Start + End frame विकल्प हैं

Start frame एक प्रॉम्प्ट प्रति इमेज उपयोग करता है। Start + End दो उपयोग करता है। Picker तय करता है कि queue आपकी library को कैसे chunk करती है।

Library कैसे chunked होती है

यह वह चीज़ है जो पहले उपयोग पर लोगों को आश्चर्यचकित करती है, इसलिए इसे स्पष्ट रूप से कहना उचित है।

Start frame मोड में, प्रत्येक prompt library से एक इमेज क्रम में consume करता है। 6 prompts के साथ 6 इमेज की library का मतलब है prompt 1 ↔ image 1, prompt 2 ↔ image 2, और इसी तरह। 3 prompts के साथ 6 इमेज की library? केवल पहले 3 इमेज उपयोग होती हैं।

Start + End frame मोड में, प्रत्येक prompt दो इमेज consume करता है। 3 prompts के साथ 6 इमेज की library का मतलब है prompt 1 को images 1+2 मिलती हैं, prompt 2 को 3+4, prompt 3 को 5+6। 2 prompts के साथ 6 इमेज की library केवल images 1–4 उपयोग करती है।

Library tiles को drag-reorder करें यह नियंत्रित करने के लिए कि कौनसी इमेज किस prompt के साथ जाती है। dropzone में क्रम ही assignment क्रम है।

एक रन सेट करें

Image to Video tile क्लिक करें।
Reference image(s) dropzone में, अपनी stills upload करें।
Frame mode चुनें — Start frame या Start + End frame।
Prompts में, प्रति शॉट एक प्रॉम्प्ट लिखें (blank-line separated)। Start + End के लिए, prompt को दो frames के बीच journey describe करना चाहिए।
Refine में, Length (6s / 10s), Quality (480p / 720p), और Aspect सेट करें। Text to Video से 480p + upscale combination यहाँ भी उसी तरह काम करता है।
Run → क्लिक करें।

एक काम का उदाहरण: Start + End

Library, क्रम में:

01-wideshot.jpg — भोर में एक खाली plaza का wide shot।
02-closeup.jpg — उसी plaza में एक café table पर coffee cup का close-up।

Prompts (single prompt क्योंकि हमारे पास एक transition है):

Slow dolly forward from the empty plaza, light gradually warming, ending on the steam rising from the coffee cup. Continuous take, no cuts.

Run। आपके फोल्डर में एक 10-second clip जाती है जो wide shot से शुरू होती है और close-up पर खत्म होती है, बीच में Grok द्वारा भरी जाती है।

रन करते समय per-row status

Mid-run prompt list दिखाता है:

Prompt text।
उपयोग की जा रही image(s) के छोटे thumbnails की एक row (Start frame मोड में 1, Start + End में 2)।
Status: queued → generating · N% → done / failed।

अगर कोई row no image attached error के साथ failed कहती है, तो आपकी library में prompts की ज़रूरत से कम इमेज हैं — Start + End के लिए इसका मतलब 2 × prompt count से कम है।

Image to Video पर Chain prompts

Chain prompts checkbox यहाँ भी उपलब्ध है। chain चालू होने पर, output video का आखिरी frame library में जो है उससे स्वतंत्र, अगले prompt का start frame बन जाता है। यह एक single starting still से 4-shot sequence बनाने का सबसे साफ तरीका है। Chain prompts देखें।