רציתי לבדוק כמה Seedance מצליחה להחזיק קומפוזיציה רב-שכבתית בסצנה אחת קצרה. שפית פיקסר זעירה מנצחת על קישוטים — תותים, עלי זהב, סוכר טווה, קרמל — שעולים באוויר בתנועה הפוכה לכוח-הכבידה, נעים בספירלה מעל עוגת שוקולד שלוש קומות, ונוחתים כל אחד במקומו.
ואז היא מרימה את העוגה ומציבה אותה בחלון ראווה. בחוץ — קהל פיקסרי שלם רואה את העוגה ומגיב. שש שניות פנים, שש שניות חוץ.
כשמבקשים מסצנה אחת לעבור בין wide → medium → overhead → side-tracking, המודל לעיתים קרובות בורא תנועה אחת רציפה במקום שישה shots נפרדים. הוא רוצה flow. אני רציתי קצב מקוטע.
ויש את ה-physics. "reverse gravity" + "swirling tornado" + "each element finds its orbit" + "lands precisely on cake" — הרבה גזירות פיזיקליות במשפט אחד. בלי הוראות מדויקות, הקישוטים נעים בכאוס, לא בכוריאוגרפיה.
פירקתי את הפרומפט ל-שש שורות במבנה זהה: [timestamp] — [shot type]: [action]. כל פריים מסומן בזמן ובסוג shot מפורש. כשהמבנה גרפי כל כך, המודל "רואה" את ה-cuts, לא רק את האקשן.
וב-shots עם physics, המילה "tornado" עשתה הבדל מבני: המודל הבין מיידית שזו מערבולת עם מרכז ופריפריה, לא סתם תנועה סיבובית. "spiral" יצא רכרוכי. "tornado" יצא מובנה.
"overhead bird's-eye shot" = המצלמה במקום אחד מדויק. "a beautiful aerial view" = 50 פירושים אפשריים. ככל שהשפה קולנועית יותר, ה-AI מדויק יותר. זה שיעור שחזר על עצמו אצלי בכל ניסוי שבא אחר כך.
ועוד שיעור — זה הסרטון הראשון שיצא לי ללא post-production. בלי CapCut, בלי trimming, בלי color correction. רק הפלט הגולמי של Seedance. זה הופך את הפרומפט עצמו ל-deliverable: חייבים לדייק את ה-12 שניות בכתיבה, לא בעריכה.
The full prompt.
בואי נדבר על הסיפור שאת רוצה לספר — ונבנה את הסרטון שיזכרו.
Let's talk about the story you want to tell — and build the video they'll remember.