הפרק עוסק במהפכה הגדולה שהקדימה את זמנה, הבינה המלאכותית, וספציפית בתחום הווידיאו. השבוע נחשפנו לאבן דרך נוספת בהתקדמות של הבינה המלאכותית, כאשר חברת OpenAI חשפה את סורה (Sora), מודל יצירת הווידיאו מטקסט שלה. הסרטונים שהוצגו מהמודל מרשימים ביותר. בשורה אחת של פרומט, ניתן לחסוך סכומי עתק שמושקעים בתהליכי עריכה והפקה.

רק לפני כמה שבועות, ראינו וידיאו שנוצר על ידי המנוע Runaway, אם כי הוא נראה הרבה פחות טוב מהתוצר של סורה. מיד לאחר מכן גוגל חשפה את לומייר (Lumiere), שפותח על ידי צוות ישראלי ועדיין לא שוחרר לקהל הרחב, בדומה ל-Sora. ההתקדמות של סורה היא אדירה, והשאלה היא לאן עוד זה יכול להגיע.

מה המרכיב הסודי של סורה, שהופך אותה למנוע כל כך מדהים? מנגנון בשם טלאים (Patches). הטכנולוגיה החדשה של סורה מאפשרת לקחת כל תמונה בכל רזולוציה, בין אם היא צולמה באייפון או במצלמת וידיאו ישנה, ואיתה לאמן את המודל. זה קורה באופן דומה למה שקורה במודל של מנוע יצירת התמונות Dall-E, כך שנוצר מעין קנבס אינסופי.

אז איך סטארטאפים בתחום ה-AI יכולים בכלל להתחרות בכלל בפיתוחי הענק הללו? כמעט כל דבר בתחום הזה נמצא בסכנה ש-OpenAI תעשה אותו קודם. הסטארטאפים לא מספיקים להתרגל לשינוי, ופתאום נולד משהו חדש. אלא ש-Open AI מצליחה לתת נוק-אאוט לא רק לסטארטאפים, אלא גם לענקיות הטכנולוגיה כמו גוגל - שהשיקה מחדש את שירות ה-AI שלה, ג'מיני 1.5, במקום בארד, שנחשב למתקדם ביותר מבחינת כמות הטוקנים שהוא תומך בהם.

סם אלטמן  (צילום: Steve Jennings / Stringer, getty images)
סאם אלטמן, מנכ"ל OpenAI | צילום: Steve Jennings / Stringer, getty images

בהוליווד מסתכלים על המהפכה הזאת בחשש. האם בעתיד מנוע סורה יוכל לכתוב סרט שלם? אין לדעת. תרחיש קיצוני אף יותר הוא שילוב של מנוע יצירת וידיאו מטקסט בשירות כמו נטפליקס, שיאפשר לנו בעצם ליצור בעצמנו את התכנים שאנחנו רוצים לראות.

הסכנה הגדולה בתחום היא כמובן הפייק. לכן, OpenAI עוצרת בשלב זה את השחרור של סורה לקהל הרחב, וזאת בכדי להתמודד עם הסכנות שטמונות במודל. הבעיה כאן היא לא בטכנולוגיה, אלא באנושות שלא יודעת להשתמש בה כמו שצריך. יכולות הדיפ-פייק כבר כאן, ולכן גם אם OpenAI לא תשחרר את היכולת של סורה בקרוב, סביר להניח שהיא תגיע אלינו ממקור אחר. כזכור, אנחנו בשנת בחירות בארצות הברית וסביר להניח שהדבר הזה ייקח בכך חלק משמעותי.

גם האדם פשוט סביר להניח ייפגע באופן כלשהו מטכנולוגיית הדיפ-פייק, כמו לדוגמה כל מי שמשתמש באפליקציות היכרויות. נסו רק לדמיין את השימוש של ההונאות בסורה בתחום - אנשים יוכלו לשלוח סרטוני וידיאו של עצמם, לכאורה. כל זה הוא רק צעד לקראת העתיד, בו הבינה המלאכותית תדע הכל ותדע לעשות הכל. 

לצפייה בפרק המלא באפליקציית 12+ לחצו כאן

>> בזמן שעבדתם, פרק 166 - העיתונאי החדש: אנשי התקשורת שעוברים לפעול רק ברשתות החברתיות