"מודלים של עולם": ההימור של חברות ה-AI במרוץ ל"סופר-אינטליגנציה"

בינה מלאכותית כבר מבינה איך בני אדם חושבים ומדברים - אבל מה אם היא תבין גם את העולם התלת-מימדי שהם חיים בו? הכירו את המושג ״מודלים של עולם״ - ההמצאה שתשנה את תעשיית ה-AI

דור בביוף

mako

פורסם: 09.10.25, 15:47 | עודכן: 09.10.25, 22:39

טכנולוגיה, בינה מלאכותית — צילום: Gorodenkoff, shutterstock

בשנים האחרונות בינה מלאכותית הפכה מהבטחה רחוקה למציאות; כמעט כולנו משתמשים בה על בסיס יומיומי ממש. אבל בעוד כלי ה-AI הפופולריים ביותר כיום פועלים על בסיס טקסט, חברות הבינה המלאכותית המובילות בעולם כבר מהמרות על דבר אחר: מודלים של עולם.

במה בעצם מדובר? מודלים של עולם (World Models) הם מערכות AI שמבינות את העולם הפיזי שאנו חיים בו. בשלב הזה, ל-AI יש הבנה לא רעה של בני אדם ושל הדרך בה הם חושבים, מרגישים ומתבטאים. הוא גם מבין איך בני אדם נראים, ואיך העולם נראה - הבנה שעוזרת למשל ליצור תמונות או סרטונים שנראים אמיתיים לחלוטין. השלב הבא הוא להבין ממש את המרחב התלת מימדי, דרך למידה מסרטונים וממידע רובוטי.

גוגל, מטא ונבידיה הן בין החברות שכבר משקיעות רבות בפיתוח התחום, בניסיון להתקרב למטרה של יצירת מכונה עם "סופר-אינטליגנציה". מניע נוסף שלהן הוא התהייה האם מודלים של שפה - הטכנולוגיה שעומדת מאחורי ChatGPT או Gemini, למשל - כבר מגיעים לתקרת היכולות שלהם. למרות הסכומים האדירים שמושקעים בהם, הקפיצות בביצועים של המודלים האלה מצטמצמות עם הזמן, ועיני התעשייה כבר מופנות אל הדבר הבא.

השוק הפוטנציאלי למודלים של עולם יכול להיות עצום, כמעט שווה לגודלה של הכלכלה העולמית כיום - כך סובר רב לברדיאן, סמנכ"ל Omniverse וטכנולוגיית סימולציות בחברת נבידיה. מודלים כאלה יביאו את הטכנולוגיה לעולם הפיזי, ויכולים לחולל מהפכה בתחומים כמו ייצור מוצרים ובריאות. לברדיאן מעריך את ההזדמנות הכלכלית שבהם בשווי של 100 טריליון דולר - "אם נוכל ליצור בינה שמבינה את העולם הפיזי ופועלת בתוכו".

ChatGPT, ג'מיני, קלוד, קופיילוט — אפליקציות בינה מלאכותית | צילום: jackpress, shutterstock

החזון: מכונה שלומדת כמו ילד אנושי

מודלים של עולם מאומנים על ידי מידע שמגיע מסביבות אמיתיות או מלאכותיות. המידע הזה חשוב לקידום המצאות כמו רובוטים או מכוניות אוטונומיות, אבל צריך הרבה מאוד ממנו - והרבה כוח מחשוב - כדי להגיע להתקדמות משמעותית, והדבר נחשב כרגע לאתגר בלתי מפוצח.

פרסומת

למרות זאת, כבר אפשר לראות בשטח התקדמויות בתחום. באוגוסט האחרון גוגל הציגה את Genie 3, שמייצר סרטונים פריים אחרי פריים בהתבסס על תיאור טקסטואלי ופעולות המשתמש. כזכור, הסטנדרט שהתרגלנו אליו עד אז היה יצירה של סרטון שלם בבת אחת, ולא שלב אחרי שלב.

"הבינה המלאכותית עדיין מוגבלת לעולם הדיגיטלי", אומר שלומי פרוכטר, ממובילי פרויקט Genie 3. "על ידי בנייה של סביבות שנראות כמו העולם האמיתי או מתנהגות כמוהו, יכולות להיות לנו הרבה יותר דרכים הדרגתיות לאמן את ה-AI, ללא ההשלכות של עשיית טעות בעולם האמיתי".

גם מטא לא יושבת בחיבוק ידיים. היא מאמנת את מודלי ה-V-JEPA שלה באמצעות סרטונים שצולמו בעולם האמיתי, בניסיון לשחזר את הדרך שבה ילדים לומדים באופן פסיבי על ידי התבוננות בעולם שסביבם. בהובלת המנכ"ל מארק צוקרברג, מטא משקיעה סכומי עתק בתחום הבינה המלאכותית, ולאחרונה גם גייסה לשורותיה את אלכסנדר ואנג, המייסד השותף והמנכ"ל של חברת סקייל AI, פלטפורמת תיוג נתונים המספקת נתוני הדרכה עבור מודלים של למידת מכונה. ואנג, המיליארדר הצעיר ביותר בעולם שהשיג את הונו בעצמו, עומד כיום בראש כל תחום הבינה המלאכותית בחברת מטא.

רובוט מנהל מחסן סחורה — רובוטיקה: תחום שזקוק במיוחד למודלים של עולם | צילום: shutterstock, shutterstock

פרסומת

מי אוסף את המידע הנחוץ לאימון המודלים? אתם

במקביל לעבודה האינטנסיבית על פיתוחם, ניתן לראות את היכולות של מודלים של עולם כבר עכשיו בתעשיית הבידור - רק בשבוע שעבר סיפרנו על טילי נורווד, שחקנית ה-AI שטלטלה את הוליווד. מודלים של עולם יכולים להיות שימושיים מאוד לא רק לקולנוע אלא גם למשחק מחשב. Runway, סטארט-אפ ליצירת וידאו שכבר סגר עסקאות עם אולפנים הוליוודיים כמו Lionsgate, השיקו הקיץ מוצר שמשתמש במודלים של עולם כדי ליצור הגדרות למשחקי מחשב, כולל סיפורים ודמויות מותאמים אישית שנוצרים בזמן אמת.

"שיטות וידאו מסורתיות הן גישה גסה ליצירת פיקסלים, שבה מנסים לדחוף תנועה לכמה פריימים כדי ליצור אשליה של תזוזה - אבל המודל לא באמת יודע מה קורה בסצנה", אומר כריסטובל ולנצואלה, מנכ"ל Runway. מודלים ישנים ליצירת וידאו התבססו על פיזיקה שאינה הפיזיקה של העולם האמיתי - וזה עוד דבר שמודלים של עולם באים לתקן.

כדי לבנות מודלים של עולם, חברות זקוקות לכמויות עצומות של מידע פיזי על העולם. חברת Niantic מסן פרנסיסקו כבר מיפתה 10 מיליון מקומות בעולם, זאת על סמך מידע שאספה ממשחקים כמו פוקימון גו, בו משחקים 30 מיליון איש בחודש - ומנהלים בכך אינטראקציות על פני מפה גלובלית. פוקימון גו היה שייך ל-Niantic במשך 9 שנים, ואפילו אחרי שהמשחק נמכר ל-Scopely בחודש יוני, השחקנים עדיין תורמים ל-Niantic מידע אנונימי על ידי סריקה של הנוף הפיזי.

משתמשים מספקים נתונים על העולם הפיזי. פוקימון גו | צילום: Shutterstock, shutterstock

פרסומת

התקדמות משמעותית בתחום המודלים של העולם עשויה לקחת זמן - לפי יאן לקאן, מדען AI ראשי בחברת מטא, יכולות לעבור 10 שנים של עבודה עד שה-AI יגיע לרמת אינטליגנציה אנושית. ובכל זאת, החברות המובילות בעולם כבר עובדות במרץ, בתקווה שמודלים של עולם יבשרו מהפכה תעשייתית בסדר גודל דומה למהפכה שבישרו המחשבים עבור עולם המידע.

מצאתם טעות לשון?