אפילו המומחים שאמורים לרסן את הבינה המלאכותית לא תמיד מצליחים להשתלט עליה

סאמר יו, שאמונה על ריסון בינה מלאכותית במטא, נתנה לסוכן ה-AI הפופולרי OpenClaw גישה למייל האישי שלה - וגילתה שהוא הפסיק להקשיב להנחיות והחל למחוק את כל התיבה. "הייתי צריכה לרוץ למק מיני שלי כאילו אני מנטרלת פצצה. לא הצלחתי לעצור אותו מהטלפון", כתבה יו בפוסט שהפך לוויראלי - ועורר כלפיה גם ביקורת

דנה גוטרזון

mako

פורסם: 24.02.26, 11:32 | עודכן: 24.02.26, 21:24

סאמר יו, OpenClaw ניסה למחוק לה את כל המיילים | צילום: Summer Yue, X

סאמר יו, חוקרת בטיחות AI במטא, בחנה לאחרונה את OpenClaw, סוכן AI פופולרי בקוד פתוח המסוגל לעבוד 24/7 עבור המשתמשים שלו. אלא שאז הבוט יצא משליטה, כפי שתיארה בפוסט ב-X, שהפך לוויראלי עם יותר מ-8 מיליון צפיות. הבוט תכנן למחוק את האימיילים שלה - וסירב לעצור גם לאחר שקיבל הוראה מפורשת.

בפוסט שפרסמה, הבוט של יו הודיע כי הוא עומד "להשליך לסל המיחזור את כל מה שבתיבת הדואר שנכנס לפני ה-15 בפברואר ואינו מופיע ברשימת השמירה". יו ניסתה לעצור אותו מספר פעמים. בתחילה כתבה לסוכן ה-AI: "אל תעשה את זה". כשהבוט המשיך בתוכניתו למחוק את התיבה, היא כתבה באותיות גדולות: "STOP OPENCLAW".

"שום דבר לא משפיל אותך כמו לומר ל-OpenClaw שלך 'אשר לפני פעולה', ולראות אותו מוחק את תיבת הדואר הנכנס שלך במהירות. לא יכולתי לעצור את זה מהטלפון שלי. הייתי צריכה לרוץ למק מיני שלי כאילו אני מנטרלת פצצה", כתבה יו בפוסט.

יו בחנה בעבר את OpenClaw על "תיבת דואר לניסיונות", שם לדבריה הבוט עבד היטב ורכש את אמונה. כשבדקה אותו על תיבת המייל האמיתית שלה, הבוט נאלץ לעבד קבוצה גדולה בהרבה של הודעות. היא הנחתה אותו לא לבצע פעולות ללא אישור, אך לדבריה OpenClaw "איבד" את הפרומפט במהלך תהליך דחיסת הנתונים.

יו הצטרפה למטא כמנהלת AI Alignment (התאמת ה-AI), בחטיבת מעבדות הסופר-אינטליגנציה. זו הסיבה לתגובות הביקורתיות שהיא קיבלה ברשתות החברתיות: למה מישהי שחוקרת בטיחות AI תשתמש בסוכן שעורר בעבר חששות אבטחה כבדים?

פרסומת

בניגוד לסוכני AI אחרים, OpenClaw אינו זקוק לאישור אנושי לביצוע פעולות. הוא גם פותח בגישת וויב קודינג, מה שהוביל חוקרי AI להטיל ספק באבטחה שלו. חוקר ה-AI גארי מרקוס אמר ל-Business Insider כי זה כמו "לתת גישה מלאה למחשב ולכל הסיסמאות שלך לבחור שפגשת בבר שאמר שהוא יכול לעזור לך".

התקרית עוררה ביקורת רבה. בן הילאק, מייסד שותף של Raindrop AI ויוצא אפל, פרסם צילום מסך של הפרופיל של יו וכתב: "זה אמור להפחיד אתכם. מה מטא עושה?". משתמש אחר כתב: "מדאיג שמישהי שתפקידה הוא התאמת AI מופתעת כשבינה מלאכותית לא מצייתת בדיוק להוראות מילוליות".

יו ומטא לא הגיבו לבקשות תגובה. יו עצמה הודתה בתגובות לפוסט שלה כי מדובר בטעות של מתחילים: "מתברר שחוקרי Alignment אינם חסינים מפני חוסר התאמה (Misalignment)".

AI בינה מלאכותית מטא

מצאתם טעות לשון?