mako
פרסומת

נעימה יותר ואחידה יותר: מחקר ישראלי חדש ניתח את ה"אישיות" של ה-AI

מחקר ישראלי חדש טוען כי מודלי שפה כמו GPT ו-Claude מציגים דפוסי אישיות עקביים. לפי הממצאים, ה-AI נוטה להפגין רמות גבוהות של נעימות ומצפוניות לצד רמות נמוכות של נוירוטיות, ככל הנראה בשל מטרות האימון המכוונות ליצירת שיח תומך, רגוע וידידותי. כך זה התבצע

דנה גוטרזון
פורסם: | עודכן:
ChatGPT, ג'מיני, קלוד, קופיילוט
ChatGPT, ג'מיני, קלוד, קופיילוט | צילום: jackpress, shutterstock
הקישור הועתק

הבינה המלאכותית הפכה בשנים האחרונות לחלק בלתי נפרד מהיום-יום: היא כותבת, מייעצת, מסכמת ולעתים אפילו נשמעת כמעט אנושית. אבל האם ייתכן שגם לטקסטים שהיא מייצרת יש מאפיינים אישיותיים? מחקר חדש, שנערך במכללה האקדמית תל אביב-יפו על ידי ד"ר אלה רבינוביץ וגב' דנה סוטו פורת, והוצג שם אתמול, טוען: מודלים של שפה לא רק מחקים שיחה אנושית, אלא מפגינים דפוסי אישיות ברורים ועקביים.

המחקר בחן שישה מודלים מובילים שנלקחו ממשפחות המודלים Claude ,GPT ,Llama ו-Qwen (המודל של עליבאבא), והשווה בין תגובותיהם לבין תגובות של בני אדם אמיתיים שנאספו מרדיט (Reddit) – אתר הפורומים הפופולרי. במקום לבחון את המודלים בעזרת שאלוני אישיות ישירים, כלומר שהמודלים ידרגו את עצמם כפי שנעשה במחקרים קודמים, שיטה שספגה ביקורת שכן למודלים אין "מצב פנימי" יציב כמו לבני אדם, החוקרות בחרו בניתוח אוטומטי של סגנון הכתיבה עצמו.

החוקרות אספו אלפי שאלות פתוחות מקהילות מגוונות ברדיט, בנושאים כמו בריאות, אורח חיים, טכנולוגיה ויחסים, וביקשו מהמודלים להגיב כאילו היו משתמשים רגילים ברשת החברתית. לאחר מכן הופעלו מסווגים חישוביים שמעריכים את חמש תכונות האישיות המרכזיות לפי מודל ה-Big Five: פתיחות, מוחצנות, מצפוניות, נעימות ונוירוטיות. מדובר באחת המסגרות הנפוצות והמשפיעות ביותר להערכת אישיות ולהבנת הבדלים בין בני אדם בפסיכולוגיה.

הממצאים מצביעים על כך שמודלים של שפה נוטים להיות "נעימים" יותר מבני אדם. כלומר, הם מביעים יותר שיתופיות, אמפתיה ונכונות להסכים. במקביל, הם מציגים רמות נמוכות יותר של נוירוטיות, תכונה הקשורה לרגשות שליליים, חוסר יציבות וחרדה. החוקרות מסבירות כי הדבר כנראה נובע ממטרות האימון של המודלים, שמכוונות ליצירת שיח תומך, רגוע וידידותי. אכן, רבות מהתגובות שנבדקו נפתחו במשפטים כמו "אני מבין אותך לגמרי" או "אני מצטער לשמוע שאת/ה מרגיש/ה כך."

כמו כן, בתכונת המצפוניות, השפה בה השתמשו המודלים העידה על רמות גבוהות יותר של משמעת עצמית, שליטה בדחפים, וסדר וארגון, בהשוואה לשפה האנושית. המודלים הציגו גם מדדים מעט גבוהים יותר של יצירתיות, סקרנות ודמיון, הקשורים לתכונת הפתיחות.

פרסומת

מעבר לכך, המחקר בדק גם אם ניתן לזהות בטקסטים של המודלים רמזים לשפה מגדרית. נמצא כי דפוסים מגדריים קיימים גם בתגובות של בינה מלאכותית, והם דומים באופן כללי לאלה של בני אדם, אך עם פחות שונות וגיוון. במילים אחרות, המודלים נשמעים "אחידים" יותר, ומציגים פחות קצוות סגנוניים בהשוואה לכותבים אנושיים.

החוקרות מדגישות כי למרות הדמיון לאנשים, אין פירוש הדבר שלמודלים יש אישיות אמיתית או "מצב פנימי". מדובר בדפוסים לשוניים שעולים מהאופן שבו המודלים אומנו ומהטקסטים שעליהם התבססו. ועדיין, עצם העובדה שניתן לזהות תכונות עקביות בסגנון שלהם עשויה להשפיע על הדרך שבה אנו תופסים את הבינה המלאכותית ועל האופן שבו היא משתלבת בחברה.