בדקו את היצירתיות של 22 מודלי AI בהשוואה לבני אדם - ויש סיבה לדאגה

מחקר חדש של פרופ' יועד קנת מהטכניון וד"ר אמילי וונגר מאוניברסיטת דיוק חושף כי למרות התחושה שהבינה המלאכותית מספקת רעיונות אין-סופיים, בפועל המודלים השונים מייצרים תשובות דומות ומשוכפלות. החוקרים מזהירים כי הסתמכות יתר על כלי ה-AI לסיעור מוחות, כתיבה ויצירה, עלולה להוביל לצמצום משמעותי במרחב המחשבה והיצירתיות האנושית

דנה גוטרזון

mako

פורסם: 07.05.26, 10:24 | עודכן: 08.05.26, 09:06

המהפכה המהירה של הבינה המלאכותית בשנים האחרונות הובילה רבים לתהות: מי באמת יותר יצירתי – האדם או המכונה? מחקר חדש שפורסם במרץ 2026 בכתב העת PNAS Nexus מבקש להפריך את התפיסה שבינה מלאכותית כבר הגיעה לרמה האנושית בתחום היצירתיות.

המחקר הובל על ידי פרופ' משנה אמילי וונגר מהמחלקה להנדסת חשמל ומחשבים באוניברסיטת דיוק, בשיתוף עם פרופ' חבר יועד קנת, מהפקולטה למדעי הנתונים וההחלטות בטכניון.

בעוד שמחקרים קודמים שהצביעו על פגיעה ביצירתיות התמקדו לרוב במודל אחד בלבד (לרוב ChatGPT), המחקר הנוכחי ביקש לבדוק אם מדובר בבעיה רוחבית של כלל התעשייה. לשם כך, המחקר השווה בין ביצועיהם של 102 משתתפים אנושיים לבין 22 מודלי שפה שונים – בהם מודלים של ענקיות כמו OpenAI, גוגל, מטא, Mistral, וכן מודל Jamba 1.5 Large של חברת AI21 Labs הישראלית. ההשוואה נעשתה בשלוש משימות יצירתיות סטנדרטיות המקובלות בחקר היצירתיות:

משימת שימושים חלופיים: המשתתפים התבקשו להציע שימושים יצירתיים לחפצים יום-יומיים (כגון ספר, מזלג, שולחן, פטיש ומכנסיים).
מבחן זרימה קדימה: מדידת ההתרחקות של שרשרת אסוציאציות ממילת פתיחה נתונה.
משימת אסוציאציות מסתעפות: המשתתפים התבקשו לרשום 10 מילים רחוקות ככל האפשר זו מזו מבחינת המשמעות שלהן.

החוקרים השתמשו בכלים חישוביים כדי למדוד שני מדדים עיקריים:

מקוריות אישית (Originality): נמדדה באמצעות המרחק הסמנטי (Semantic Distance) בין תגובת המשתתף לבין הגירוי שניתן לו. ככל שהמרחק גדול יותר, התגובה נחשבת למקורית יותר.
שונות ברמת האוכלוסייה (Variability): זהו המדד המרכזי במחקר. החוקרים חישבו את המרחקים הסמנטיים בין התגובות של המשתתפים השונים בתוך אותה קבוצה (למשל, עד כמה תגובה של מודל שפה אחד דומה לתגובה של מודל אחר).

כדי לוודא שהתוצאות אינן נובעות מגורמים מתערבים, החוקרים ביצעו מספר בדיקות נוספות:

בקרת מבנה: הם בדקו אם דמיון במבנה המשפטים (כמו אורך התגובה או זמן דקדוקי) משפיע על התוצאות, ומצאו שההומוגניות של המודלים נשמרת גם כששולטים במשתנים אלו.
שינוי טמפרטורה (Temperature): החוקרים ניסו להעלות את רמת ה"אקראיות" של המודלים. הם מצאו שזה אכן מגדיל את השונות, אך ברמות גבוהות המודלים החלו לייצר טקסט חסר משמעות.
הנחיות מערכת (System Prompts): נבדק אם הנחיות מפורשות לביצועים "יצירתיים" או "נועזים" יגדילו את השונות. נמצא שהנחיות אלו שיפרו מעט את המקוריות האישית, אך לא צמצמו משמעותית את הדמיון הרב בין המודלים השונים.

מקוריות ברמת הפרט, חוסר גיוון ברמת הכלל

התוצאות חשפו כי ברמה הפרטנית, המודלים הפגינו רמת מקוריות הדומה לזו של בני האדם, ולעתים אף עלו עליהם. עם זאת, כאשר בוחנים את כלל האוכלוסייה, התגלה הפער האמיתי – התגובות של המודלים השונים היו דומות מאוד אלו לאלו, בעוד שתגובות בני האדם היו מגוונות ושונות משמעותית זו מזו. החוקרים מצאו כי מודלי השפה חולקים דפוסי שפה דומים ונוטים להשתמש במילים חופפות רבות בתגובותיהם.

פרסומת

פרופ' חבר יועד קנת, הטכניון — פרופ' חבר יועד קנת, מהפקולטה למדעי הנתונים וההחלטות בטכניון | צילום: רמי שלוש, דוברות הטכניון

מה גורם למודלים מכל רחבי התעשייה לחשוב בצורה כה דומה? החוקרים משערים במאמר כי אחת הסיבות עשויה להיות תהליך ה"יישור" (Alignment) שעוברים מודלים מסחריים ציבוריים. תהליך זה, שנועד לצנזר את המודלים ולמנוע מהם לייצר תוכן פוגעני, מסוכן או לא הולם, עלול להיות בדיוק מה שמגביל את היצירתיות שלהם וגורם להם להתכנס לאותו "מרכז סמנטי" בטוח ומוכר.

הסכנה: צמצום המחשבה האנושית

החוקרים מזהירים כי הסתמכות יתר על בינה מלאכותית ככלי עזר יצירתי עלולה להוביל לצמצום קולקטיבי של היצירתיות. אם כל הכותבים, המדענים והאומנים ישתמשו באותם מודלים כשותפים לסיעור מוחות, התוצרים הסופיים שלהם יתכנסו לממוצע צר ומוגבל.

"יצירתיות משגשגת על הטרוגניות של רעיונות, אך נראה שהמודלים של ימינו אינם מסוגלים לספק זאת", מציין המחקר. בעוד שיוצרים פורצי דרך לאורך ההיסטוריה הצטיינו בזכות חשיבה מסתעפת וייחודית, המודלים הנוכחיים דוחפים את המשתמשים לעבר "מרכז סמנטי" משותף. למרות הממצאים, החוקרים אינם פוסלים את האפשרות שבעתיד ישולבו במודלים מנגנונים קוגניטיביים מורכבים יותר. עם זאת, הם מדגישים כי ממדים כמו אותנטיות, כוונה ואינדיבידואליות חסרים כיום בנוף המודלים הקיים.

פרסומת

זווית מעניינת שמוזכרת במחקר נוגעת לאופן שבו בני אדם שונים משתמשים בטכנולוגיה: מחקרים מראים שאנשים הנחשבים לפחות יצירתיים נוטים לסמוך באופן מוחלט על ה-AI ולקבל את הפלט שלו כפי שהוא. לעומתם, אנשים יצירתיים יותר נוטים לכתוב הנחיות (פרומפטים) מורכבות ועשירות יותר, שמצליחות לחלץ מהמודלים תוצרים משופרים.

"יצירתיות נחשבת לתכונה נחשקת – אנחנו רוצים להיות יצירתיים, רוצים ליצור, רוצים להמציא", מסר ל-mako פרופ' קנת. "פורום הכלכלה הבין-לאומי מגדיר שוב ושוב יצירתיות כאחת מחמש התכונות החשובות ביותר לאנושות במאה ה-21 ובמיוחד לשוק העבודה העתידי.

"ככל שבני אדם נשענים יותר על מודלי בינה מלאכותית כדי לייצר תוכן ולפתור בעיות, כך גדלה הסכנה עתידית לצמצום יכולת חשיבה יצירתית אנושית", הוא מסביר. "הסכנה העתידית על החברה היא תהליך של צמצום ביכולת חשיבה יצירתית אנושית בשל שימוש והישענות הולכת וגוברת על מודלי בינה מלאכותית".

AI בינה מלאכותית הטכניון יצירתיות

מצאתם טעות לשון?