חוקרים חושפים: AI מזהה טעויות פנימיות אך לא מתקן - ומדענים מחפשים פתרונות במוח האנושי

2 בנוב׳ 2025, 16:26חדשות2 מקורות

מחקר ישראלי חושף שבינה מלאכותית מזהה טעויות פנימית אך לא מתקנת אותן, בניגוד לביטחון שהיא מפגינה כלפי חוץ. במקביל, חוקרים בבריטניה מדמים ארגון מוחי לשיפור ביצועים וחסכון באנרגיה. הממצאים עשויים להוביל לדור חדש של מערכות AI אמינות ויעילות יותר.

חוקרים חושפים: AI מזהה טעויות פנימיות אך לא מתקן - ומדענים מחפשים פתרונות במוח האנושי

AI מזהה את טעויותיו אך מתעקש לא לתקנן - מחקר פורץ דרך מהטכניון

צוות חוקרים מהטכניון, אפל וגוגל חשף כי מודלי שפה גדולים (LLM) יודעים מתי הם טועים - אך לא מתקנים את עצמם. המחקר, שהוצג בכנס ICLR 2025, מראה כי המידע על נכונות התשובה מקודד בייצוגים הפנימיים של המודל, לעיתים באסימונים (Tokens) ספציפיים.

ד"ר הדס אורגד מהטכניון מסבירה: "בניתוח ייצוגים פנימיים גילינו שניתן לחזות טעויות מראש. באופן פרדוקסלי, גם כשהמודל 'יודע' את התשובה הנכונה - הוא עלול לתת תשובה שגויה בעקביות".

מנגנון ההטעיה: למה AI בוחר לטעות במודע?

סיבת עיקרית: אימון המודלים מתמקד בחיזוי מילים וקבלת פידבק אנושי - לא בדיווק עובדתי
ממצא מפתיע: פער בין ה"ידע" הפנימי של המודל להתנהגות החיצונית הנצפית
סוגי טעויות מזוהים: טעויות אקראיות (ניחוש) vs טעויות עקביות (בטחון שגוי)

אורגד מדגישה: "העובדה שה-AI מקודד מידע על טעויות מבלי לתקנן מחייבת פיתוח מנגנוני בקרה חדשים, במיוחד ביישומים קריטיים כמו רפואה".

השראה מוחית: הדור הבא של רשתות נוירונים

במקביל, חוקרים מאוניברסיטת Surrey בבריטניה פיתחו גישה חדשה המחקה את חיווט המוח האנושי (Topographical Sparse Mapping). במחקר שפורסם ב-Neurocomputing הראו כי חיבור נוירונים מלאכותיים רק לשכניהם הקרובים - בדומה לארגון המוח - משפר ביצועים תוך חסכון באנרגיה.

יתרונות הגישה הביומימטית:

חיסכון אנרגטי: צמצום צריכת החשמל של אימון מודלי ענק (לעיתים מעל מיליון קו"ש)
שיפור ביצועים: דיוק גבוה יותר באמצעות "גיזום ביולוגי" (biologically inspired pruning)
קיימות: צמצום הקשרים הלא נחוצים ברשת העצבית

ד"ר רומן באואר מציין: "המערכת המוחית נותנת לנו דגם לAI יעיל ובר-קיימא - זהו שינוי פרדיגמה נדרש".

כיווני התפתחות עתידיים

שני המחקרים מצביעים על מגמות משלימות בפיתוח AI:

הבנה עמוקה יותר של המנגנונים הפנימיים במודלים קיימים
עיצוב מערכות חדשות בהשראת הביולוגיה האנושית

כפי שמסכמת אורגד: "התחום מתקדם לעבר דור שני של AI - מדויק יותר, שקוף יותר וחסכוני במשאבים. הפריצה תתאפשר רק בשילוב בין שני הכיוונים הללו".

2

#Apple #Google #Hadass Orgad #ICLR #Roman Bauer #Technion #University of Surrey #israel #neuroscience #research paper #tech #technion

AI מזהה את טעויותיו אך מתעקש לא לתקנן - מחקר פורץ דרך מהטכניון

מנגנון ההטעיה: למה AI בוחר לטעות במודע?

השראה מוחית: הדור הבא של רשתות נוירונים

יתרונות הגישה הביומימטית:

כיווני התפתחות עתידיים

מקורות2

2