חוקרים חושפים: AI מזהה טעויות פנימיות אך לא מתקן - ומדענים מחפשים פתרונות במוח האנושי
מחקר ישראלי חושף שבינה מלאכותית מזהה טעויות פנימית אך לא מתקנת אותן, בניגוד לביטחון שהיא מפגינה כלפי חוץ. במקביל, חוקרים בבריטניה מדמים ארגון מוחי לשיפור ביצועים וחסכון באנרגיה. הממצאים עשויים להוביל לדור חדש של מערכות AI אמינות ויעילות יותר.

AI מזהה את טעויותיו אך מתעקש לא לתקנן - מחקר פורץ דרך מהטכניון
צוות חוקרים מהטכניון, אפל וגוגל חשף כי מודלי שפה גדולים (LLM) יודעים מתי הם טועים - אך לא מתקנים את עצמם. המחקר, שהוצג בכנס ICLR 2025, מראה כי המידע על נכונות התשובה מקודד בייצוגים הפנימיים של המודל, לעיתים באסימונים (Tokens) ספציפיים.
ד"ר הדס אורגד מהטכניון מסבירה: "בניתוח ייצוגים פנימיים גילינו שניתן לחזות טעויות מראש. באופן פרדוקסלי, גם כשהמודל 'יודע' את התשובה הנכונה - הוא עלול לתת תשובה שגויה בעקביות".
מנגנון ההטעיה: למה AI בוחר לטעות במודע?
- סיבת עיקרית: אימון המודלים מתמקד בחיזוי מילים וקבלת פידבק אנושי - לא בדיווק עובדתי
- ממצא מפתיע: פער בין ה"ידע" הפנימי של המודל להתנהגות החיצונית הנצפית
- סוגי טעויות מזוהים: טעויות אקראיות (ניחוש) vs טעויות עקביות (בטחון שגוי)
אורגד מדגישה: "העובדה שה-AI מקודד מידע על טעויות מבלי לתקנן מחייבת פיתוח מנגנוני בקרה חדשים, במיוחד ביישומים קריטיים כמו רפואה".
השראה מוחית: הדור הבא של רשתות נוירונים
במקביל, חוקרים מאוניברסיטת Surrey בבריטניה פיתחו גישה חדשה המחקה את חיווט המוח האנושי (Topographical Sparse Mapping). במחקר שפורסם ב-Neurocomputing הראו כי חיבור נוירונים מלאכותיים רק לשכניהם הקרובים - בדומה לארגון המוח - משפר ביצועים תוך חסכון באנרגיה.
יתרונות הגישה הביומימטית:
- חיסכון אנרגטי: צמצום צריכת החשמל של אימון מודלי ענק (לעיתים מעל מיליון קו"ש)
- שיפור ביצועים: דיוק גבוה יותר באמצעות "גיזום ביולוגי" (biologically inspired pruning)
- קיימות: צמצום הקשרים הלא נחוצים ברשת העצבית
ד"ר רומן באואר מציין: "המערכת המוחית נותנת לנו דגם לAI יעיל ובר-קיימא - זהו שינוי פרדיגמה נדרש".
כיווני התפתחות עתידיים
שני המחקרים מצביעים על מגמות משלימות בפיתוח AI:
- הבנה עמוקה יותר של המנגנונים הפנימיים במודלים קיימים
- עיצוב מערכות חדשות בהשראת הביולוגיה האנושית
כפי שמסכמת אורגד: "התחום מתקדם לעבר דור שני של AI - מדויק יותר, שקוף יותר וחסכוני במשאבים. הפריצה תתאפשר רק בשילוב בין שני הכיוונים הללו".