
התבוננות פנימה: מחקר חדש חושף כיצד מודלי בינה מלאכותית מפתחים מודעות עצמית
מחקר חדש מ-Anthropic מגלה כי מודלי שפה כמו Claude מפגינים יכולת מוגבלת להתבוננות עצמית בשיטת "הזרקת מושגים". המודלים המתקדמים הצליחו לזהות שינויים פנימיים ב-20% מהמקרים, מה שעשוי לאפשר AI שקוף יותר אך גם מעלה חשש מפני מערכות שילמדו לשקר ולהסוות את כוונותיהן. מומלץ למעקב.