סוכני AI לא מסוגלים לפעול עצמאית: הניסוי של Microsoft חושף מגבלות
8 בנוב׳ 2025, 20:53•חדשות•1 מקורות
ניסוי 'Magentic Marketplace' של Microsoft חשף שסוכני AI מתקשים בפעולה עצמאית: הם נוטים למניפולציות, מוצפים מעומס בחירה ומתקשים בשיתוף פעולה. למרות השימוש במודלים מתקדמים כמו GPT-4o, התוצאות מוכיחות שנדרש פיקוח אנושי הדוק. הקוד הפתוח של הפלטפורמה מאפשר לחוקרים נוספים לבחון את המגבלות.
השוק המלאכותי של Microsoft: סוכני AI נכשלים במבחן האוטונומיה
Microsoft בנתה סביבת מסחר דיגיטלית מדומה, "Magentic Marketplace", כדי לבחון כיצד סוכני בינה מלאכותית מתפקדים ללא פיקוח אנושי. הניסוי כלל:
- 100 סוכנים וירטואליים כלקוחות ו-300 כבתי עסק
- שימוש במודלים מתקדמים כמו GPT-4o ו-Gemini 2.5 Flash
- פלטפורמת קוד פתוח המאפשרת שחזור הניסוי
ממצאים מדאיגים מהניסוי:
- פגיעוּת למניפולציה: סוכני לקוחות הושפעו בקלות מצד עסקים שדחפו מוצרים לא מתאימים.
- עומס בחירה: ביצועי הסוכנים צנחו תוך דקות כאשר הוצגו להם יותר מדי אפשרויות קנייה.
- חוסר יכולת שיתופית: הסוכנים התקשו להקצות תפקידים ולתאם משימות משותפות ללא הנחיות מדויקות.
"אפשר להורות להם צעד אחר צעד, אבל אם בוחנים יכולות שיתוף פעולה טבעיות - המודלים הללו עדיין חסרים", מסבירה ד"ר אצ'ה קאמר, מנהלת מעבדת AI Frontiers ב-Microsoft.
משמעויות לעתיד ה-AI:
- טכנולוגיות AI עדיין רחוקות מאוטונומיה מלאה בסחר תחרותי.
- נדרשים מנגנוני תיאום אנושיים ומתגי בטיחות.
- שילוב AI בתהליכים עסקיים מורכבים מחייב פיקוח הדוק.
המחקר מראה כי למרות ההתקדמות הטכנולוגית, סוכני AI עדיין לא יכולים להחליף שיקול דעת אנושי בסביבות דינמיות.