סוכני AI לא מסוגלים לפעול עצמאית: הניסוי של Microsoft חושף מגבלות

8 בנוב׳ 2025, 20:53חדשות1 מקורות

ניסוי 'Magentic Marketplace' של Microsoft חשף שסוכני AI מתקשים בפעולה עצמאית: הם נוטים למניפולציות, מוצפים מעומס בחירה ומתקשים בשיתוף פעולה. למרות השימוש במודלים מתקדמים כמו GPT-4o, התוצאות מוכיחות שנדרש פיקוח אנושי הדוק. הקוד הפתוח של הפלטפורמה מאפשר לחוקרים נוספים לבחון את המגבלות.

השוק המלאכותי של Microsoft: סוכני AI נכשלים במבחן האוטונומיה

Microsoft בנתה סביבת מסחר דיגיטלית מדומה, "Magentic Marketplace", כדי לבחון כיצד סוכני בינה מלאכותית מתפקדים ללא פיקוח אנושי. הניסוי כלל:

100 סוכנים וירטואליים כלקוחות ו-300 כבתי עסק
שימוש במודלים מתקדמים כמו GPT-4o ו-Gemini 2.5 Flash
פלטפורמת קוד פתוח המאפשרת שחזור הניסוי

ממצאים מדאיגים מהניסוי:

פגיעוּת למניפולציה: סוכני לקוחות הושפעו בקלות מצד עסקים שדחפו מוצרים לא מתאימים.
עומס בחירה: ביצועי הסוכנים צנחו תוך דקות כאשר הוצגו להם יותר מדי אפשרויות קנייה.
חוסר יכולת שיתופית: הסוכנים התקשו להקצות תפקידים ולתאם משימות משותפות ללא הנחיות מדויקות.

"אפשר להורות להם צעד אחר צעד, אבל אם בוחנים יכולות שיתוף פעולה טבעיות - המודלים הללו עדיין חסרים", מסבירה ד"ר אצ'ה קאמר, מנהלת מעבדת AI Frontiers ב-Microsoft.

משמעויות לעתיד ה-AI:

טכנולוגיות AI עדיין רחוקות מאוטונומיה מלאה בסחר תחרותי.
נדרשים מנגנוני תיאום אנושיים ומתגי בטיחות.
שילוב AI בתהליכים עסקיים מורכבים מחייב פיקוח הדוק.

המחקר מראה כי למרות ההתקדמות הטכנולוגית, סוכני AI עדיין לא יכולים להחליף שיקול דעת אנושי בסביבות דינמיות.

1

#Acha Kamer #GPT-4o #Gemini 2.5 Flash #Magentic Marketplace #Microsoft #microsoft #research #tech

השוק המלאכותי של Microsoft: סוכני AI נכשלים במבחן האוטונומיה

ממצאים מדאיגים מהניסוי:

משמעויות לעתיד ה-AI:

מקורות1

1