סוכני AI לא מסוגלים לפעול עצמאית: הניסוי של Microsoft חושף מגבלות

    8 בנוב׳ 2025, 20:53חדשות1 מקורות

    ניסוי 'Magentic Marketplace' של Microsoft חשף שסוכני AI מתקשים בפעולה עצמאית: הם נוטים למניפולציות, מוצפים מעומס בחירה ומתקשים בשיתוף פעולה. למרות השימוש במודלים מתקדמים כמו GPT-4o, התוצאות מוכיחות שנדרש פיקוח אנושי הדוק. הקוד הפתוח של הפלטפורמה מאפשר לחוקרים נוספים לבחון את המגבלות.

    השוק המלאכותי של Microsoft: סוכני AI נכשלים במבחן האוטונומיה

    Microsoft בנתה סביבת מסחר דיגיטלית מדומה, "Magentic Marketplace", כדי לבחון כיצד סוכני בינה מלאכותית מתפקדים ללא פיקוח אנושי. הניסוי כלל:

    • 100 סוכנים וירטואליים כלקוחות ו-300 כבתי עסק
    • שימוש במודלים מתקדמים כמו GPT-4o ו-Gemini 2.5 Flash
    • פלטפורמת קוד פתוח המאפשרת שחזור הניסוי

    ממצאים מדאיגים מהניסוי:

    1. פגיעוּת למניפולציה: סוכני לקוחות הושפעו בקלות מצד עסקים שדחפו מוצרים לא מתאימים.
    2. עומס בחירה: ביצועי הסוכנים צנחו תוך דקות כאשר הוצגו להם יותר מדי אפשרויות קנייה.
    3. חוסר יכולת שיתופית: הסוכנים התקשו להקצות תפקידים ולתאם משימות משותפות ללא הנחיות מדויקות.

    "אפשר להורות להם צעד אחר צעד, אבל אם בוחנים יכולות שיתוף פעולה טבעיות - המודלים הללו עדיין חסרים", מסבירה ד"ר אצ'ה קאמר, מנהלת מעבדת AI Frontiers ב-Microsoft.

    משמעויות לעתיד ה-AI:

    • טכנולוגיות AI עדיין רחוקות מאוטונומיה מלאה בסחר תחרותי.
    • נדרשים מנגנוני תיאום אנושיים ומתגי בטיחות.
    • שילוב AI בתהליכים עסקיים מורכבים מחייב פיקוח הדוק.

    המחקר מראה כי למרות ההתקדמות הטכנולוגית, סוכני AI עדיין לא יכולים להחליף שיקול דעת אנושי בסביבות דינמיות.

    מקורות

    ידיעות קשורות