טנסנט מציגה גישה מהפכנית: שיפור דגמי AI ללא אימון מחדש

    17 באוק׳ 2025, 0:58חדשות1 מקורות

    חוקרי טנסנט פרסמו טכניקה חדשנית המאפשרת לשיפור מודלי AI באמצעות 'ספריית ניסיון' ללא אימון מחדש. השיטה, המבוססת על אחסון כללים אוטומטיים, חוסכת עד 90% בעלויות חישוב ומאפשרת התאמה מיידית למשימות חדשות. הפרסום עורר דיון בקהילה המדעית על פוטנציאל היישום.

    טנסנט מציגה גישה מהפכנית: שיפור דגמי AI ללא אימון מחדש

    חוקרים בטנסנט (Tencent) פרסמו לאחרונה מחקר פורץ דרך שמציע גישה חדשה לשיפור ביצועי מודלי בינה מלאכותית ללא צורך באימון מחדש (re-training) - מהלך שעשוי לשנות את חוקי המשחק בתחום הלמידה המתמשכת (continual learning).

    השיטה הקיימת: עלות חישובית גבוהה

    כיום, שיטות כמו Group Relative Policy Optimisation (GRPO) משתמשות בלמידת חיזוק (reinforcement learning) כדי לכוונן את הפרמטרים של הדגם. בתהליך זה:

    • הדגם מבצע מספר ניסיונות לביצוע משימה
    • אלגוריתמים מנתחים את הביצועים ומעדכנים את הפרמטרים בהתאם החיסרון הבולט: התהליך דורש משאבים חישוביים עצומים וזמן עיבוד ארוך.

    החידוש של טנסנט: ספריית ניסיון (Experience Library)

    החוקרים מציעים גישה "קלת משקל" בה הדגם:

    1. מזהה כללי הסקה (heuristics) מתהליך GRPO סטנדרטי
    2. מאחסן אותם ב"ספריית ניסיון"
    3. מיישם את הכללים האוטומטית כאשר הוא נתקל במשימות חדשות

    דוגמה לכלל שנוצר אוטומטית: "כאשר פותרים בעיות גאומטריה עם נקודות חיתוך, יש לוודא שהפתרונות נמצאים בתוך אזורים או קטעים תחומים ולא על הרחבות קווים, כדי להימנע מתשובות חיצוניות".

    השלכות ופוטנציאל

    המחקר מציע:

    • חיסכון בעלויות חישוב של עד 90% בהשוואה לשיטות מסורתיות
    • אפשרות להתאמה מיידית למשימות חדשות ללא אימון נוסף
    • פריצת דרך פוטנציאלית בתחומי ה-LLM ויישומי AI ארגוניים

    הפרסום עורר דיון ער בקהילה המדעית לגבי היתכנות היישום בקנה מידה רחב ותקפות הממצאים.

    מקורות

    ידיעות קשורות