טנסנט מציגה גישה מהפכנית: שיפור דגמי AI ללא אימון מחדש
חוקרי טנסנט פרסמו טכניקה חדשנית המאפשרת לשיפור מודלי AI באמצעות 'ספריית ניסיון' ללא אימון מחדש. השיטה, המבוססת על אחסון כללים אוטומטיים, חוסכת עד 90% בעלויות חישוב ומאפשרת התאמה מיידית למשימות חדשות. הפרסום עורר דיון בקהילה המדעית על פוטנציאל היישום.

חוקרים בטנסנט (Tencent) פרסמו לאחרונה מחקר פורץ דרך שמציע גישה חדשה לשיפור ביצועי מודלי בינה מלאכותית ללא צורך באימון מחדש (re-training) - מהלך שעשוי לשנות את חוקי המשחק בתחום הלמידה המתמשכת (continual learning).
השיטה הקיימת: עלות חישובית גבוהה
כיום, שיטות כמו Group Relative Policy Optimisation (GRPO) משתמשות בלמידת חיזוק (reinforcement learning) כדי לכוונן את הפרמטרים של הדגם. בתהליך זה:
- הדגם מבצע מספר ניסיונות לביצוע משימה
- אלגוריתמים מנתחים את הביצועים ומעדכנים את הפרמטרים בהתאם החיסרון הבולט: התהליך דורש משאבים חישוביים עצומים וזמן עיבוד ארוך.
החידוש של טנסנט: ספריית ניסיון (Experience Library)
החוקרים מציעים גישה "קלת משקל" בה הדגם:
- מזהה כללי הסקה (heuristics) מתהליך GRPO סטנדרטי
- מאחסן אותם ב"ספריית ניסיון"
- מיישם את הכללים האוטומטית כאשר הוא נתקל במשימות חדשות
דוגמה לכלל שנוצר אוטומטית: "כאשר פותרים בעיות גאומטריה עם נקודות חיתוך, יש לוודא שהפתרונות נמצאים בתוך אזורים או קטעים תחומים ולא על הרחבות קווים, כדי להימנע מתשובות חיצוניות".
השלכות ופוטנציאל
המחקר מציע:
- חיסכון בעלויות חישוב של עד 90% בהשוואה לשיטות מסורתיות
- אפשרות להתאמה מיידית למשימות חדשות ללא אימון נוסף
- פריצת דרך פוטנציאלית בתחומי ה-LLM ויישומי AI ארגוניים
הפרסום עורר דיון ער בקהילה המדעית לגבי היתכנות היישום בקנה מידה רחב ותקפות הממצאים.