AI + MODEL OPTIMIZATION

    ידיעות בינה מלאכותית בנושא MODEL OPTIMIZATION

    תוכנה
    DeepSeek מציגה ארכיטקטורת mHC פורצת דרך לאימון מודלי AI בעלות נמוכה

    DeepSeek מציגה ארכיטקטורת mHC פורצת דרך לאימון מודלי AI בעלות נמוכה

    DeepSeek פרסמה מאמר על ארכיטקטורת mHC לאימון מודלי AI גדולים תוך חיסכון במשאבים. השיטה משדרגת רשתות ResNet קלאסיות ומציגה יציבות ומדרגיות גבוהות יותר, עם ניסויים מוצלחים על מודלים בני עד 27 מיליארד פרמטרים. החיסכון החישובי יסייע לחברה להתחרות מול ענקיות AI אמריקאיות.

    דיסטילציה: הטכניקה שמקטינה את מודלי הבינה המלאכותית ומייצרת אותם בזול

    דיסטילציה: הטכניקה שמקטינה את מודלי הבינה המלאכותית ומייצרת אותם בזול

    טכניקת הדיסטילציה מאפשרת לאמן מודל AI קטן וזול באמצעות מודל גדול ויקר, תוך העברת ידע וחיסכון במשאבים. השיטה מקטינה עלויות פיתוח ומאפשרת הטמעה קלה יותר במכשירים ביתיים, לפי דיווח ב-Wired.