AI + HONG KONG UNIVERSITY

    ידיעות בינה מלאכותית בנושא HONG KONG UNIVERSITY

    תוכנה
    DeepSeek מציגה ארכיטקטורת mHC פורצת דרך לאימון מודלי AI בעלות נמוכה

    DeepSeek מציגה ארכיטקטורת mHC פורצת דרך לאימון מודלי AI בעלות נמוכה

    DeepSeek פרסמה מאמר על ארכיטקטורת mHC לאימון מודלי AI גדולים תוך חיסכון במשאבים. השיטה משדרגת רשתות ResNet קלאסיות ומציגה יציבות ומדרגיות גבוהות יותר, עם ניסויים מוצלחים על מודלים בני עד 27 מיליארד פרמטרים. החיסכון החישובי יסייע לחברה להתחרות מול ענקיות AI אמריקאיות.