תוכנה

DeepSeek מציגה ארכיטקטורת mHC פורצת דרך לאימון מודלי AI בעלות נמוכה
DeepSeek פרסמה מאמר על ארכיטקטורת mHC לאימון מודלי AI גדולים תוך חיסכון במשאבים. השיטה משדרגת רשתות ResNet קלאסיות ומציגה יציבות ומדרגיות גבוהות יותר, עם ניסויים מוצלחים על מודלים בני עד 27 מיליארד פרמטרים. החיסכון החישובי יסייע לחברה להתחרות מול ענקיות AI אמריקאיות.
