DeepSeek ו-ByteDance משדרגים את המודלים הבינה המלאכותית עם גרסאות חדשות

    לפני כשעתייםהשקה3 מקורות

    DeepSeek הסינית שדרגה את מודל הבינה המלאכותית שלה ל-V3.1 עם שיפורי ביצועים וניהול עלויות API, בעוד ByteDance (בעלי TikTok) שחררו מודל קוד-פתח Seed-OSS-36B בעל ביצועים תחרותיים במימדים קטנים יחסית. המהלכים מדגימים את התחרות הגוברת בתחום ה-AI הסיני.

    DeepSeek ו-ByteDance משדרגים את המודלים הבינה המלאכותית עם גרסאות חדשות

    שדרוג משמעותי ל-DeepSeek: הגדלת מהירות וחסכון בעלויות

    חברת הסטארט-אפ הסינית DeepSeek חשפה את הגרסה החדשה DeepSeek-V3.1, הכוללת שיפורים בולטים:

    • שיפור במבנה ה-Inference: ארכיטקטורת Hybrid חדשה המאיצה את מהירות העיבוד
    • יכולות Agent מתקדמות: כלים משופרים לביצוע משימות מורכבות
    • שינוי תמחור API: עלויות משימוש במודל יעודכנו החל מ-6 בספטמבר - ללא פירוט מספרי

    ByteDance נכנסת חזק לשוק המודלים הקוד הפתוח

    בעוד DeepSeek מתמקדת בשדרוג המודל הסגור, TikTok-owner ByteDance שחררה מודל חדשני בשוק הקוד הפתוח:

    • Seed-OSS-36B: מודל בעל 36 מיליארד פרמטרים בלבד - קטן משמעותית ממתחרים סיניים
    • פיצ'רים מתקדמים: עיבוד הקשר ארוך-טווח (long-context) ויכולות הנמקה מרשימות
    • ביצועים תחרותיים: לפי נתוני החברה, עולה על מודלים דומים של אליבאבעובאץ', גוגל ו-OpenAI בבדיקות בנצ'מרק

    החלטת ByteDance לשחרר קוד פתוח מצטרפת למגמת ההאצה של AI בסין, המנסה לצמצם את הפער מול ארה"ב דרך שיתוף ידע בקהילת המפתחים.

    מקורות