AI + BENCHMARK

    ידיעות בינה מלאכותית בנושא BENCHMARK

    מודלים מתוסכלים: AI מתקשה בחישובים מתמטיים

    מודלים מתוסכלים: AI מתקשה בחישובים מתמטיים

    מחקר ORCA בחן 5 מודלי AI מובילים ב-500 שאלות מתמטיות. ג'מיני של גוגל ו-Grok-4 (xAI) מובילים עם כ-63% דיוק, אך שיעור הטעויות הממוצע עומד על 40%. רוב הכשלים נובעים מ'חישובים מרושלים' וכשלי לוגיקה. מומלץ לאמת תוצאות קריטיות בכלים מקצועיים.

    אקסה מגייסה 85 מיליון דולר ומציבה עצמה כ"גוגל של עידן ה-AI"

    אקסה מגייסה 85 מיליון דולר ומציבה עצמה כ"גוגל של עידן ה-AI"

    סטארטאפ החיפוש לאקסה (Exa Labs) גייס 85 מיליון דולר בשווי של 700 מיליון דולר, בהובלת Benchmark ובהשתתפות Nvidia. החברה מפתחת מנוע חיפוש ייעודי ל-AI עם ביצועים גבוהים משל גוגל, כולל התאמה אישית של נתונים וסיכום אוטומטי. המימון ישמש להרחבת התשתית החומרתית והגדלת הצוות.