AI + CLAUDE 4.5

    ידיעות בינה מלאכותית בנושא CLAUDE 4.5

    מודלים מתוסכלים: AI מתקשה בחישובים מתמטיים

    מודלים מתוסכלים: AI מתקשה בחישובים מתמטיים

    מחקר ORCA בחן 5 מודלי AI מובילים ב-500 שאלות מתמטיות. ג'מיני של גוגל ו-Grok-4 (xAI) מובילים עם כ-63% דיוק, אך שיעור הטעויות הממוצע עומד על 40%. רוב הכשלים נובעים מ'חישובים מרושלים' וכשלי לוגיקה. מומלץ לאמת תוצאות קריטיות בכלים מקצועיים.

    עסקים
    קרב הבינות: איזה מודל AI משיג את התשואות הגבוהות ביותר בהשקעות קריפטו?

    קרב הבינות: איזה מודל AI משיג את התשואות הגבוהות ביותר בהשקעות קריפטו?

    ניסוי ראשון מסוגו של Alpha Arena בדק 6 מודלי AI בהשקעת 10,000 דולר כל אחד בשוק קריפטו אמיתי. המודל הסיני DeepSeek מוביל, אחריו Grok של xAI וג'מיני של גוגל אחרון. הביצועים נמדדים לפי תשואה מתואמת סיכון עם שקיפות מלאה. הניסוי מעלה שאלות על יכולת מודלי שפה כלליים מול מערכות ייעודיות להשקעות.