Articles tagged with claude 4.5 | FOMO AI

מודלים מתוסכלים: AI מתקשה בחישובים מתמטיים

מחקר ORCA בחן 5 מודלי AI מובילים ב-500 שאלות מתמטיות. ג'מיני של גוגל ו-Grok-4 (xAI) מובילים עם כ-63% דיוק, אך שיעור הטעויות הממוצע עומד על 40%. רוב הכשלים נובעים מ'חישובים מרושלים' וכשלי לוגיקה. מומלץ לאמת תוצאות קריטיות בכלים מקצועיים.

חדשות•31 בדצמ׳ 2025, 12:52•2 מקורות

עסקים

קרב הבינות: איזה מודל AI משיג את התשואות הגבוהות ביותר בהשקעות קריפטו?

ניסוי ראשון מסוגו של Alpha Arena בדק 6 מודלי AI בהשקעת 10,000 דולר כל אחד בשוק קריפטו אמיתי. המודל הסיני DeepSeek מוביל, אחריו Grok של xAI וג'מיני של גוגל אחרון. הביצועים נמדדים לפי תשואה מתואמת סיכון עם שקיפות מלאה. הניסוי מעלה שאלות על יכולת מודלי שפה כלליים מול מערכות ייעודיות להשקעות.

ניתוח•19 באוק׳ 2025, 21:37•1 מקורות

AI + CLAUDE 4.5

מודלים מתוסכלים: AI מתקשה בחישובים מתמטיים

קרב הבינות: איזה מודל AI משיג את התשואות הגבוהות ביותר בהשקעות קריפטו?