כישלון בינה מלאכותית: מומחים אנושיים לא מתרשמים מכנס מדעי ראשון מסוגו

2 בנוב׳ 2025, 16:26חדשות1 מקורות

כנס Agents4Science 2025 הציג מחקרים שנכתבו ע"י AI ככותבים ראשיים. התוצאות חשפו חולשות מהותיות: הזיות אקדמיות, קושי בשמירת הקשר מחקרי ותלות מוחלטת בבקרה אנושית. למרות יכולות עיבוד הנתונים המרשימות, ה-AE עדיין לא מצליחים להחליף חוקרים אנושיים במשימות מדעיות מורכבות.

כישלון בינה מלאכותית: מומחים אנושיים לא מתרשמים מכנס מדעי ראשון מסוגו

AI כותבים מחקרים מדעיים - והתוצאה מאכזבת

כנס Agents4Science 2025 שנערך השבוע היווה ניסוי חסר תקדים: 47 מאמרים מדעיים שנכתבו בשיתוף פעולה בלעדי עם מערכות בינה מלאכותית, כאשר מודלים כמו ChatGPT, Claude ו-Gemini מופיעים ככותבים ראשיים.

הכישלונות הבולטים:

אובדן הקשר מדעי: ה-AI התקשו לעקוב אחרי רצף המחקר, ולא שמרו על עדכון מסמכים תומכים באופן עקבי
הזיות אקדמיות: מערכת Gemini של גוגל "המציאה" מקורות מחקר בניתוח מדיניות גרירת רכבים בסן פרנסיסקו
קוד ותוכן מיותר: בוטים יצרו קטעי קוד כפולים וטקסטים חוזרים ללא ערך מוסף
תלות מוחלטת בבני אדם: החוקרים מברקלי נאלצו להתערב שוב ושוב כדי למנוע טעויות קריטיות

"זו תמונת מצב חשובה", מסביר ג'יימס זואו מאוניברסיטת סטנפורד, אחד ממארגני הכנס. "למרות השיפורים המשמעותיים, עדיין חסרות ל-AI יכולות בסיסיות של הסקת מסקנות מדעיות אמינות".

הכנס חשף אתגרים קריטיים כאשר 300 הצעות מחקר הוגשו על ידי צוותים שכללו חוקרים אנושיים לצד סוכני AI, אך רק 47 עברו את הסף הדרוש. המחקרים המוצלחים יותר התאפיינו בשיתוף פעולה הדוק, בו בני אדם סיפקו ל-AI הנחיות מפורטות ובקרות קפדניות.

1

#Agents4Science #Berkeley #ChatGPT #Claude #Gemini #James Zou #Stanford #academia #conference #research #science

AI כותבים מחקרים מדעיים - והתוצאה מאכזבת

הכישלונות הבולטים:

מקורות1

1