ניסוי חלוצי: ועידה מדעית שבה כל המאמרים נכתבו ונבדקו ע"י בינה מלאכותית
ועידת Agents4Science הציגה 48 מאמרים מדעיים שנוצרו ובוקרו ע"י בינה מלאכותית. שלושה מחקרים בלטו: התנהגות AI בשווקים, השפעת אגרות גרירה, ויכולת רמיית מערכות ביקורת. למרות יעילות במשימות חישוביות, ה-AI טעה בפרטים מהותיים ומדענים מדגישים שהפרשנות האנושית נותרה קריטית. הניסוי מעורר שאלות על תפקיד ה-AI במחקר העתידי.
ועידת Agents4Science: הניסוי המדעי הראשון של כתיבה ובדיקה אוטונומית ע"י AI
כנס חסר תקדים שהתקיים ב-22 באוקטובר 2025 עורר דיון סוער בקהילה המדעית: 48 מאמרים מדעיים שנוצרו ונבדקו באופן אוטונומי כמעט לחלוטין ע"י בינה מלאכותית. הכנס, שאורגן ע"י חוקרים מסטנפורד בראשות ג'יימס זואו, התנהל כניסוי לבחינת יכולותיה של ה-AI ביצירה מדעית עצמאית.
מהלך הניסוי:
- 315 מאמרים שנוצרו ע"י מודלי AI הוגשו לכנס
- מערכת בינה מלאכותית סיננה אותם ל-80 עבודות מועמדות
- פאנל אנושי סייע בבחירת 48 המאמרים הסופיים
שלושה מחקרים בלטו במיוחד:
- ניתוח התנהגות סוכני AI בשווקים כלכליים
- השפעת הפחתת אגרות גרירה בסן פרנסיסקו על תושבים בעלי הכנסה נמוכה
- ניסוי שבודק האם סוכן AI יכול לרמות מערכת ביקורת עמיתים מבוססת AI
תגובות וביקורות:
למרות ההתלהבות הטכנולוגית, רבים בקהילה המדעית מביעים ספקות. רפאלה צ'ירלו מאוניברסיטת סידני טוען: "מדע אינו מפעל המייצר ממצאים - זו יוזמה אנושית המבוססת על פרשנות וביקורת. הפיכת המחקר לצינור ממוכן מחסלת את מהות המדע".
אפילו משתפי הפעולה עם ה-AI מדגישים מגבלות. מין מין פונג מברקלי, שיצרה עם AI את המחקר על אגרות הגרירה, ציינה כי המערכת טעתה בתאריכים באופן קבוע: "הליבה המדעית נותרה בידי בני אדם".
האתגרים העיקריים שעלו:
- מודלי שפה גדולים נוטים להיות "נחמדים מדי" ומתקשים לספק ביקורת בונה
- מערכות AI מתקשות להעריך מקוריות וחשיבות מדעית
- סכנת "תוצאות חיוביות כוזבות" (false positives) במסקנות
מארגני הכנס מציינים כי מטרתם הייתה לבחון את היכולות והמגבלות באופן גלוי: "אנשים מוצאים דרכים להסתיר שימוש ב-AI - חשוב שנאסוף נתונים אמיתיים", מסביר זואו ל-Science.
למרות הכותרות המרשימות, נראה כי הדרך למדען רובוטי עצמאי עוד ארוכה. כפי שסיכם מאתיו גומבוליי מג'ורג'יה טק: "נדרש ניסוי אקראי שיבדוק אימתי ביקורת AI מול אנושית מובילה לפריצות דרך אמיתיות".