ניסוי חלוצי: ועידה מדעית שבה כל המאמרים נכתבו ונבדקו ע"י בינה מלאכותית

30 באוק׳ 2025, 17:48חדשות1 מקורות

ועידת Agents4Science הציגה 48 מאמרים מדעיים שנוצרו ובוקרו ע"י בינה מלאכותית. שלושה מחקרים בלטו: התנהגות AI בשווקים, השפעת אגרות גרירה, ויכולת רמיית מערכות ביקורת. למרות יעילות במשימות חישוביות, ה-AI טעה בפרטים מהותיים ומדענים מדגישים שהפרשנות האנושית נותרה קריטית. הניסוי מעורר שאלות על תפקיד ה-AI במחקר העתידי.

ניסוי חלוצי: ועידה מדעית שבה כל המאמרים נכתבו ונבדקו ע"י בינה מלאכותית

ועידת Agents4Science: הניסוי המדעי הראשון של כתיבה ובדיקה אוטונומית ע"י AI

כנס חסר תקדים שהתקיים ב-22 באוקטובר 2025 עורר דיון סוער בקהילה המדעית: 48 מאמרים מדעיים שנוצרו ונבדקו באופן אוטונומי כמעט לחלוטין ע"י בינה מלאכותית. הכנס, שאורגן ע"י חוקרים מסטנפורד בראשות ג'יימס זואו, התנהל כניסוי לבחינת יכולותיה של ה-AI ביצירה מדעית עצמאית.

מהלך הניסוי:

315 מאמרים שנוצרו ע"י מודלי AI הוגשו לכנס
מערכת בינה מלאכותית סיננה אותם ל-80 עבודות מועמדות
פאנל אנושי סייע בבחירת 48 המאמרים הסופיים

שלושה מחקרים בלטו במיוחד:

ניתוח התנהגות סוכני AI בשווקים כלכליים
השפעת הפחתת אגרות גרירה בסן פרנסיסקו על תושבים בעלי הכנסה נמוכה
ניסוי שבודק האם סוכן AI יכול לרמות מערכת ביקורת עמיתים מבוססת AI

תגובות וביקורות:

למרות ההתלהבות הטכנולוגית, רבים בקהילה המדעית מביעים ספקות. רפאלה צ'ירלו מאוניברסיטת סידני טוען: "מדע אינו מפעל המייצר ממצאים - זו יוזמה אנושית המבוססת על פרשנות וביקורת. הפיכת המחקר לצינור ממוכן מחסלת את מהות המדע".

אפילו משתפי הפעולה עם ה-AI מדגישים מגבלות. מין מין פונג מברקלי, שיצרה עם AI את המחקר על אגרות הגרירה, ציינה כי המערכת טעתה בתאריכים באופן קבוע: "הליבה המדעית נותרה בידי בני אדם".

האתגרים העיקריים שעלו:

מודלי שפה גדולים נוטים להיות "נחמדים מדי" ומתקשים לספק ביקורת בונה
מערכות AI מתקשות להעריך מקוריות וחשיבות מדעית
סכנת "תוצאות חיוביות כוזבות" (false positives) במסקנות

מארגני הכנס מציינים כי מטרתם הייתה לבחון את היכולות והמגבלות באופן גלוי: "אנשים מוצאים דרכים להסתיר שימוש ב-AI - חשוב שנאסוף נתונים אמיתיים", מסביר זואו ל-Science.

למרות הכותרות המרשימות, נראה כי הדרך למדען רובוטי עצמאי עוד ארוכה. כפי שסיכם מאתיו גומבוליי מג'ורג'יה טק: "נדרש ניסוי אקראי שיבדוק אימתי ביקורת AI מול אנושית מובילה לפריצות דרך אמיתיות".

1

#Agents4Science #Georgia Tech #James Zou #Matthew Gombolay #Min Min Phung #Rafaela Cirlo #Stanford #UC Berkeley #University of Sydney #conference talk #research paper #science

ועידת Agents4Science: הניסוי המדעי הראשון של כתיבה ובדיקה אוטונומית ע"י AI

מהלך הניסוי:

תגובות וביקורות:

האתגרים העיקריים שעלו:

מקורות1

1