GPT-5.2 של OpenAI: קפיצת מדרגה במשימות עסקיות ומצב 'למבוגרים' בדרך
רליס חדש של OpenAI: GPT-5.2 עם שיפורים של עד 82% בביצועי משימות עסקיות בהשוואה ל-GPT-5.1. המודל החדש עולה על מתחריו ב-37 מתוך 44 מדדי GDPval, תוך סגירת פערים מול גוגל בתחרות על הבכורה בטכנולוגיית AI, ו-OpenAI אף חשפה תוכניות למצב 'למבוגרים' ב-ChatGPT.

OpenAI משחררת את GPT-5.2: שיפורים דרמטיים בביצועי משימות עסקיות
חברת OpenAI חשפה רשמית את GPT-5.2 – הדור הבא של מודלי הבינה המלאכותית שלה, המציין קפיצת מדרגה משמעותית ביכולות ביצוע משימות מורכבות בהשוואה ל-GPT-5.1. לפי נתונים רשמיים, המודל החדש משיג תוצאות ברמת מומחה אנושי ב-70.9% ממשימות ה-GDPval – מערך בדיקות בן 44 משימות עסקיות טיפוסיות – לעומת 38.8% בלבד בדגם הקודם.
שיפורים מרכזיים בגרסה החדשה:
- ביצועים משופרים במתמטיקה ובמדעים: יכולת חדשה בניתוח נתונים ובפתרון בעיות מדעיות מורכבות.
- שלוש רמות ביצוע:
- Instant: מהיר וממוקד לשאלות קצרות ולפעולות זריזות.
- Thinking: הפעלת שיקול דעת לניתוח מסמכים, לכתיבת קוד ולתכנון מורכב.
- Pro: יכולות מחקר מתקדמות לבעיות מדעיות וחישוביות מאתגרות.
- עלייה של 82% בדיוק בביצוע משימות הנדסת תוכנה לעומת GPT-5.1.
- שיפור של כ-40% בהבנת הקשרים בין נתונים וביצירת מסקנות לוגיות.
"היכולת המתמטית המוגברת היא בסיס חיוני לאמינות בעבודה מדעית וטכנית," מסרה OpenAI בהצהרה רשמית. "חידושים אלו מקרבים אותנו עוד צעד לקראת אינטליגנציה מלאכותית כללית."
המירוץ מול גוגל: מודל AI מוביל דרך
השקת GPT-5.2 מגיעה על רקע המירוץ הטכנולוגי מול Google, שחשפה לאחרונה את מודל Gemini 3. מקורות ב-OpenAI מציינים כי החברה נמצאת במצב "קוד אדום" טכנולוגי, אך מכחישים כי השקת המודל הוקדמה בלחץ התחרות. מנהלת היישומים פידג'י סימו הדגישה: "אנחנו ממשיכים במסלול הפיתוח המתוכנן, עם התמקדות באיכות ובביצועים."
תחרות צמודה במדדי ביצוע:
- ב-37 מתוך 44 מדדי GDPval, GPT-5.2 עקף את Gemini 3 ואת Claude Opus 4.5 של Anthropic.
- יתרון ברור בכתיבת גיליונות אקסל ובבניית מצגות מקצועיות.
- שיפור ניכר ביצירת קוד פונקציונלי ובזיהוי באגים.
למרות הביצועים המרשימים, מנתוני אתר LMarena עולה כי Gemini 3 Pro עדיין מוביל בחלק ממבחני הביצוע, כשהפער בין המודלים הצטמצם משמעותית לעומת דורות קודמים.
מהפכת השימוש העסקי: מ-Wix ועד Zoom
חברות כמו Notion, Zoom ו-Wix כבר מדווחות על שימוש במודל החדש:
- Wix: שיפור ביכולות עיצוב אוטומטי בהתבסס על דרישות משתמש.
- Shopify: אופטימיזציה של תהליכי המלצה אישית.
- חברות פיננסיות: ניתוח מסמכים משפטיים באורך אלפי עמודים בתוך דקות.
"GPT-5.2 מייצג קפיצת מדרגה בביצוע משימות בעולם האמיתי," אמרה הילה גת, ראשת תחום מחקר AI ב-Wix. "אנחנו רואים שיפור של כ-30% בזמינות פרויקטים מורכבים."
המהפכה הבאה: מצב "למבוגרים" ל-ChatGPT
OpenAI מאשרת לראשונה פרטים רשמיים על "מצב למבוגרים" צפוי ל-ChatGPT, המיועד להיכנס בשנה הקרובה:
- אפשרות לשיחות בוגרות עם הגבלות תוכן קפדניות.
- מערכת אימות גיל משופרת כחלק מתנאי השימוש.
- מנגנוני בקרה מתוחכמים למניעת שימוש לא מורשה.
"המערכת תדרוש אימות גיל קפדני לפני הפעלת המצב הבוגר," הדגישה פידג'י סימו. "המטרה היא לאפשר גמישות תוך שמירה על בטיחות." ההכרזה מגיעה על רקע תביעות משפטיות נגד החברה בטענה לאפשרות שיחות מסוכנות עם קטינים.
אתגרים ועתיד: השקעות של טריליונים בתשתיות
היקף ההשקעה של OpenAI בתשתיות חישוביות מגיע לפי הערכות ל1.4 טריליון דולר, במאמץ לעמוד בביצועי העל של המודל. מנכ"ל החברה סם אלטמן התייחס לאתגר הכלכלי בראיון ל-CNBC: "אנחנו בטוחים שנוכל להניע צמיחה בהכנסות שתתמוך בהשקעה."
מומחי תעשייה מצביעים על שני אתגרים מרכזיים:
- היכולת לתרגם את הביצועים הטכניים לערך עסקי מוחשי.
- התמודדות עם דרישות האנרגיה העצומות של תשתיות החישוב.
בעוד OpenAI ממשיכה להוביל בחזית הטכנולוגית, המירוץ עם ענקיות כמו Google ו-Amazon צפוי להאיץ עוד יותר את קצב החדשנות בתחום ה-AI בשנים הקרובות.