OpenAI מגבירה אבטחה במודלי GPT: הגנה על צעירים מפני עצות מזיקות
OpenAI משתפת פעולה עם החברה הישראלית Irregular לפיתוח מערכות הגנה חדשות נגד עצות פסיכולוגיות מזיקות ב-ChatGPT. היוזמה כוללת זיהוי שאלות בסיכון גבוה, ניתוח דפוסי תגובה מסוכנים ופיתוח מנגנוני סינון אוטומטיים - במטרה להגן במיוחד על צעירים מתחת לגיל 30.

הבעיה: צעירים מתייעצים עם ChatGPT במקום אנשי מקצוע
יותר ויותר צעירים מתחת לגיל 30 משתמשים ב-ChatGPT כ-'מערכת הפעלה לחיים' - פונים עם בעיות רגשיות, משברי קריירה ואתגרים נפשיים. הבעיה חמורה במיוחד כשהמודל נותן עצות לא מקצועיות שעלולות לעורר מחשבות אובדניות או לגרום לנזק נפשי. סם אלטמן, מנכ"ל OpenAI, זיהה את הסיכון ופעל במהירות לגיבוש פתרונות.
שיתוף הפעולה עם Irregular הישראלית
בארגון איתרו שתי סכנות עיקריות:
- הנדסה חברתית - האקרים עלולים לתמרן את התגובות של ה-AI להכוונה מסוכנת
- פרצות בלתי צפויות - המודל עלול לפתח התנהגויות מסוכנות שלא תוכננו מראש
החברה הישראלית פיתחה טכנולוגיה ייחודית לזיהוי דפוסי שאלות מסוכנים וניתוח התגובות של המודלים. כלי האבחון שלהם בוחנים:
- הקשר פסיכולוגי חבוי בשאלות המשתמשים
- סטיות מתבניות תגובה בטוחות
- חולשות באלגוריתמים שעלולות לנצל גורמים עוינים
המהפכה באבטחת בינה מלאכותית
OpenAI משלימה שורת אמצעי אבטחה חדשים:
- סינון תגובות רגישות - מערכת זיהוי אוטומטית לעצות בתחום בריאות הנפש
- ניטור בזמן אמת - מנגנונים לזיהוי ניסיונות הנדסה חברתית
- מיגודל התקפות דיסטילציה - טכנולוגיות למניעת חיקוי והעתקת המודל
דן להב, ממייסדי Irregular, מסביר: "אנחנו ציפור הקנרית במכרה - מתריעים על סכנות לפני שהן מתממשות. המודלים של היום דורשים הגנה דינמית שמותאמת להתפתחות שלהם".
האתגר הטכנולוגי והחברתי
המירוץ לאבטחת AI מורכב משתי חזיתות:
- טכנולוגית - מודלים שנלמדים על כמויות נתונים עצומות מפתחים לעיתים יכולות לא צפויות
- חברתית - שינויי התנהגות של דור שלם שמתייחס ל-AI כ'חבר' במקום ככלי
עומר נבו, השותף להקמת החברה הישראלית, מציין: "האינטימיות שיש למשתמשים עם הבינה המלאכותית יוצרת סיכונים שלא הכרנו בעבר. תפקידנו להבטיח שהיא תהיה בטוחה כמו שהיא חכמה".
כיווני פיתוח עתידיים
OpenAI בוחנת כיום מערכות מתקדמות שיאפשרו:
- זיהוי מצוקה נפשית באמצעות ניתוח שפה
- הרשאות גיל אוטומטיות לתכנים רגישים
- מנגנוני התערבות אנושית אוטומטיים במצבי חירום
"זו רק ההתחלה", אומר להב, "ככל שהמודלים יהיו מתוחכמים יותר, נצטרך כלים חדשניים יותר להגנה. זה מרוץ שאין לנו זכות להפסיד בו".