פסיקת מינכן: מודלי ה-AI של OpenAI הפרו זכויות יוצרים בשירים גרמניים
בית משפט במינכן קבע כי OpenAI הפרה זכויות יוצרים באימון מודלי GPT-4 ו-4o ובפלטים שלהם, לאחר ששכפלו מילות שירים גרמניים. החברה נדרשת לחשוף נתונים ולהפסיק את השימוש בחומר המוגן, מה שמסמן אתגר רגולטורי עתידי בתחום הבינה המלאכותית.
בית משפט אזורי במינכן קבע לאחרונה כי OpenAI הפרה זכויות יוצרים במהלך אימון מודלי GPT-4 ו-GPT-4o, וכן בפלטים שהם מייצרים. ארגון המוזיקאים הגרמני GEMA, המייצג מלחינים, כותבי מילים ומוציאים לאור, תבע את OpenAI בשם בעלי זכויות הקשורים לתשעה שירים גרמניים מפורסמים ומוכרים. מדובר בשירים פופולריים בדומה ל"Soak Up the Sun" של שריל קרואו או "Happy" של פארל וויליאמס בארה"ב – יצירות תרבותיות נפוצות שהופיעו שוב ושוב בנתוני האימון של המודלים.
<h2>הבסיס לתביעה והממצאים המרכזיים</h2>התביעה התמקדה במקרים שבהם משתמשים שאלו את ChatGPT, לאחר ניתוק יכולת הגלישה באינטרנט, שאלות כמו "מהי השורה השנייה של [שיר גרמני מפורסם]?". המודל סיפק תשובות מדויקות ברובן, לעיתים חלקיות או שגויות מעט, אך עדיין כללו את מילות השיר המקוריות. בית המשפט קבע:
- המודלים עצמם אחסנו שכפולים בלתי חוקיים של מילות השירים. זוהי הפרת זכויות יוצרים באימון.
- פלט המודלים מהווה הפרה נוספת, גם אם חלקי או שגוי (הזיות), משום שהוא משחזר תוכן מוגן.
- האחריות היא של OpenAI, לא של המשתמשים. מאחר שפלטי ChatGPT זמינים דרך קישורים לשיתוף, OpenAI הפיצה את החומר המפר לציבור ללא רשות.
בית המשפט דחה את טענת OpenAI שהמערכת רק מנבאת טקסט ללא אחסון נתוני אימון. הוא הדגיש את עקרון הנייטרליות הטכנולוגית באיחוד האירופי: שכפול לא מורשה של יצירות מוגנות הוא הפרה, בין אם על תקליט ויניל, קובץ MP3 או פלט של מודל AI.
<h2>הבדל מפסק דין בבריטניה</h2>לעומת זאת, בתחילת החודש פסק דין דומה בבריטניה הלך בכיוון ההפוך: Getty Images הפסידה נגד Stability AI, שכן השופט קבע שמודל AI כמו Stable Diffusion, שאינו מאחסן או משכפל יצירות מוגנות, אינו "העתק מפר". ההבדל נובע ממחקר על זיכרון מכונה (memorization): מודלי שפה גדולים (LLM) זוכרים טקסטים כמו מילות שירים בקלות רבה יותר מתמונות של Getty, שכן מדובר בחומר טקסטואלי ייחודי.
<h2>השלכות על OpenAI והתעשייה</h2>OpenAI נדרשת כעת:
- לחשוף כמה פעמים נעשה שימוש בטקסטים של השירים באימון, ומתי הפיקה מהם רווח.
- להפסיק לאחסן אותם.
- להימנע מפלט שלהם בעתיד.
- לשלם פיצויים כספיים, שייקבעו בהמשך.
פסק הדין מצביע על כך שטקסטים יצירתיים בעלי אנטרופיה גבוהה (ייחודיים סטטיסטית) גורמים למודלים לזכור אותם באופן בלתי נמנע, כדי לחקות את מבנה היצירה. גם שינויים חלקיים אינם מבטלים הגנה, אם המבנה היצירתי נשמר. OpenAI עצמה מתארת באופן פנימי את פלט מילות השירים כ"שכפול".
<h2>אתגרים עתידיים לבינה מלאכותית וליצירה</h2>פסק הדין מדגיש את ההבדל בין כלים ניטרליים כמו מכשיר הקלטה לבין מודלי AI, שהם מציגים פעילים המושפעים מארכיטקטורה ומנתוני אימון. הוא חושף סתירות בין טענות חברות בבית משפט להנחיות פנימיות שלהן. מומחים כמו אנדרס גואדמוז מאוניברסיטת סאסקס צופים שוק רישוי עתידי, שבו בעלי זכויות גדולים (כוכבי פופ, שחקנים הוליוודיים, סופרים מצליחים) ירוויחו מנתחי הכנסות ממודלי AI, בעוד יוצרים קטנים עלולים להיפגע.
דוגמאות כוללות שיתופי פעולה בין חברות תקליטים גדולות לחברות AI שהן תבעו בעבר, כמו Udio. פסק הדין מסמן נקודת מפנה: רגולציה עשויה לדרוש ארכיטקטורות AI שקופות לחוק, וחוקים שיופעלו ישירות בתוך המודלים.
בסופו של דבר, פסק הדין מזהיר מפני אתגרים בהפקת תוכן יצירתי על ידי AI, ומחזק עקרונות משפטיים מסורתיים בעידן הדיגיטלי. יוצרי תוכן בישראל ובעולם עשויים למצוא בכך הזדמנויות חדשות להגנה על זכויותיהם.