אדובי נתבעת: חשד לשימוש בספרים פיראטיים לאימון מודלי AI
חברת Adobe עומדת בפני שתי תביעות משפטיות בגין שימוש לא מורשה לכאורה ביצירות ספרותיות מוגנות בזכויות יוצרים לאימון מודל ה-AI שלה, SlimLM. הסופרת אליזבת ליון מובילה את התביעה הייצוגית, בטענה שהחברה השתמשה בספרים פיראטיים ממערך Books3 באמצעות SlimPajama – מאגר נתונים נגזר. התביעה דורשת פיצויים, מניעת שימוש נוסף בהעתקים המפרים והשמדתם, ומזכירה מקרים דומים נגד Anthropic וחברות אחרות.

מבוא: אדובי בפני אתגר משפטי חדש
חברת Adobe עומדת בפני שתי תביעות ייצוגיות שהוגשו על ידי סופרים בארצות הברית, בהאשמות על שימוש לא מורשה בספרים מוגנים בזכויות יוצרים לצורך אימון מודלי בינה מלאכותית שלה. התביעות, שהוגשו במחוז הצפוני של קליפורניה, מצטרפות לגל תביעות דומות נגד חברות טכנולוגיה גדולות כמו Anthropic, Apple ו-Meta.
פרטי התביעה: טענות להפרת זכויות יוצרים בקנה מידה נרחב
במרכז התביעה עומדת הסופרת אליזבת ליון (Elizabeth Lyon) מאורגון, המתוארת כ"נציגת המעמד" של בעלי זכויות יוצרים אמריקאים. הטענה המרכזית היא ש-Adobe השתמשה בספרים פיראטיים—כולל ספריה של ליון עצמה—כדי לאמן את מודל ה-SlimLM שלה, שמיועד למשימות עיבוד מסמכים במכשירים ניידים.
לפי כתב התביעה, Adobe אימנה את המודל שלה באמצעות מערך נתונים בשם SlimPajama-627B—גרסה "מנוקה" של מערך RedPajama אשר מכיל בתוכו את Books3, אוסף שנוי במחלוקת של כ-191,000 ספרים שהורדו באופן לא חוקי. בבית המשפט נטען ש-Adobe:
- השתמשה ביצירות המוגנות ללא רשות או תשלום
- שמרה עותקים של הספרים הפיראטיים בשרתיה
- הטמיעה מידע מהיצירות בפרמטרים של המודלים עצמם
Books3: מאגר הנתונים השערורייתי שמסעיר את עולם ה-AI
האוסף Books3, שמוזכר בתביעה נגד Adobe, הפך למוקד מחלוקת מרכזי בעולם הבינה המלאכותית. מקורו במאגר ביבליותק (Bibliotik)—אתר שיתוף קבצים פרטי—וכולל עשרות אלפי יצירות ספרותיות ועיוניות שטרם הפכו לנחלת הכלל.
Books3 הוזכר בתביעות נגד חברות נוספות:
- Anthropic: הגיעה להסדר תשלום חסר תקדים של 1.5 מיליארד דולר בגין שימוש בספרים פיראטיים לאימון Chatbot Claude
- Apple: הואשמה בשימוש בספרים מאוסף זה לאימון מודל ה-OpenELM (הבסיס ל-Apple Intelligence)
- Meta: מתמודדת עם תביעה דומה הקשורה למודלי ה-LLaMA שלה
ההשלכות: אבן דרך במאבק המשפטי סביב אימון AI
התביעה נגד Adobe מייצגת נקודה משמעותית במאבק המשפטי הגובר סביב אימון מודלי AI, מכמה סיבות:
-
מיקוד במודלים קטנים (SLM): בניגוד לתביעות קודמות שהתמקדו ב-LLM (מודלים גדולים), כאן מדובר במודל המותאם למכשירים ניידים—אינטגרציה שפחות קלה לזיהוי.
-
השימוש בנתונים נגזרים: מערך SlimPajama שווק כ"מערכת מנוקה", ובכל זאת נטען כי הוא שומר על תוכן מפר זכויות יוצרים ממקורות קודמים.
-
דרישה להשמדת נתונים: מעבר לפיצויים כספיים, התובעים דורשים מבית המשפט להורות על השמדת כל העותקים של הספרים הפיראטיים ובסיסי הנתונים המפרים.
בין הסעדים המבוקשים:
- הכרזה על הפרת זכויות יוצרים
- פיצויים סטטוטוריים (שעשויים לגדול משמעותית עבור מאות אלפי יצירות)
- מניעת שימוש עתידי בנתונים המפרים
- צווים שיסיגו שימוש מסחרי בטכנולוגיות שהוכשרו באמצעות חומר מוגן
התגובות הצפויות והשלכות עתידיות
הצלחה בתביעה זו עשויה ליצור תקדים משמעותי שיאלץ חברות AI להוכיח את מקוריות נתוני האימון שלהן. התפתחויות אלו מחזקות את הקריאות מצד רגולטורים ויוצרים להקמת מנגנוני רישוי והסכמה ברורים לאיסוף ומיון נתונים לאימון AI.
לסיכום, המקרה נגד Adobe מדגיש את המתחים הגוברים בין קידמה טכנולוגית לזכויות יוצרים בעידן ה-AI. התוצאה עשויה להשפיע לא רק על Adobe, אלא על כל התעשייה הממהרת לשלב יכולות בינה מלאכותית במוצרים צרכניים.