מחקר פנימי ב-Anthropic: Claude משמש ל-60% ממשימות המהנדסים, אך רק 20% ניתנים להאצלה מלאה – האם טענות על כתיבת קוד המונית עומדות במבחן המציאות?
חברת Anthropic חקרה את אופן השימוש של 132 מהנדסים במודל Claude: המודל משמש ב-60% מהמשימות, אך רק בין 0%-20% מהן ניתנות להאצלה מלאה. הממצאים מצביעים על יתרונות בפרודוקטיביות לצד חששות מדה-סקילינג ומפגיעה בשיתוף הפעולה האנושי, ומהווים אתגר לטענות על כך ש-90% מהקוד נכתב על ידי AI, וזאת על רקע התחרות עם OpenAI.

רקע: טענות נועזות על בינה מלאכותית בכתיבת קוד
במרץ האחרון, דאריו אמודיי, מייסד שותף ומנכ"ל Anthropic, עורר כותרות כשהכריז כי עד סוף השנה, 90% מקוד התוכנה בארגונים ייכתב על ידי בינה מלאכותית. הצהרה זו עוררה ספקנות רבה, ואמודיי עצמו נסוג ממנה מעט מאוחר יותר, והבהיר כי לא התכוון להיעדר מעורבות אנושית לפני פריסת הקוד. הוא ציין כי בחברתו עצמה, כיום "70, 80, 90% מהקוד" נוגע בבינה מלאכותית, אך השתמש בטווח רחב יותר. טענות אלה הגיעו על רקע תחרות עזה בתחום הבינה המלאכותית, כולל "קוד אדום" שהכריז סם אלטמן, מנכ"ל OpenAI, בעקבות התקדמות של מודלים מתחרים כמו Gemini 3 של גוגל ומודלים של Anthropic.
כדי לבחון כיצד בינה מלאכותית משנה בפועל את עבודת הפיתוח, ערכה Anthropic מחקר פנימי מקיף בקרב עובדיה. המחקר בוחן כיצד 132 מהנדסים וחוקרים בחברה משתמשים במודל Claude, כולל Claude Code – כלי קידוד אוטונומי. הממצאים, שפורסמו בפוסט בלוג רשמי, מצביעים על שימוש נרחב אך מוגבל במודלים, ועל יחסים מורכבים של תקווה וחשש בקרב העובדים. המחקר כולל ראיונות איכותניים מעמיקים עם 53 עובדים, לצד ניתוח נתוני שימוש ב-Claude.
ממצאי המחקר: שימוש יומיומי ב-Claude
על פי הדיווח העצמי של המהנדסים, הם משתמשים ב-Claude לכ-60% ממשימות העבודה שלהם. עם זאת, רק בין 0% ל-20% ממשימות אלה ניתנות להאצלה מלאה למודל, שכן העובדים מרגישים צורך לבדוק ולוודא את התפוקות. השימושים הנפוצים ביותר כוללים:
- דיבוג (תיקון באגים) של קוד קיים – המשימה השכיחה ביותר.
- עזרה בהבנת חלקים בבסיס הקוד – הבנת מבנה הקוד הקיים.
- יישום מאפייני תוכנה חדשים – בשיעור נמוך יותר.
לעומת זאת, שימושים פחות נפוצים:
- תכנון ועיצוב תוכנה ברמה גבוהה.
- משימות מדע נתונים.
- פיתוח ממשק משתמש (front-end).
המהנדסים העדיפו להאציל ל-Claude משימות פשוטות יחסית, חוזרות ונשנות, מייגעות, קלות לאימות, ומשימות שאיכות הקוד בהן אינה קריטית. נתוני השימוש הראו כי 8.6% ממשימות Claude Code היו תיקונים קטנים ("papercut fixes").
אחד הממצאים הבולטים: ללא Claude, כ-27% מהעבודה שהושלמה כיום לא הייתה מתבצעת כלל. זה כולל בניית לוחות מחוונים אינטראקטיביים או כלים לתיקוני קוד קטנים, שאינם משתלמים לביצוע ידני.
השפעות חיוביות: פרודוקטיביות גבוהה יותר וגיוון משימות
העובדים דיווחו על שיפור משמעותי בפרודוקטיביות. הם תיארו עצמם כ"full stack" יותר, כלומר מסוגלים לבצע מגוון רחב יותר של משימות טכניות. Claude אפשר להם להתמקד במיומנויות ברמה גבוהה יותר, כמו עיצוב מוצר ומשתמש, במקום בפרטים טכניים בסיסיים.
דוגמאות מציטוטים:
"ללא Claude, כ-27% מהעבודה שהושלמה לא הייתה קיימת. זה כולל הרחבת פרויקטים או לוחות נתונים נחמדים שלא היו משתלמים ידנית."
חלק מהמהנדסים ציינו כי השימוש במודל מאפשר ביצוע משימות שלא בוצעו בעבר, כמו בניית כלים קטנים לתיקונים מהירים. אחרים הביעו שביעות רצון גבוהה יותר מהעבודה:
"חשבתי שאני נהנה מכתיבת קוד, אבל למעשה אני נהנה רק מהתוצאות שלה."
אחד העובדים ציין כי הוא מוותר בשמחה על "מצב הזן" של קידוד ידני תמורת הפרודוקטיביות הגבוהה יותר.
חששות ודילמות: אובדן כישורים, שיתוף פעולה ומשמעות
למרות היתרונות, המחקר חשף חששות עמוקים. חלק מהמהנדסים חששו מאובדן כישורים:
"עכשיו אני מסתמך על AI כדי להבין כלים חדשים, ולכן חסרה לי מומחיות. בשיחות עם עמיתים, פעם יכולתי להיזכר מיד, עכשיו אני צריך לשאול את AI."
מהנדס בכיר הביע דאגה מיוחדת לגבי מהנדסים זוטרים:
"זה ידרוש מאמץ רב כדי להמשיך ולפתח יכולות עצמאיות במקום לקבל פלט עיוור מהמודל."
חלק מהעובדים דיווחו על תרגול משימות ללא Claude כדי לשמור על כישרונותיהם.
בנוסף, נצפתה ירידה בשיתוף הפעולה האנושי:
"Claude הפך ליעד ראשון לשאלות שהיו מופנות לעמיתים. זה עצוב שאני 'צריך' אותם פחות... אנשים זוטרים פחות באים אליי עם שאלות."
השימוש ב-Claude הוביל גם לדאגות לגבי עתיד התפקידים:
"אני אופטימי לטווח הקצר, אבל לטווח הארוך AI יעשה הכול ויהפוך אותי ואחרים ללא רלוונטיים."
תחושת המשמעות בעבודה הייתה מפוצלת. חלק כינו זאת "סוף עידן":
"תכנות במשך 25 שנה היה חלק מרכזי בסיפוק המקצועי שלי."
"לבלות את היום בהנחיית Claude אינו כיף או מספק."
אחרים היו סלחניים יותר, והעדיפו פרודוקטיביות על פני תהליך הקידוד.
אתגר לטענות של אמודיי והשלכות רחבות
הממצאים מאתגרים את טענותיו של אמודיי. דובר Anthropic ציין כי המדגם קטן (לא סקר מלא של החברה), וכי המחקר לא בדק "כתיבת קוד" כמשימה נפרדת, מה שמונע השוואה ישירה. בנוסף, הגדרות שונות של "האצלה מלאה" מסבכות את הניתוח.
עם זאת, העובדה שהמהנדסים אינם מוכנים להאציל משימות מורכבות או קריטיות, מעידה על מגבלותיו הנוכחיות של Claude. Anthropic זוכה לשבחים על שקיפותה בפרסום ממצאים אלה, גם אם הם סותרים הצהרות של המנכ"ל.
הנושאים העולים – אובדן כישורים, השפעה על שיתוף פעולה, משמעות בעבודה – רלוונטיים לתעשייה כולה. על רקע "קוד אדום" ב-OpenAI, המחקר מדגיש כי אימוץ AI פנימי אינו כוללני כפי שמתואר לעיתים.
מסקנות: שינוי מהותי בעבודת התוכנה
המחקר מראה כי Claude משנה את אופי עבודת התוכנה באופן רדיקלי: יותר פרודוקטיביות וגיוון, אך גם חששות מאובדן כישורים, שיתוף פעולה ומשמעות. העובדים רואים במודל כלי עזר חזק למשימות פשוטות, אך שומרים על שליטה במשימות קריטיות. ממצאים אלה מצביעים על עתיד שבו בינה מלאכותית משלימה את האדם, אך אינה מחליפה אותו לחלוטין – לפחות בשלב זה.
השקיפות של Anthropic מדגישה את החשיבות של מחקרים פנימיים כאלה, שיסייעו לחברות להתמודד עם אתגרי האימוץ. בעולם שבו סם אלטמן ודאריו אמודיי מובילים דיונים על עתיד ה-AI, נתונים אמפיריים כאלה חיוניים להבנת המציאות בשטח.