Mercor: הסטארט-אפ שמלמד בינה מלאכותית לחשוב כמו מקצוענים – והופך בני 20 למיליארדרים
Mercor הפכה בתוך פחות משלוש שנים מהאק חביב להערכה של 10 מיליארד דולר, באמצעות מודל שמעסיק מומחים כדי ללמד מודלי AI לבצע עבודה מקצועית אמיתית. עם מדד APEX, תמיכת שמות כבדים ותפיסה ברורה של אוטומציה אגרסיבית של עבודת ידע, היא מציבה סטנדרט חדש לשילוב בין בני אדם לבינה מלאכותית.
בעוד רוב הסטודנטים באוניברסיטאות יושבים במרתון לימודים לפני מבחני סוף סמסטר, ברנדן פודי פשוט לא הגיע. לא בגלל זלזול, אלא כי משהו גדול יותר קרה: בתוך כמה חודשים, רעיון שהתחיל כהאק בודד בהאקתון בסאו פאולו הפך לבסיס לאחת מחברות ה-AI הצומחות ביותר בעולם – Mercor. היום, פחות משלוש שנים אחרי, Mercor מוערכת בכ-10 מיליארד דולר, ומייסדיה הפכו למיליארדרים הצעירים בעולם שנבנו מאפס.
מהמועדון לוויכוחים לאימפריית AI
פודי וחבריו המייסדים, Adarsh Hiremath ו-Surya Midha, הכירו בכלל מעולם אחר: נבחרות דיבייט בתיכון. המקום שבו לומדים לפרק טיעון, לבנות לוגיקה מסודרת ולהגן על עמדה מורכבת מול לחץ – בדיוק סוג החשיבה שמודלי AI עדיין מתקשים לחקות באופן עקבי.
ב-2023, בהאקתון בסאו פאולו, הם התחילו בפתרון פשוט יחסית: פלטפורמה שמחברת חברות, בעיקר מארה"ב, עם מפתחים מוכשרים מעבר לים, מטפלת בבירוקרטיה ומשאירה לעצמה עמלה. לקוח ראשון שילם 500 דולר לשבוע על מפתח, המפתח קיבל בערך 70%, Mercor לקחה את השאר.
אבל מהר מאוד הם הבינו שהערך האמיתי שלהם לא רק בגיוס טאלנט, אלא במקום שבו מתבצבת היום אחת השאלות הכי חמות בעולם הטכנולוגיה: מי מלמד את ה-AI איך נראית איכות אמיתית?
ללמד את ה-AI "מה שרק בני אדם יודעים"
בעוד העולם מתלהב מגודל מודלים, מהירות ויכולות כתיבה, Mercor בחרה לכוון למקום אחר: איך מלמדים מודלים שיקול דעת, ניואנס וסטנדרט מקצועי.
המודל העסקי החדש היה חד וברור:
- גיוס מקצוענים אנושיים – יועצים, עורכי דין, בנקאים, רופאים ואנליסטים.
- שימוש בהם כדי לבנות "evals" ורובריקות מפורטות: סדרות משימות והנחיות שמודדות איך מודלי AI מתמודדים עם עבודה אמיתית.
- בדיקה שיטתית של תשובות המודלים מול קריטריונים מקצועיים ברורים.
- הזנת פידבק מובנה חזרה למודלים – כדי לשפר אותם ולהכשיר אותם לעבודה כלכלית בעלת ערך.
במילותיו של פודי: "כולם מסתכלים על מה המודלים יכולים לעשות. ההזדמנות האמיתית היא ללמד אותם את מה שרק בני אדם יודעים – שיפוט, ניואנס וטעם." זו לא עוד סיסמה: זו הצהרת כיוון לכל תעשיית ה-AI.
APEX: מדד פרודוקטיביות במקום מבחן IQ למכונה
בלב הגישה של Mercor עומד מוצר דגל אחד: APEX – ה-AI Productivity Index.
APEX הוא מדד קנייני שבא לענות על שאלה שהופכת קריטית לכל מנהל, משקיע או CTO: לא "כמה המודל חכם" באופן תיאורטי, אלא "כמה כסף הוא יכול לחסוך או לייצר".
במקום חידות מתמטיות או בנצ'מרקים אקדמיים, APEX בוחן מודלים על כ-200 משימות הנגזרות מעבודת היומיום של מקצועות עתירי שכר:
- ניסוח מזכר פיננסי מורכב.
- טיוטת חוזה משפטי עם סעיפים ורגולציה רלוונטיים.
- ניתוח תיק רפואי והצעת כיווני בירור.
- בניית מתווה לניתוח שוק בסגנון ייעוצי.
כדי להבטיח רצינות, Mercor גייסה לקבוצת היועצים שלה שמות כבדים במיוחד, ביניהם:
- Larry Summers – לשעבר שר האוצר האמריקאי.
- Dominic Barton – לשעבר מנכ"ל McKinsey.
- Cass Sunstein – משפטן והוגה בתחומי רגולציה ומדיניות ציבורית.
- Eric Topol – קרדיולוג וחוקר מוביל בתחום הרפואה הדיגיטלית.
הם עזרו לבנות את הרובריקות והקייסים כך שישקפו מציאות, לא תרגיל תיאורטי. או כמו ש-Mercor מסכמת: "נחמד שיש 10,000 דוקטורים בכיס – אבל טוב הרבה יותר שיהיה מודל שיכול לעשות לך את המיסים כמו שצריך."
שוק עבודה חדש: בני אדם כמאמני מכונות
אחד הרעיונות המעניינים ש-Mercor מדגימה בפועל הוא איך נראית תעסוקה בעידן שבו ה-AI אכן מסוגל להחליף חלק עצום מעבודת ה"צווארון הלבן".
הפלטפורמה שלה מאפשרת לחברות להגדיר אלפי מיקרו-משימות להערכה:
- כל משימה מדמה סיטואציה מקצועית מציאותית.
- אנשי מקצוע אנושיים בוחנים את תשובות המודל לפי קריטריונים קשיחים.
- כל ציון הופך לנתון Training מסודר – לא רק "אהבתי/לא אהבתי", אלא פירוק לוגי של איכות.
כך נוצר שוק דו-צדדי חדש:
- כל לקוח תאגידי שמצטרף מייצר ביקוש ליותר evals.
- כל מעריך חדש שמצטרף משפר את איכות המדדים והמודלים.
נוצר "פלייבוק" קלאסי: עוד נתונים → מודלים טובים יותר → יותר לקוחות → יותר הערכות. מבחינת המשקיעים, זו משוואת צמיחה שקשה להתעלם ממנה.
לא להפחדה – לאוטומציה מואצת
פודי לא מתחמק מהשאלה שהכי מטרידה את העובדים: האם Mercor עוזרת ל-AI להחליף אותנו מהר יותר?
התשובה שלו היא כן, אבל גם: חייבים לקבל את זה.
הוא מזכיר את לקחי המהפכה התעשייתית: פעם 75% מהאמריקאים עבדו בחקלאות, היום בערך 1%, והכלכלה רק הפכה עשירה ומגוונת יותר. לדבריו, גם עכשיו:
- "אולי נאוטמט כ-2/3 מעבודות ה-knowledge work," הוא אומר.
- "וזה יהיה מדהים, כי זה יאפשר לנו לעשות דברים כמו לרפא סרטן ולנסוע למאדים."
מבחינתו, שאלת המפתח היא לא "איך מונעים יתרון", אלא:
- איך מוודאים שהשינוי נעשה מהר וחכם.
- איך מגדירים מראש "מה הם הדברים היותר גבוהים וטובים" שבני אדם ישקיעו בהם זמן.
זו תפיסת עולם מאוד סיליקון-וולית, כמעט חסרת סנטימנטים לשימור הסטטוס קוו. אבל היא גם מייצגת היטב את רוח התקופה – במיוחד בעולמות ה-AI שבהם מי שמאיץ קדימה קובע סטנדרט לשוק כולו.
מה ישראלים צריכים ללמוד מ-Mercor
לקהל הישראלי, Mercor היא לא רק סיפור נחמד על dropout שהפך למיליארדר, אלא סוג של מראה:
- היא מדגימה איך סטארט-אפ בתחום AI יכול לייצר ערך אמיתי לא דרך עוד מודל, אלא דרך שכבת האורקסטרציה והאיכות – איפה שהחברות כבר מחפשות ROI ברור.
- היא מצביעה על טרנד שמתחזק: "human-in-the-loop" לא כשלב זמני, אלא כתשתית עסקית. בני אדם שמשמשים כמאמני איכות – מקצוע בפני עצמו.
- היא מחדדת לחברות ישראליות שאם אתם בונים כלי AI, מדדי ביצועים אמיתיים (כמו APEX) יהיו קריטיים כדי להיכנס לאנטרפרייז.
ועבור מפתחים, עורכי דין, יועצים ורופאים כאן: כן, יש תרחיש שבו חלק מהעבודה שלכם יבוצע על ידי מודלים. אבל יש גם תרחיש שבו הניסיון שלכם הוא מה שמלמד את המודלים האלה לעבוד נכון – ותמורת זה, כבר היום, משלמים כסף אמיתי.
יותר מסטארט-אפ: מעבדה לעתיד העבודה
פודי מתאר את Mercor כחלק מ"המהפכה התעשייתית הבאה". זה נשמע גדול, אבל במידה רבה, זה כבר קורה:
- חברות בוחנות מודלים לא רק בשאלות טריוויה, אלא בשאלה: האם אפשר לסמוך עליהם עם תזכיר ללקוח של מיליארדי דולרים?
- סטודנטים, מומחים פרילנסרים ואנשי מקצוע הופכים לחלק ממערך האימון הגלובלי של AI.
- והגבול בין "מי עובד" לבין "מי מאמן את מי" מתחיל להיטשטש.
Mercor ניצבת בדיוק על התפר הזה: חברה שמאמינה באוטומציה אגרסיבית של עבודת ידע – ובו זמנית בונה מודל שמעסיק עוד ועוד בני אדם, כדי ללמד את האוטומציה הזו איך להיראות כמו מקצוענות אנושית.
למי שמחפש להבין לאן הולך שוק העבודה בעידן ה-AI, Mercor היא אחד הסיפורים שחייבים לעקוב אחריהם.