מפת הדרכים החדשה של CNCF: כך נראות תשתיות ה-AI בענן ב-2025
דו"ח חדש של CNCF ו-SlashData ממפה את כלי ה-AI המובילים ל-Inference, Orchestration ו-Agentic AI, ומראה: Triton, Airflow, Metaflow, MCP ו-Llama Stack הופכים לסטנדרט, בעוד פרויקטים כמו A2A ו-Argo צוברים תאוצה. המסקנה: תשתיות Cloud Native הן הבסיס הקריטי ל-AI בפרודקשן.
Cloud Native פוגש GenAI: איך מפת הכלים של CNCF מגדירה את הדור הבא של תשתיות AI
דווקא בשלב שבו ארגונים רודפים אחרי מודלים גדולים, סוכני AI ופתרונות GenAI לכל צורך – הדו"ח החדש של Cloud Native Computing Foundation (CNCF) יחד עם SlashData מזכיר את האמת הפשוטה: בלי תשתית עננית יציבה, סקיילבילית ומודולרית אין AI אמיתי בפרודקשן.
בדו"ח Q4 2025 של CNCF Technology Landscape Radar, שפורסם לרגל KubeCon + CloudNativeCon North America באטלנטה, נותחו חוויות המפתחים וכלי ה-AI המובילים בשלושה תחומים מרכזיים:
- כלים ל-Inference של מודלים
- מערכות Orchestration ל-ML
- פלטפורמות ופרויקטים של Agentic AI
הניתוח מבוסס על יותר מ-300 מפתחים מקצועיים המשתמשים בטכנולוגיות Cloud Native, ומדרג את הכלים לפי היכרות, בשלות, שימושיות ונכונות להמליץ – וממקם אותם בארבע קטגוריות: Adopt, Trial, Assess, Hold.
Inference: Triton ו-BentoML מובילים את הפרודקשן
בקטגוריית כלי ה-Inference, המגמה ברורה: מי שמסוגל לרוץ בקנה מידה גדול, ביעילות ובצמידות לחומרה – זוכה לאמון השוק.
הכלים שקיבלו דירוג "Adopt" (לאמץ כסטנדרט ארגוני):
-
NVIDIA Triton Inference Server – הכוכב הברור.
- מוביל בבשלות: 50% מהמשיבים העניקו 5 כוכבים, ועוד 30% העניקו 4 כוכבים.
- מוביל בשימושיות: 41% דירגו 5 כוכבים, 38% דירגו 4 כוכבים.
- משמש בעיקר בצוותים המתמודדים עם עומסי Inference כבדים ו-Production Workloads קריטיים.
- המסר: Triton כבר מזמן לא רק כלי של "נרדס GPU" – אלא אבן יסוד בארכיטקטורות AI מודרניות.
-
TensorFlow Serving ו-DeepSpeed – מקבלים אמון רחב.
- מאפשרים מסלולי פריסה גמישים, כולל תמיכה במודלים שונים ותצורות מגוונות.
- מתאימים לארגונים שרוצים לשמור על גמישות טכנולוגית לצד יציבות.
-
BentoML – נכנס לרשימת ה-Adopt בצד ה-Inference, אך מדורג "Trial" בתחום ה-Orchestration.
- מלמד על הכוח (והאתגר) של כלים רב-תפקידיים: מצטיינים בתחום אחד, עדיין בדרך לאחרים.
תובנה מפתיעה מגיעה מ-Adlik: למרות שימוש מוגבל יחסית, 92% מהמשתמשים הנוכחיים או לשעבר ממליצים עליו. זהו אות ברור לכך שפתרונות נישתיים – כמו אופטימיזציית מודלים ודיפלוימנט מותאם חומרה – יכולים לבנות קהילות נאמנות גם בלי להוביל בנתחי שוק.
לעומת זאת, כלי בשם "lama" (ככל הנראה פרויקט צעיר) קיבל את דירוגי הבשלות הנמוכים ביותר (23% בלבד), ומסמן לארגונים: לא כל מה שחדש וטרנדי מוכן באמת ל-scale ארגוני.
Orchestration: Airflow ו-Metaflow הופכים לתשתית הדיפולט
עם התפוצצות מספר המודלים, הדאטה פייפליינים וה-Experiments, עולם ה-ML Orchestration הופך קריטי – והנתונים מראים שמספר כלים כבר הפכו לסטנדרט דה-פקטו.
המדורגים "Adopt" בתחום זה:
-
Metaflow – מוביל בבשלות.
- 84% מהמשיבים העניקו לו 4 או 5 כוכבים.
- נתפס ככלי שנבנה "בשביל מפתחים", ומחבר בין מדעני נתונים לתשתיות ללא כאבי ראש מיותרים.
-
Apache Airflow – מוביל בשימושיות ובהמלצות.
- ללא אף דירוג של 1 או 2 כוכבים בשימושיות – נתון נדיר.
- נשאר בחזית בזכות פשטות יחסית, אקו-סיסטם עשיר וקונסיסטנטיות.
כלים נוספים:
- BentoML – כאמור, Trial ב-Orchestration: מראה פוטנציאל, אבל עוד לא מחליף כלים ייעודיים.
- Argo Workflows ו-Kubeflow (שניהם חלק מאקו-סיסטם CNCF) – מדורגים כ-Trial.
- מראים נוכחות חזקה בסביבות Kubernetes-heavy, אך עדיין נדרשת הבשלה לשימוש רוחבי.
- Flyte ו-Seldon Core – מדורגים עם ציוני אמצע, בעיקר 3 כוכבים.
- משדרים: יש בסיס, יש עניין, אבל עדיין יש מקום לבדל את עצמם.
הקו האדום שעובר בין כל הכלים: מי שמספק יציבות, שקיפות ו-fit-for-purpose בונה אמון מפתחים מהר יותר ממי שמצלצל חזק בשיווק.
Agentic AI: MCP ו-Llama Stack בחזית, A2A מסמן פוטנציאל
הדור הבא של מערכות AI כבר לא רק "מודל שעונה על שאלות", אלא ארכיטקטורות Agentic – סוכנים, פרוטוקולים, הקשר, פעולה. כאן ה-CNCF Radar מציע הצצה מרתקת.
שני כלים עברו לקטגוריית "Adopt":
-
Model Context Protocol (MCP) – מוביל בשימושיות (80% נתנו 4–5 כוכבים) ובבסיס המשתמשים.
- מצביע על כך שעיצוב מבוסס סוכנים ופרוטוקולים מובנים כבר מוצא את מקומו בשטח, במיוחד ב:
- תמיכת לקוחות חכמה
- אינטגרציות למערכות תפעוליות
- חיבור בין מודלים, דאטה ושירותים קיימים.
- מצביע על כך שעיצוב מבוסס סוכנים ופרוטוקולים מובנים כבר מוצא את מקומו בשטח, במיוחד ב:
-
Llama Stack – מסמן התבגרות סביב Llama כסטאק ולא רק כמודל.
- מתאים לארגונים שרוצים שליטה טובה יותר בפריסה, בהתאמה ובממשקים.
ובצד המבטיח:
- Agent2Agent (A2A) – עדיין צעיר, פחות בשל, אך זוכה להמלצת 94% מהמשתמשים.
- הדגש פה: הייפ חיובי שמבוסס על פוטנציאל נתפס. הקהילה משדרת אמון בכיוון, גם אם הכלי עדיין לא "סגור".
המסר לשוק הישראלי: פרויקטי Agentic AI כבר לא רעיון ניסיוני בלבד. יש סטנדרטים מתהווים, ויש כלים שהקהילה אומרת עליהם בפירוש: אפשר להתחיל לבנות עליהם.
Cloud Native כבר כאן – גם אם אתם לא קוראים לזה כך
אחד הממצאים החשובים בדו"ח אינו שם של כלי, אלא מגמה תרבותית:
- 41% ממפתחי ה-AI/ML מזהים את עצמם כ-cloud native – והמספר הזה צפוי לעלות.
- אבל גם מי שלא מגדיר את עצמו כך, בפועל נשען על עקרונות Cloud Native:
- קונטיינרים
- Orchestration (במיוחד Kubernetes)
- סקיילביליות אוטומטית
- אמינות, ניטור ואובזרווביליות ברמת פרודקשן.
ה-CNCF מדגישה: אותן תפיסות שבנו את Kubernetes, Prometheus ו-Envoy – הן בדיוק מה שצריך כדי להריץ מודלים, סוכנים ופייפליינים של AI בקנה מידה גדול, בצורה בטוחה ויעילה.
למה זה חשוב לחברות וסטארטאפים בישראל
לצוותי פיתוח, Data ו-ML בארץ, שעסוקים בבניית פתרונות GenAI לשווקים גלובליים, הדו"ח הזה הוא מפת דרכים פרקטית:
- לבחור כלים בקטגוריית "Adopt" כהימור שמרני-חכם לתשתיות ליבה.
- לזהות פרויקטים בקטגוריית "Trial" שבהם שווה להתנסות כדי לבדל את המוצר – אבל לא להמר עליהם לבד בפרודקשן.
- להבין שהמשחק האמיתי הוא באינטגרציה בין Cloud Native ל-AI: בלי Orchestration חכם, ניטור והפרדה ברורה בין שכבות – גם המודל הכי נוצץ יקרוס בעומס.
ה-CNCF, בתמיכת כמעט 800 חברים ותאגידי ענק לצד מאות סטארטאפים, ממשיכה לתפקד כגורם מייצב באקו-סיסטם: מאמצת פרויקטים, מייצרת כנסים בקנה מידה עצום ומספקת לקהילה – כולל כאן בישראל – מצפן טכנולוגי בעולם AI שנמצא בעיצומה של האצה חסרת תקדים.