AWS משיקה תשתיות חדשניות ל-AI: עד 85% האצה באימון מודלים וחיסכון של מאות אלפי דולרים
לפני כחודש•חדשות•1 מקורות
AWS משיקה תשתיות AI חדשניות הכוללות SageMaker HyperPod לשיפור יעילות אימון מודלים, רשתות 10p10u עם פרוטוקול SIDR מהיר פי 10, ומעבדי Blackwell ו-TrainIUM. החידושים מביאים לחסכון של עד 200,000$ ליום, האצת אימונים ב-85%, ויכולת אימון מודלים בקנה מידה חסר תקדים.

מהפכת התשתיות של AWS: איך ענקית הענן מתמודדת עם אתגרי ה-AI
עם המעבר של ארגונים מניסויי AI לפריסות ייצור בקנה מידה, דרישות התשתיות הגיעו למימדים חסרי תקדים. AWS משיקה סדרת פתרונות מתקדמים להתמודדות עם אתגרי החישוב, הרשת והאמינות:
SageMaker HyperPod: מהפכה בניהול אימון מודלים
- חוסכים עד $200,000 ליום באימון על 16,000 GPU באמצעות יכולות שחזור אוטומטיות
- תפריטי הדרכה ל-30+ מודלים מובילים כולל Llama ו-Mistral עם קונפיגורציה אוטומטית
- טכנולוגיית Managed Tiered Checkpointing מקצרת זמני שחזור ב-42%
משחקים בגדול: רשתות AI מדור חדש
- 10p10u Infrastructure:
- 3 מיליון חיבורי רשת חדשים ב-2024
- תמיכה ביותר מ-20,000 GPU עם פחות מ-10 מיקרו-שניות השהייה
- פרוטוקול SIDR החדש מגיב לשינויים בתוך שניה אחת - פי 10 מטכנולוגיות קיימות
כוח חישוב מותאם AI
- מעבדי Blackwell של NVIDIA ב-P6 instances עם 1.4TB זיכרון GPU
- האצה של 85% בזמני אימון (נבדק ב-JetBrains)
- AWS Trainium - שבב מותאם ML עם ארכיטקטורת systolic array ייחודית
- אפשרות הזמנה מראש של משאבי EC2 עד 6 חודשים
"AI יכול להיות רק טוב כמו התשתית עליו הוא בנוי", מסביר בארי קוקס, VP Technology ב-AWS. "המחויבות שלנו היא לספק את הבסיס לפריצות הדרך הבאות בבינה מלאכותית".
מקורות

Powering innovation at scale: How AWS is tackling AI infrastructure challenges - Amazon Web Services
לפני כחודש•Amazon Web Services (AWS)