הסטנדרט הפתוח שמנסה לסדר את כאוס הדאטה: Starburst מצטרפת ל-Open Semantic Interchange

    12 בנוב׳ 2025, 10:39חדשות1 מקורות

    Open Semantic Interchange הוא סטנדרט קוד פתוח חדש לשכבת הסמנטיקה של הדאטה. Starburst מצטרפת ליוזמה שמובלת בידי Snowflake, במטרה לאפשר אינטרופרביליות, להפחית תלות בספק יחיד, לאחד מדדים עסקיים ולהאיץ פרויקטי BI ו-AI עבור ארגונים גלובליים – כולל השוק הישראלי.

    בעולם שבו כל ארגון הוא חברת דאטה בתחפושת, השאלה כבר אינה רק כמה מידע יש לכם – אלא האם מישהו בארגון באמת מבין אותו באותה צורה. כאן נכנס לתמונה Open Semantic Interchange (או בקיצור OSI) – יוזמה חדשה-ישנה שמנסה לפתור אחת הבעיות המעשיות ביותר של דור ה-AI.

    מה זה בכלל Open Semantic Interchange?

    OSI הוא פרויקט קוד פתוח שמובילה Snowflake יחד עם שותפים מהאקוסיסטם של דאטה ו-AI. המטרה: ליצור סטנדרט אחד, פתוח ונייטרלי, להגדרת "סמנטיקה" של דאטה – כלומר:

    • איך מגדירים מדדים עסקיים (Revenue, Churn, DAU וכו').
    • איך מתארים ישויות, טבלאות וקשרים.
    • איך מחזיקים את ההגדרות האלה אחידות בין:
      • כלי BI,
      • מחברות נתונים (Notebooks),
      • פייפלייני Data Engineering,
      • מודלי Machine Learning.

    במילים פשוטות: OSI רוצה להיות "שפת האם" של המשמעות העסקית של הדאטה, כדי שארגון לא יצטרך לתחזק עשר הגדרות שונות ל"לקוח פעיל" בין צוות האנליטיקה, צוות ה-Data Science והמערכות הפיננסיות.

    Starburst מצטרפת: למה זה חשוב?

    Starburst, שנבנתה סביב Trino וממוקמת חזק בעולמות ה-Data Lakehouse, הכריזה כי היא מצטרפת ל-OSI ותסייע לעצב את הסטנדרט. עבור מי שמכיר את האקוסיסטם, זו חתיכת חיזוק רעיוני ומעשי.

    Starburst מתמקדת בגישה לדאטה מפוזר – on-prem, בענן, היברידי – בלי להכריח ארגונים להעתיק הכול למקום אחד. החיבור שלה ל-OSI אומר:

    • אפשרות לשתף ולתרגם מודלים סמנטיים בין פלטפורמות שונות.
    • שימור הקונטקסט העסקי גם כששולפים דאטה ממקורות מרובים.
    • פחות "נעילה לספק" (Vendor Lock-in) סביב שכבת המשמעות.

    דבריו של Justin Borgman, מנכ"ל ומייסד-שותף של Starburst, מחדדים את הכיוון: OSI מוצג כ"עתיד חילופי הדאטה עבור AI" – כזה שמבוסס על סטנדרטים פתוחים, אינטרופרביליות ובחירה חופשית של הלקוחות.

    למה זה רלוונטי לארגונים (וגם לסטארטאפים) בישראל?

    גם בישראל, ארגונים בכל גודל כבר מריצים:

    • מחסני נתונים ב-Snowflake או BigQuery.
    • Lakehouse על גבי S3, ADLS או מערכות מקומיות.
    • כלי BI מגוונים (Looker, Power BI, Tableau).
    • מודלי GenAI ו-ML שזקוקים להגדרות קונסיסטנטיות.

    בלי שכבת סמנטיקה אחידה, מתקבל מצב קלאסי של:

    • שני דשבורדים רשמיים, שתי תשובות שונות לאותה שאלה.
    • מודל ML מאומן על הגדרה אחת של "לקוח פרימיום", בעוד הדוחות הפיננסיים משתמשים בהגדרה אחרת.

    אם OSI יצליח, הוא יכול:

    • להקטין משמעותית חיכוך בין צוותי BI, Data Engineering ו-Data Science.
    • לקצר Time-to-Insight ו-Time-to-AI.
    • להפוך שיתוף מודלים, דוחות ומוצרים נתמכי דאטה בין מערכות – להרבה יותר פשוט.

    במיוחד עבור חברות ישראליות שעובדות גלובלית ומחזיקות דאטה מבוזר בין עננים ואזורים, סטנדרט פתוח ונייטרלי יכול להיות כלי אסטרטגי, לא רק טכני.

    היבט ה-AI: למה סמנטיקה היא תשתית לדור הבא

    מודלי AI מתקדמים – מ-ML קלאסי ועד GenAI – תלויים לא רק בדאטה איכותי, אלא גם בהבנה עקבית של המשמעות שלו. OSI מכוון להיות שכבת הבסיס ש:

    • מאפשרת למודלים לקבל נתונים עם קונטקסט עסקי מוגדר וברור.
    • מצמצמת סיכוני שגיאות בגלל הגדרות לא אחידות.
    • תומכת באימוץ מהיר יותר של כלים חדשים מבלי לשבור את השפה העסקית.

    Snowflake מגדירה את OSI כ"אבן היסוד" לבניית הדור הבא של אפליקציות AI. הצטרפות Starburst מחזקת את המסר שהאקוסיסטם נע לכיוון שבו המשמעות של הדאטה פתוחה, ניידת ולא כבולה לפלטפורמה אחת.

    לאן זה הולך מכאן?

    היוזמה עדיין מתגבשת, אבל הכיוון ברור:

    • קהילה פתוחה שמגדירה יחד את הסכמות הסמנטיות.
    • אינטרופרביליות אמיתית בין ספקי דאטה, BI ו-AI.
    • ארגונים שמקבלים יותר שליטה על שכבת ה"אמת העסקית" שלהם.

    למי שעוקב מישראל אחרי התפתחות הסטנדרטים בדאטה ואינטליגנציה מלאכותית, OSI הוא פרויקט שמומלץ לשים עליו עין – במיוחד אם אתם חולמים על ארגון שבו כל דוח, כל מודל וכל מוצר דיגיטלי משתמשים באותה שפה ברורה ומוסכמת של דאטה.

    מקורות

    ידיעות קשורות