תאי דמה, מדדים אמיתיים: המחקר שמחזיר אמון ב-AI לביולוגיה של ההזדקנות

    12 בנוב׳ 2025, 10:33חדשות1 מקורות

    מחקר חדש של Shift Bioscience מראה שמודלי AI Virtual Cells כן עובדים – כשהם נמדדים נכון. מסגרת כיול מדדים משופרת חושפת ביצועים העוקפים baselines פשוטים ומחזירה את האמון ב-AI ככלי מרכזי לאיתור מטרות גנטיות ולהאצת מחקר ההזדקנות.

    תאי דמה, מדדים אמיתיים: המחקר שמחזיר אמון ב-AI לביולוגיה של ההזדקנות

    בעוד ש-AI כבר שינתה את האופן שבו אנחנו כותבים קוד, מפתחים מוצרים ומנהלים תשתיות, אחד התחומים השאפתניים ביותר – "תאי דמה" (AI Virtual Cells) – סבל בחודשים האחרונים מיחסי ציבור בעייתיים. כמה מאמרים אקדמיים הציגו תמונה מדאיגה: מודלים שאמורים לנבא כיצד תא יגיב לשינויים גנטיים לא הצליחו לעקוף אפילו baseline סטטיסטי פשוט.

    כעת, מחקר חדש של Shift Bioscience מציע פרשנות שונה לגמרי: הבעיה לא הייתה במודלים, אלא בסרגל המדידה.

    מה זה בעצם AI Virtual Cells?

    מודלים של "תאי דמה" מנסים לחזות כיצד תא מגיב לשינויים כמו העלאה או הורדה של ביטוי גנים שונים. במקום להריץ אינסוף ניסויים ביולוגיים יקרים וממושכים, אפשר להריץ סימולציות in silico, לזהות מטרות גנטיות מבטיחות, ואז להתמקד רק בניסויים הרלוונטיים.

    במיוחד חשובים כאן מודלי "genetic perturbation" – מודלים החוזים את תגובת התא להפרעות גנטיות שונות. אלא שב-literature האחרון נטען כי מודלים כאלה לעיתים קרובות אינם עולים על ממוצעים נאיביים או מודלים ליניאריים פשוטים.

    Shift Bioscience: אתם מודדים אותנו לא נכון

    הצוות של Shift Bioscience בחן מחדש את אופן ההערכה וגילה תובנה קריטית: מדדי הביצועים הנפוצים פשוט אינם מכוילים מספיק לסוג הנתונים ולחוזק ההפרעות.

    במיוחד ב-datasets עם הפרעות חלשות, חלק מהמדדים מתקשים להבדיל בין תחזית איכותית לבין תחזית חסרת מידע. התוצאה: הדירוג של המודלים נראה גרוע – גם כאשר הם בפועל מזהים אותות ביולוגיים משמעותיים.

    החוקרים בנו מסגרת חדשה לכיול מדדים והשתמשו ב-14 מערכי נתונים של Perturb-seq כדי לזהות מדדים מבוססי דירוג ומודעות ל-DEG (Differentially Expressed Genes), שמסוגלים לשקף נאמנה את איכות התחזית.

    כשמודדים נכון – ה-AI מנצח

    לאחר יישום המסגרת החדשה, התמונה התהפכה:

    • המודלים של AI Virtual Cells עקפו בעקביות baselines כמו ממוצע, קבוצות ביקורת ומודלים ליניאריים.
    • נמצא שהם מצליחים לזהות אותות ביולוגיים רלוונטיים גם בתנאים מאתגרים.
    • הטענות הקודמות על "כישלון" המודלים נראות כעת כתוצר של מדדים לא מותאמים, ולא של חוסר יכולת אמיתית.

    למה זה חשוב גם לנו?

    עבור קהילת ה-AI והביוטק – כולל חוקרים וחברות סטארט-אפ ישראליות – המשמעות ברורה:

    • אפשר לחזור לקחת ברצינות מודלי Virtual Cells ככלי להאצת גילוי מטרות טיפוליות.
    • כיול מדדים אינו פרט טכני שולי, אלא תנאי הכרחי לפני שמכריזים שמודל "לא עובד".

    כפי שמסכם Henry Miller, ראש תחום ה-ML ב-Shift, העבודה הזו פותחת את הדלת לשימוש רחב יותר ב-AI Virtual Cells ותומכת באמון בהם כמנוע מפתח בתוכניות לעיכוב הזדקנות ושיקום תאים.

    מקורות

    ידיעות קשורות