CellWhisperer: העוזר הווירטואלי שמתרגם ביולוגיה מורכבת לצ'אט באנגלית
CellWhisperer הוא כלי AI מבוסס-צ'אט שמקשר בין טקסט לביטוי גנים במיליוני תאים ומעל 20 אלף מחקרים, מאפשר חקר single-cell בשפה טבעית, מזהה מרקרים ותאי מפתח, ומסמן צעד מעשי ראשון לעבר סוכני מחקר חכמים בביולוגיה.

כשהביואינפורמטיקה נפגשת עם צ'אט
עולם חקר התא הבודד (single-cell RNA-seq) התפוצץ בעשור האחרון: אפשר למדוד פעילות גנים במיליוני תאים, למפות איברים שלמים, לזהות תת-סוגי תאים נדירים ולהבין מחלות ברזולוציה שלא דמיינו. אבל יש קאצ' אחד גדול:
כדי להפוך את הררי הנתונים האלה לתובנות, צריך שילוב כמעט בלתי אפשרי של כישורים: ביולוגיה עמוקה, סטטיסטיקה, תכנות, ניתוח נתונים. ברוב המעבדות זו עבודת צוות צפופה – ביולוגים שואלים, ביואינפורמטיקאים מתכנתים, ובדרך הרבה תסכול, תורים ותקשורת חלקית.
כאן נכנס CellWhisperer – כלי AI חדש שפורץ את הגבולות בין טקסט, קוד ונתוני עשרות אלפי ניסויים, והופך אותם לשיחה אחת פשוטה.
מה זה CellWhisperer?
CellWhisperer פותח על ידי קבוצת המחקר של Christoph Bock במרכז CeMM ובאוניברסיטת וינה, ופורסם ב-Nature Biotechnology. מדובר בשיטת AI רב-מודלית (multimodal) ותוכנה חינמית שמחברות בין:
- פרופילי ביטוי גנים מלמעלה ממיליון דגימות חד-תאיות,
- תיאורים טקסטואליים ביולוגיים שנאספו ונוקו בעזרת מודלי AI מתוך מסדי נתונים ציבוריים,
- מודל שפה גדול (LLM) שמדמה בפועל דיון בין ביולוג לביואינפורמטיקאי.
במילים פשוטות: זה צ'אטבוקס חכם שמבין גם את השפה האנושית וגם את הנתונים, ונותן למדענים חוויית עבודה של "קולגה וירטואלי".
המערכת זמינה דרך ממשק וובי ידידותי, המבוסס על הדפדפן הפופולרי CELLxGENE, בכתובת:
https://cellwhisperer.bocklab.org
איך זה עובד בפועל?
CellWhisperer מאפשר לחקור מאגרי ענק של נתוני single-cell באמצעות שאילתות טקסטואליות פשוטות באנגלית. למשל:
"Show me immune cells from the inflamed colon of patients with autoimmune diseases"
מאחורי הקלעים, המודל לומד קשרים בין דפוסי ביטוי גנים לבין תיאורים ביולוגיים, וממפה שאילתת טקסט לשילוב רלוונטי של תאים, רקמות, מצבים ומחלות. משם אפשר להעמיק:
- לשאול אילו גנים פעילים באוכלוסיית תאים מסוימת,
- לבקש הסברים למשמעות הביולוגית של דפוסי הביטוי,
- לזהות תתי-אוכלוסיות, גני מרקר והקשרים למחלות.
ה-LLM המשולב מאומן לחקות דיאלוג אמיתי בין חוקר רטוב לבין ביואינפורמטיקאי. התוצאה: תשובות שמנסות לא רק "להציג נתונים", אלא גם לפרש, להציע כיוונים ולסייע לחשוב איפה כדאי לחפור עמוק יותר.
20,000 מחקרים בתוך עוזר אחד
אחד הנכסים הגדולים של CellWhisperer הוא כמות הידע שעליו הוא נשען. הצוות אימן אותו על נתונים ניסויית מיותר מ-20,000 מחקרים מהשנים האחרונות.
לפי Moritz Schaefer, מחבר-שותף ראשון (כיום ב-Stanford):
"CellWhisperer למד על התפקידים של גנים ותאים מתוך ניסויים אמיתיים, כך שהוא מוכן לנתח נתוני single-cell חדשים במגוון תחומים."
במקום להתחיל עם כל סט חדש מאפס, חוקר יכול להישען על שנים של דאטה ציבורי שנארז לתוך מודל אחד, ולבדוק במהירות:
- האם האוכלוסיות שהוא רואה דומות למה שדווח בעבר,
- אילו גנים מוכרים כגני מרקר ידועים,
- האם צצים מרקרים חדשים ואינדיקציות מפתיעות.
הוכחת יכולת: התפתחות עוברית אנושית
כדי להמחיש את הפוטנציאל, החוקרים הפעילו את CellWhisperer על נתוני single-cell של התפתחות עוברית אנושית. עם שאילתות פשוטות כמו "heart" או "brain", המערכת ידעה:
- לזהות נקודות זמן התפתחותיות רלוונטיות,
- למפות אוכלוסיות תאים ייחודיות ליצירת איברים,
- להדגיש גנים מרקרים מוכרים – וגם מועמדים חדשים שלא קיבלו עד כה תשומת לב.
זו בדיוק הדוגמה לאופן שבו AI לא רק "מאיץ" ניתוח, אלא גם פותח חלונות לגילויים אפשריים, על בסיס חיבורים שלא תמיד אינטואיטיביים לעין האנושית.
צעד לכיוון "סוכן מחקר" אמיתי
Christoph Bock מגדיר את CellWhisperer כחבר צוות חדש:
"Science is teamwork, and with CellWhisperer, an AI research assistant has joined our team."
מבחינה טכנולוגית ותפיסתית, זה צעד משמעותי לכיוון Agents מדעיים – מערכות שמסוגלות:
- להבין מטרת מחקר מילולית,
- לגשת לדאטה רלוונטי,
- לנתח, לפרש ולהציע השערות המשך.
עדיין לא מדובר במערכת שמחליפה מדענים, אלא בכזו שמפנה אותם מההתמודדויות הטכניות אל החלק היצירתי והביקורתי של המדע.
למה זה מעניין במיוחד את קהילת הטק וה-AI בישראל?
לישראלים שעובדים בצומת של AI, בריאות ודאטה – האקוסיסטם המקומי של biotech, digital health ו-genomics – CellWhisperer מצביע על כיוון ברור:
- חיבור עמוק בין מודלי שפה לבין דאטה ביולוגי אמיתי,
- מעבר מכלי ויזואליזציה פסיביים לכלים שיחיים ואינטראקטיביים,
- פוטנציאל לסביבות עבודה שבהן חוקר, מתכנת ו-AI עובדים יחד, במקום בעמודות נפרדות.
לסטארטאפים ישראליים זה גם benchmark ומקור השראה: איך אורזים עשרות אלפי מאגרי ידע מורכבים לכלי אחד אינטואיטיבי, שמדבר "בשפה של המשתמש" – במקרה הזה, ביולוגים. ובדיוק כמו בעולם הקוד (Copilot, Cursor), עכשיו גם בעולם הביולוגי נולדת שכבת AI מעל הנתונים.
CellWhisperer לא פותר את כל האתגרים – יש שאלות של דיוק, פרשנות והצורך בבקרה מדעית קפדנית. אבל הוא מדגים היטב: מודלי AI יכולים להיות הרבה יותר מ"צ'אט חכם" – הם יכולים להיות שער אינטראקטיבי לדאטה מדעי עמוק, ולזרז את קצב הגילוי.