סופר ארכיטקטורה לסופר AI: כך הקימה מטריקס את תשתית מחשוב-העל של doubleAI

מרוץ החימוש ל-AI

העולם ידע מהפכות, אבל שום דבר לא הכין את השוק למהפכת ה-AI.

בתוך חודשים ספורים, הבינה המלאכותית הפכה מהבטחה רחוקה במעבדות המחקר לכלי עבודה קריטי שמשנה תעשיות מקצה לקצה.

וכמו תמיד, מאחורי טרנדים נוצצים בסושיאל ובאזז מטורף, מסתתרת מציאות פיזית מורכבת:

ה-AI הוא "צרכן רעב" בצורה קיצונית. הוא דורש כוח עיבוד, אנרגיה ורוחב פס בהיקפים שלא נבראו.

וכך, הגענו למצב בו האתגר הגדול ביותר של חברות הטכנולוגיה הוא כבר לא רק כתיבת הקוד – חזרנו לתשתיות. פיתוח AI מתקדם דורש חוות שרתים (Data Centers) שמסוגלות לעמוד בעומסי חום אדירים, צריכת חשמל מסיבית והעברת נתונים במהירות האור. ללא תשתית פיזית וארכיטקטונית מושלמת, גם האלגוריתם המבריק ביותר ייעצר בצוואר הבקבוק של החומרה.

כאן נכנסת מטריקס לתמונה. בתקופה שבה כולם מדברים על מה ה-AI יודע לעשות, קיבלנו הזדמנות ייחודית, לשמש בתקופה מכרעת כ- Enablers שמניחים את היסודות. היכולת של מטריקס לקחת פרויקט קצה מורכב, לתכנן לו ארכיטקטורה מאפס ולפרוס תשתיות שמאפשרות למחשבי-על לעבוד בשיא התפוקה, היא זו שהופכת חזון של סטארט-אפ למציאות עובדת.

doubleAI: לפצח את קוד ה-Super intelligence

כש-doubleAI הוקמה על ידי פרופ' אמנון שעשוע, פרופ' שי שלו שוורץ, פרופ' יואב לוין, פרופ' אור שריר, ד"ר נועם וייס וד"ר גל בנימיני, היא לא הצטרפה למהפכת הבינה היוצרת (GenAI), אלא הובילה את השלב הבא בינה מלאכותית מבוססת הסקה (Reasoning).

בעוד שרוב פתרונות ה-AI הקיימים מתבססים על חיזוי מילים והסתברות, doubleAI נבנתה סביב תפיסה של "בינה מומחית" (Expert AI). המטרה היא לייצר כלי מחקרי מהימן בצורה אבסולוטית, כזה שמסוגל לפתור בעיות מורכבות במדע, במתמטיקה ובמחשוב ברמת המומחיות האנושית הגבוהה ביותר.

הבידול של doubleAI הוא בשאיפה ל-Superintelligence. אחרי העיסוק ב-AI, אנחנו עולים כיתה לעיסוק ב-A Class AI: מערכת שלא רק מסכמת ידע קיים, אלא מסוגלת לבצע פריצות דרך מחקריות, לזהות הקשרים לוגיים עמוקים ולהוות שותף אסטרטגי לגילויים מדעיים. עבור חוקרים ואנשי מדע, המערכת של doubleAI היא לא פחות מ"מנוע של אמת", כזה שבו כל תשובה מגובה בלוגיקה סולידית וביכולת ניתוח נתונים קריטית.

כדי להפוך חזון כזה למציאות, doubleAI נדרשה לכוח מחשוב בסדרי גודל יוצאי דופן. מחקר המבוסס על הסקה לוגית והצלבת נתונים בזמן אמת דורש ארכיטקטורה שלא רק מעבדת נתונים, אלא "חושבת" דרכם בננו-שניות. הצורך בתגובה ב"זמן אפס" אינו עניין של חוויית משתמש בלבד, אלא תנאי הכרחי ליכולת של המערכת לסרוק מרחבי פתרונות עצומים ולהגיע למסקנה מהימנה.

כסטארט-אפ יוניקורן הפועל תחת "Stealth" (חשאיות יחסית), doubleAI הייתה זקוקה לשותף שיכול להקים את המעבדה הטכנולוגית הזו במהירות של סטארט-אפ ובדיוק של מעבדת מחקר. למשימה כזו, באופן הטבעי ביותר, פנתה doubleAI לחברת NVIDIA, שפלטפורמות המחשוב שהיא מפתחת מניעות את מהפכת הבינה המלאכותית.

להקמת התשתית נבחרה 'מטריקס', מתוך ההבנה שהדרישות יוצאות הדופן של doubleAI בסטנדרטים בינלאומיים מחייבות אינטגרטור שהוא 'שחקן נשמה', חלוץ שמכיר את קרביים של ה-DGX ויודע לתכנן ארכיטקטורה מלאה מקצה לקצה.

וכך נכנסה מטריקס לתמונה: המשימה הייתה להקים מאפס, בתוך שבועות בודדים, את התשתית הפיזית והלוגית שתאפשר למוחות המבריקים ביותר ב- doubleAI להריץ את אלגוריתמי העל שלהם על ארכיטקטורה מובילה בקנ"מ עולמי. המרוץ התחיל.

האתגר הטכנולוגי: להנדס מחשב-על ב"זמן אפס"

יניב פרי, Senior Strategic AI & HPC Consultant ב-Matrix, משתף בתובנה מהשטח:

"הטרנד שכולם מדברים עליו בכל העולם הוא יכולות ה-AI. אכן, הן מדהימות, אבל אנחנו כאן כדי להזכיר שזה לא קורה בלחיצת כפתור. מאחורי כל שליחת פרומפט עומדות מערכות פיזיות עוצמתיות. הכל תלוי בהן: איזון עומסים, ניצול משאבים, שרידות מלאה, פרודוקטיביות, ו-Capacity. היינו חייבים לספק פתרון מספיק חזק שיספק מענה לא רק היום, אלא שנים קדימה, בעולם טכנולוגי שרץ במהירות האור."

כדי ש- doubleAIתוכל לממש את חזון ה-Superintelligence שלה, היא נזקקה לתחנת כוח מחקרית עוצמתית. כאן נכנס לתמונה ה-NVIDIA DGX BasePod B200. מדובר בתשתית AI שתוכננה עבור משימות חישוב כבדות של ה-AI המודרני ומאפשרת הרצת מודלים מורכבים של הסקה לוגית (Reasoning) במהירות כפולה מהדור הקודם, ולספק את אותו "זמן אפס" קריטי למחקר.

בהתאם לכך, מטריקס תכננה את כל המערכת התומכת: מהקצאת הספקי חשמל יציבים ועד לתכנון זרימת האוויר והקירור בחוות השרתים, כדי להבטיח שהמערכת תעבוד בשיא התפוקה 24/7.

אחד המפתחות המרכזיים להשגת ה"זמן אפס" שדרשה doubleAI היה ארכיטקטורת התקשורת. כדי שהנתונים לא "ייתקעו" במעבר בין השרתים, הטמיעה מטריקס את פלטפורמת התקשורת NVIDIA Quantum-2 (NDR) –זוהי ״מערכת העצבים״ של הבינה המלאכותית, המאפשרת לשבבי ה-GPU לתקשר ביניהם בסנכרון מלא ולפעול כיחידת חישוב אחת.

בנוסף, הוקם מערך אבטחה היקפי עם Firewalls מתקדמים וסביבת פיתוח מנוהלת, שכלל גם שרתי DELL (עבור שכבות האחסון והניהול של המערך), מה שאיפשר ל- doubleAIלהתמקד אך ורק במחקר שלהם, בראש שקט.

ההישג הגדול בפרויקט היה היכולת לקחת את כל רכיבי הקצה האלו – מהשרתים והמתגים ועד למערכות הניטור והתמיכה – ולהפוך אותם לסביבת עבודה מבצעית תוך שבועות בודדים. זו הייתה עבודה של "שחקני נשמה" שהקימו מאפס ארכיטקטורה מלאה, תוך ניהול לוגיסטי ותכנוני מורכב, כדי להבטיח שביום פקודה, מחשב העל יעמוד בציפיות וישרת את ה-GTM הלכה למעשה.

הרגע המכריע, כנגד כל הסיכויים ובזמן שיא

בסופו של יום, פרויקטים מהסוג הזה לא נמדדים רק במספר השרתים או במהירות המתגים, אלא ביכולת לעמוד בלחץ בלתי מתפשר, לעמוד בדרישות מחמירות ולהמציא ממש את המציאות תוך כדי ריצה.
עבור doubleAI, קו הסיום שלנו, הוא קו ההתחלה שלהם: עם השקות מוצר מתוכננות וסבבי גיוס משמעותיים על הפרק, כל יום של עיכוב בתשתיות היה שווה ערך לעיכוב בחזון כולו.

מטריקס נכנסה לאירוע לא כקבלן חיצוני, אלא כשותפה מלאה לדרך. הצוותים שלנו הבינו את גודל השעה: הצורך להקים מאפס סביבת מחשוב-על מורכבת תוך שבועות בודדים דרש "טירוף" חיובי, יצירתיות הנדסית ומחויבות טוטאלית. הצוותים לא רק תכננו ופרסו, אלא ניהלו את האירוע מקצה לקצה, מהתקנה פיזית ועד לניטור, תמיכה ושירות צמוד, כדי להבטיח ש- doubleAIתוכל "ללחוץ על הכפתור" ולצאת לדרך ללא תקלות.

סיפור ההצלחה של doubleAI ומטריקס הוא עדות לכך שכאשר חזון נועז פוגש מצוינות תשתיתית, השמיים הם כבר לא הגבול. עבור מטריקס, זוהי רק עוד הוכחה למעמדה כחלוצה בתחום, כזו שלא רק עוקבת אחרי ההתפתחויות, אלא בונה את התשתיות שעליהן ירוץ העתיד.

 

 

רוצים לשמוע עוד?

מלאו פרטים ונחזור אליכם בהקדם

כל השדות המסומנים ב * הינם שדות חובה

    *
    *
    *
    *