← כל המאמרים

AGI · סוכני AI · רובוטיקה · קוונטים · 2026-05-23 · 10 דק׳ קריאה

מאת נתנאל סיבוני

תפיסות לגבי עתיד ה־AGI: למה הקרב האמיתי יעבור ממודלים לרובוטים, סוכנים וקוונטים

הרבה אנשים עדיין מסתכלים על AGI כאילו מדובר פשוט בגרסה חזקה יותר של ChatGPT, Gemini, Claude או Grok. אבל התמונה המלאה רחבה יותר: מודלים, סוכנים, רובוטים, דאטה מהעולם האמיתי ומחשוב קוונטי.

התזה המרכזית:
AGI לא יגיע רק ממודל שפה גדול יותר. היתרון יעבור למי שיחבר כוח חישוב, דאטה אמיתי, סוכנים, רובוטיקה, מולטימודליות, זיכרון, כלים, ובשלב הבא גם מחשוב קוונטי.

תוכן עניינים

הרבה אנשים עדיין מסתכלים על AGI כאילו מדובר פשוט בגרסה חזקה יותר של ChatGPT, Gemini, Claude או Grok. כאילו יום אחד יקום מודל חדש, יענה טוב יותר, יכתוב קוד טוב יותר, יבין תמונות טוב יותר, ואז יגידו לנו: “זהו, הגענו ל־AGI”.

אבל לדעתי זו לא התמונה המלאה.

הדרך ל־AGI לא תיבנה רק ממודל שפה גדול יותר. היא תיבנה משילוב של כמה שכבות: כוח חישוב עצום, דאטה מהעולם האמיתי, סוכנים שפועלים לבד, יכולת מולטימודלית מלאה, רובוטים פיזיים, זיכרון ארוך, אינטגרציה עם כלים, ובשלב הבא גם מחשוב קוונטי. מי שיחזיק את כל השכבות האלה יחד — לא רק מודל חכם — יהיה קרוב יותר לבינה מלאכותית כללית אמיתית.

וכאן נכנסת התזה המרכזית: ייתכן מאוד שהיתרון הגדול ביותר במירוץ ל־AGI לא יהיה אצל מי שיש לו את הצ’אטבוט הכי יפה, אלא אצל מי שיוכל לאמן AI בתוך העולם עצמו.

מה זה בעצם AGI?

AGI, או בינה מלאכותית כללית, היא לא רק מערכת שיודעת לענות על שאלות. זו מערכת שיכולה להבין הקשרים שונים, ללמוד תחומים חדשים, לעבור בין משימות, לתכנן כמה צעדים קדימה, להשתמש בכלים, לתקן את עצמה, להבין סביבה, לפעול בעולם הדיגיטלי — ובשלב מתקדם יותר גם בעולם הפיזי.

כלומר, AGI אמיתי לא אמור להיות “מנוע תשובות”. הוא אמור להיות מערכת פעולה.

המעבר הזה חשוב: לא עוד מודל שמחכה לשאלה, אלא סוכן שמבין מטרה. לא עוד כלי אחד לכתיבה, כלי אחד לתמונה, כלי אחד לווידאו וכלי אחד לקוד, אלא מוח מרכזי שמחבר הכול. לא עוד AI שמכיר את העולם דרך טקסט בלבד, אלא AI שרואה, שומע, מתנסה, נכשל, מתקן, זוכר ולומד.

למה xAI יכולה להיות מועמדת רצינית להגיע ל־AGI ראשונה?

הסיבה המרכזית היא לא רק Grok. הסיבה היא האקוסיסטם של אילון מאסק.

xAI כבר מציגה את עצמה כחברה שבונה מודלים למגוון רחב של יכולות: reasoning, code, voice, images ו־video, ומדגישה שהמודלים שלה מאומנים על אחד מסופר־הקלאסטרים הגדולים בעולם. בנוסף, xAI מציגה את Colossus כמערכת אימון עצומה שנבנתה במהירות חריגה, הוכפלה ל־200,000 GPUs מסוג H100, וגם המתקדמים ביותר H200 וכוללת מפת דרך לכיוון מיליון GPUs.

אבל בעיניי היתרון האמיתי לא נמצא רק בכמות ה־GPUs. כוח החישוב הוא רק צד אחד במשוואה. הצד השני הוא לולאת האימון.

הכוח של בינה מלאכותית נמצא בסוף בלולאה הזאת:

דאטה → פעולה → משוב → תיקון → עוד דאטה → עוד פעולה.

מודלים שמתאמנים בעיקר על טקסט, קוד, תמונות, וידאו וסימולציות מקבלים הבנה אדירה של העולם, אבל עדיין רוב ההבנה שלהם מתווכת דרך מידע שכבר נאסף. הם קוראים על העולם, רואים את העולם, מנתחים את העולם — אבל לא בהכרח פועלים בתוכו.

רובוטים משנים את זה.

אם Tesla באמת תצליח להפעיל Optimus בקנה מידה רחב, זו כבר לא תהיה רק חברת רכבים או חברת רובוטים. זו תהיה פלטפורמת איסוף דאטה פיזי מהעולם. כל רובוט כזה יכול להפוך לנקודת חישה, פעולה ולמידה. הוא יכול ללמוד איך חפצים זזים, איך בני אדם עובדים, איך סביבות משתנות, איך משימה נכשלת, ואיך מתקנים אותה בפועל.

Tesla כבר מציינת בהודעת Q1 2026 שההכנות למפעל Optimus ראשון בקנה מידה גדול אמורות להתחיל ב־Q2, שהקו הראשון מיועד לקיבולת של מיליון רובוטים בשנה, ושקו דור שני בטקסס מתוכנן לקיבולת ארוכת־טווח של 10 מיליון רובוטים בשנה. חשוב להדגיש: החברה עצמה מציינת שקיבולת מותקנת אינה שווה לקצב ייצור בפועל, ושקצב הייצור תלוי בגורמים כמו ציוד, שרשרת אספקה, רגולציה ושדרוגי מפעל.

ועדיין, עצם הכיוון הזה הוא דרמטי.

כי אם xAI, Tesla, X, SpaceX ותשתיות החישוב של מאסק יתחברו בצורה עמוקה — אפילו חלקית — מדובר באחד המסלולים הכי מעניינים ל־AGI מעשי. לא רק AGI שמדבר. AGI שפועל.

ההבדל בין AI שמאומן בעולם וירטואלי לבין AI שנוגע בעולם

צריך לדייק: זה לא נכון להגיד שכל החברות הגדולות מאמנות רק “בעולם וירטואלי”. לגוגל, למשל, יש אקוסיסטם עצום של חיפוש, יוטיוב, אנדרואיד, מפות, ענן, תמונות, Workspace ועוד. יש לה גישה לכמות בלתי נתפסת של מידע והתנהגות אנושית.

אבל יש הבדל בין מידע על העולם לבין פעולה בתוך העולם.

מודל שמנתח מיליארדי סרטונים יכול להבין איך כוס נופלת מהשולחן. רובוט שניסה לתפוס כוס, הפיל אותה, ניסה שוב, תיקן זווית, שינה לחץ באצבעות והצליח — מקבל סוג אחר של למידה.

שם נמצא היתרון של רובוטיקה בקנה מידה גדול.

AGI לא צריך רק לדעת להסביר איך העולם עובד. הוא צריך לפתח מודל פנימי שמבין תוצאה, סיבה, משוב, סיכון, זמן, חומר, תנועה ואינטראקציה. כל אלה הרבה יותר חזקים כשהמערכת לא רק קוראת על העולם, אלא מתאמנת בתוכו.

Google Omni: האם זו גרסה ראשונה של AGI?

מצד שני, אי אפשר להתעלם מגוגל. Gemini Omni הוא לא AGI מלא, אבל הוא בהחלט נראה כמו שלב ראשון בדרך לממשק AGI.

גוגל הציגה את Gemini Omni כמודל שיכול ליצור “anything from any input”, בהתחלה סביב וידאו, עם יכולת לשלב תמונה, אודיו, וידאו וטקסט כקלט, ליצור וידאו איכותי, ולערוך אותו בשיחה טבעית. זה כבר לא “כלי וידאו” רגיל. זה כיוון שבו המודל מבין הקשר, שומר עקביות, משנה סצנה, עובד עם פיזיקה, ומחבר בין ידע, יצירה ושפה.

במקביל, Gemini 3.5 Flash מוצג על ידי גוגל כמודל שמיועד למשימות agentic מורכבות, קוד, תהליכים ארוכי טווח, שימוש בארגונים, ועבודה דרך Gemini app, AI Mode, Google Antigravity וה־Gemini API.

גם Google Antigravity 2.0 מראה לאן השוק הולך: לא עוד “תכתוב לי קוד”, אלא סביבה שבה אפשר להריץ סוכנים, תתי־סוכנים, משימות מתוזמנות, אינטגרציות, סביבות Linux מבודדות וזרימות עבודה מתמשכות.

לכן, אם מסתכלים על AGI מצד חוויית המשתמש, גוגל אולי קרובה מאוד למה שאנשים ירגישו כ־AGI: עוזר אישי שפועל בכל המוצרים, מבין טקסט, וידאו, קול, תמונה, חיפוש, מסמכים, קניות, פיתוח, תכנון ופעולות יומיומיות.

אבל זו עדיין לא בהכרח בינה כללית מלאה. זו שכבת אינטגרציה חזקה מאוד.

היום אנחנו משתמשים במודולים. מחר נדבר עם מוח אחד

המצב היום עדיין מפוצל. יש כלי לתמונה. כלי לווידאו. כלי לקוד. כלי לקול. כלי למחקר. כלי לאוטומציה. כלי לסוכנים. כלי לדפדפן. כלי למסמכים. כלי להרצת קוד. כלי ל־API. כלי לרובוטים.

אבל זה מצב זמני.

הכיוון הברור הוא מעבר ממודולים נפרדים למוח מרכזי אחד שמפעיל את כולם. המשתמש לא ירצה לבחור בין Midjourney, Sora, Gemini Omni, Claude Code, Grok, ElevenLabs, n8n או כלי דפדפן. המשתמש ירצה להגיד:

“תבנה לי את זה.” “תבדוק לי את זה.” “תייצר לי קמפיין.” “תפתח לי מוצר.” “תנהל לי תהליך.” “תנתח לי את החברה.” “תבנה לי סוכן שעובד כל יום.” “תבדוק מה נשבר ותתקן.”

ה־AGI המעשי יתחיל בדיוק שם: לא כהכרזה פילוסופית, אלא כשכבת פעולה שמחברת את כל הכלים מאחורי הקלעים.

ברגע שהסוכן יודע לראות, לשמוע, לכתוב, לדבר, לתכנת, לגלוש, להריץ קוד, להשתמש ב־API, להבין קבצים, לזכור היסטוריה, להפעיל רובוטים, ולפעול תחת הרשאות — הוא כבר לא “צ’אט”. הוא מערכת עבודה.

למה הרובוטים של Tesla יכולים לשנות את קצב ההתקדמות

אם Tesla תגיע לפריסה רחבה של Optimus, זה יכול לפתוח סוג חדש של אימון: אימון מהעולם הפיזי בקנה מידה תעשייתי.

זה לא אומר שכל רובוט יהפוך מיד ל־AGI. זה גם לא אומר ש־xAI תקבל אוטומטית את כל הדאטה של Tesla, כי xAI ו־Tesla הן ישויות עסקיות נפרדות, ויש כאן שאלות של פרטיות, ממשל תאגידי, רגולציה, זכויות דאטה ובטיחות.

אבל מבחינה טכנולוגית, הפוטנציאל ברור: מערכת AI שלומדת ממיליוני אינטראקציות פיזיות יכולה לפתח הבנה עמוקה יותר של העולם מאשר מערכת שנשארת רק בתוך מסך.

רכב אוטונומי לומד כבישים, תנועה, חיזוי, סביבה, החלטות בזמן אמת וסיכון. רובוט אנושי לומד חפצים, ידיים, משקל, מרחק, בני אדם, חללים, משימות, עבודה חוזרת, בטיחות וטעויות פיזיות. החיבור בין שני העולמות האלה — רכב אוטונומי ורובוט אנושי — הוא אולי אחד הנתיבים הכי חזקים ל־AGI.

איפה הקוונטים נכנסים לתמונה?

כאן צריך להיות גם אמיץ וגם מדויק.

מחשוב קוונטי לא יפתור מחר בבוקר את כל הבעיות של AI. הוא גם לא “ימחק הזיות” באופן ישיר. הזיות של מודלי שפה נובעות ממגוון גורמים: דאטה לא מדויק, הטיות, חוסר grounding, מורכבות גבוהה, חיזוי הסתברותי, ולעיתים פשוט חוסר אימות מול מקור אמת. IBM מתארת הזיות AI כתופעה שבה מודל מייצר פלט לא מדויק או חסר בסיס, ומדגישה שצמצום הזיות דורש דאטה איכותי, גבולות ברורים, בדיקות, שיפור מתמשך ופיקוח אנושי.

לכן חשוב להבדיל בין שני סוגי “שגיאות”:

שגיאות במחשוב קוונטי הן בעיות פיזיקליות של קיוביטים, רעש, דה־קוהרנטיות ותיקון שגיאות קוונטי. שגיאות של AI הן בעיות של ידע, הקשר, אמת, דאטה, reasoning ואימות.

אבל החיבור בין קוונטים ל־AI עדיין יכול לשנות את העולם.

Google הציגה את שבב Willow כצעד משמעותי בתיקון שגיאות קוונטי, כולל הפחתת שגיאות ככל שמגדילים את מספר הקיוביטים, והציגה זאת כצעד בדרך למחשב קוונטי גדול ושימושי. IBM, מצדה, מציגה מפת דרך למחשב קוונטי fault-tolerant גדול עד 2029, עם יעדים כמו 200 logical qubits ו־100 מיליון שערים קוונטיים.

ההשפעה האמיתית על AGI תגיע כנראה בשלושה שלבים:

בשלב הראשון, AI יעזור לבנות מחשבים קוונטיים טובים יותר. מחקר ב־Nature Communications סוקר איך AI יכול לעזור לאורך כל ה־quantum computing stack — מתכנון, כיול, שליטה, תיקון שגיאות ועד אופטימיזציה של מערכות קוונטיות.

בשלב השני, מחשוב קוונטי יעזור לפתור בעיות מדעיות שקשה מאוד לפתור עם מחשוב רגיל: כימיה, חומרים, תרופות, אנרגיה, סימולציות פיזיקליות ואופטימיזציה מורכבת.

בשלב השלישי, AGI יוכל להשתמש במערכות קוונטיות ככלי. לא בהכרח כדי “לחשוב” כמו אדם, אלא כדי להריץ חישובים וסימולציות שפותחות לו הבנה עמוקה יותר של הטבע. זה יכול להפוך AGI ממערכת שמנתחת מידע קיים למערכת שמגלה ידע חדש.

אז מי יגיע ראשון ל־AGI?

אם השאלה היא מי יציג ראשון מוצר שנראה לציבור כמו AGI — גוגל מועמדת חזקה מאוד. יש לה אקוסיסטם מלא, מוצרי צריכה, חיפוש, Gemini, Workspace, YouTube, Android, AI Mode, Gemini Omni ו־Antigravity.

אם השאלה היא מי יבנה את מודל הסוכן החזק ביותר למפתחים ולארגונים — התחרות פתוחה בין xAI, Google, OpenAI, Anthropic ושחקנים נוספים.

אבל אם השאלה היא מי עשוי לבנות AGI שמחובר עמוק לעולם הפיזי — כאן xAI/Tesla היא אחת התזות החזקות ביותר.

הסיבה פשוטה: העולם האמיתי הוא בית הספר האמיתי של אינטליגנציה כללית.

טקסט מלמד שפה. וידאו מלמד תנועה. קוד מלמד לוגיקה. כלים מלמדים פעולה. רובוטים מלמדים מציאות.

מי שישלב את כולם — יוביל.

המסקנה: AGI לא יגיע כרגע אחד, אלא כתהליך של חיבור שכבות

אנחנו בדרך לעולם שבו AI לא יהיה “כלי”. הוא יהיה שכבת עבודה מעל כל המערכות.

בהתחלה זה ייראה כמו סוכן אישי. אחר כך כמו עובד דיגיטלי. אחר כך כמו צוות שלם של סוכנים. אחר כך כמו מערכת שמנהלת תהליכים לבד. ואז, כשהיא תתחבר לרובוטים, חיישנים, תשתיות ומחשוב קוונטי — היא תתחיל להתקרב למה שאנשים באמת מתכוונים אליו כשהם אומרים AGI.

הנקודה החשובה היא לא לחכות להגדרה הרשמית. עסקים, מפתחים וארגונים צריכים להתחיל להיערך כבר עכשיו: לבנות תהליכים שניתן לחבר לסוכנים, לסדר דאטה, לפתוח APIs בצורה בטוחה, להגדיר הרשאות, לנהל לוגים, למדוד פעולות, ולבנות שכבת בקרה לפני שנותנים לסוכן לפעול בסביבה חיה.

העתיד של AGI לא יהיה רק מי עונה הכי חכם. העתיד יהיה מי יודע ללמוד, לפעול, להרגיש את העולם דרך דאטה אמיתי, לתקן את עצמו, ולהפוך רעיון לפעולה.

ופה בדיוק הקרב האמיתי מתחיל.

מקורות ואימות

רוצים להכין את העסק לעולם של סוכני AI?

השלב הראשון הוא לסדר תהליכים, דאטה, הרשאות, APIs, לוגים ובקרה לפני שמחברים סוכן לסביבה חיה.

דברו איתי על תכנון תשתית AI עסקית בטוחה ומדידה