חזרה לבלוג

AI Security · Cybersecurity · 2026-05-25 · זמן קריאה: 12 דקות

מאת נתנאל סיבוני

מה באמת מסתתר במודלי האבטחה של הסוכנים החדשים — ולמה זה משנה את עולם הסייבר

עולם הסייבר נכנס לשלב חדש: לא רק AI שמסביר CVE או עושה review נחמד, אלא סוכנים שמסוגלים לקרוא codebase, להבין ארכיטקטורה, לבדוק מסלולי השפעה, לאמת חולשות ולהחזיר ראיות לתיקון.

התשובה הקצרה:
המהפכה בסייבר אינה רק מודל חכם יותר. היא השילוב בין מודל, סביבת עבודה, כלים, הרשאות, לוגים, סביבות הרצה מבודדות ותהליך תיקון. מודלים כמו Claude Mythos Preview, GPT-5.5-Cyber ויוזמות כמו Project Glasswing ו־OpenAI Daybreak מעבירים את מרכז הכובד מגילוי חולשות ידני ל־security audit סוכנתי. זה יכול לחזק אנשי אבטחה מאוד, אבל רק אם בונים סביבו גבולות, אימות ובקרה.

מה במאמר

עולם הסייבר נכנס לשלב חדש

עד היום, הרבה ארגונים חשבו על AI בסייבר בתור עוזר: כלי שמסביר CVE, כותב בדיקת YARA, מסכם התראות או עוזר ל־SOC להבין אירוע. זה חשוב, אבל זה כבר לא הקצה של היכולת.

מה שקורה עכשיו עם מודלים כמו Claude Mythos Preview, GPT-5.5, GPT-5.5-Cyber ויוזמות כמו Project Glasswing ו־OpenAI Daybreak הוא עמוק יותר: המודל לא רק קורא את הבעיה. הוא מתחיל לעבוד כמו חוקר אבטחה עם סבלנות גבוהה, יכולת לעבור על כמויות קוד עצומות, ולחזור שוב ושוב על השערות עד שהוא מוצא משהו משמעותי.

ופה נמצאת הנקודה המרכזית: הסכנה וההזדמנות לא נמצאות רק במודל עצמו. הן נמצאות במעטפת שבונים סביבו.

זה לא רק “מודל חכם” — זה סוכן עם סביבת עבודה

כשמדברים על מודלי frontier בסייבר, קל לדמיין צ׳אט שעונה לשאלות. אבל המהפכה האמיתית היא לא הצ׳אט. המהפכה היא ה־harness: סביבת עבודה שמחברת את המודל לקוד, לכלי בדיקה, לסביבות הרצה מבודדות, ל־static analysis, ל־fuzzing, ללוגים, לתיעוד, להיסטוריית commits, ל־CI/CD ולמערכת שמאפשרת לו לבדוק השערות בצורה חוזרת.

זה ההבדל בין “AI עושה review” לבין “AI עושה security audit רחב”. Review רגיל מסתכל על שינוי נקודתי. Audit סוכנתי מסתכל על המערכת כולה: איפה נכנס קלט, איפה יש הרשאות, איפה יש serialization, איפה יש race conditions, איפה יש path traversal, איפה יש trust boundary שבור, ואיך כמה חולשות קטנות יכולות להתחבר למסלול אחד מסוכן.

חשוב:
המטרה כאן אינה להיכנס לפרומפטים, payloads או הוראות תקיפה. הנקודה היא עקרונית: מודלי הסייבר החדשים כבר לא מוגבלים לזיהוי “ריח רע” בקוד. הם מתחילים להבין מסלולי השפעה, ולכן חייבים לנהל אותם כמו מערכת אבטחה לסוכני AI ולא כמו צעצוע בצ׳אט.

מה OpenAI Daybreak משנה

OpenAI מתארת את Daybreak כגישה שבה AI עוזר לאנשי אבטחה להבין codebases, לזהות חולשות עדינות, לאמת תיקונים, לנתח מערכות לא מוכרות ולעבור מהר יותר מגילוי לתיקון. לפי OpenAI, Daybreak משלב מודלי OpenAI עם Codex כ־agentic harness, כלומר סביבה שמאפשרת עבודה סוכנתית סביב אבטחת תוכנה ולא רק תשובה בצ׳אט. זה בדיוק סוג ההבדל שבולט גם בעבודה עם OpenClaw וסוכני AI: לא מודל לבד, אלא מערכת עבודה עם כלים וגבולות.

OpenAI גם מפרידה בין רמות גישה: GPT-5.5 רגיל לשימוש כללי, GPT-5.5 עם Trusted Access for Cyber לתהליכים הגנתיים מורשים, ו־GPT-5.5-Cyber כגישה מוגבלת ויותר permissive לתהליכים מיוחדים כמו red teaming, penetration testing ואימות מבוקר בסביבות מורשות.

המסר ברור: ככל שהיכולת יותר חזקה ודו־שימושית, צריך יותר אימות זהות, בקרת חשבון, הגדרת שימוש מורשה, ניטור ואחריות. זו לא רק שאלה של “איזה מודל הכי חזק”. זו שאלה של מי קיבל גישה, באיזו סביבה, עם איזה scope, ואילו ראיות חוזרות למערכת אחרי הפעולה.

גישהמה משתנההמשמעות לארגון
AI כעוזר בצ׳אטמסביר ממצא, כותב סיכום, מציע תיקון כלליעוזר למהירות, אבל לא מחליף תהליך אבטחה.
AI בתוך harnessקורא codebase, מפעיל כלים, בודק השערות ומחזיר ראיותדורש הרשאות, סביבה מבודדת, audit trail ותהליך תיקון.
AI עם גישה מורשית לסייברמאפשר תהליכים רגישים יותר לאנשי אבטחה מאומתיםחייב בקרות חשבון, monitoring, הגדרת scope ואישור אנושי לפעולות מסוכנות.

Mythos הראה שהבעיה היא כבר לא רק למצוא באגים

Anthropic השיקה את Project Glasswing כמאמץ מוגבל סביב Claude Mythos Preview, עם גישה לשותפים מרכזיים שמחזיקים תוכנה ותשתיות קריטיות. לפי העדכון של Anthropic ממאי 2026, Project Glasswing ושותפיו השתמשו ב־Mythos כדי למצוא יותר מעשרת אלפים חולשות ברמת high או critical בתוכנות מערכתיות חשובות.

הנתונים הראשוניים חזקים מאוד. Anthropic דיווחה שבסריקה של יותר מ־1,000 פרויקטי open source, Mythos סימן 6,202 ממצאים high/critical מתוך 23,019 ממצאים. מתוך 1,752 ממצאים high/critical שנבדקו ידנית, 90.6% התבררו כ־true positives, ו־1,094 אושרו כ־high או critical.

זה מספר שמשנה את הדיון. כי עד עכשיו bottleneck מרכזי בעולם הסייבר היה “איך מוצאים חולשות”. עכשיו מתברר שהבוטלנק עובר למקום אחר: איך מאמתים, מתעדפים, מדווחים, מתקנים ומפיצים patch מספיק מהר.

כש־AI מסוגל למצוא הרבה יותר חולשות, הארגון שלא בנוי לתקן מהר נכנס לבעיה חדשה: backlog של סיכונים אמיתיים שלא מקבלים טיפול בזמן.

Cloudflare: הערך הוא בשרשור primitives, לא רק בדיווח על באג

Cloudflare כתבה אחרי עבודה עם Mythos שמה שמרשים במיוחד הוא היכולת לשרשר primitives — לחבר כמה חולשות, תנאים או התנהגויות למסלול השפעה אחד — במקום לדווח על כל ממצא כאילו הוא עומד לבד.

זו נקודה קריטית. בעולם האמיתי, חולשה אחת קטנה לא תמיד מספיקה. הסיכון נוצר כשכמה דברים מתחברים: קלט במקום אחד, הרשאה במקום שני, הנחת trust במקום שלישי, וקוד ישן שלא נבדק מזווית התקפית שנים. Mythos, לפי Cloudflare, בלט לא רק בהצפת ממצאים אלא גם באימות ברור יותר שלהם וביכולת להוריד את הזמן שנדרש כדי להבין אם מדובר בממצא אמיתי או רעש.

וזה בדיוק מה שמשנה את עולם הסייבר: לא רק מציאת באג, אלא היכולת להבין אם הבאג “חי”, אם יש לו מסלול השפעה, ואם הוא יכול להפוך לסיכון עסקי.

OpenAI כבר מתייחסת לזה כיכולת High

גם OpenAI מתייחסת לזה ברצינות. בכרטיס המערכת של GPT-5.5 החברה כותבת שהיא מתייחסת ל־GPT-5.5 כמודל בעל יכולת High בתחום הסייבר תחת Preparedness Framework, אבל עדיין מתחת ל־Critical. לפי OpenAI, העלייה ביכולות הסייבר דרשה הרחבה של ההגנות והבקרות סביב השימוש במודל.

במקביל, OpenAI מתארת את Trusted Access for Cyber כנתיב גישה מבוסס זהות ואמון שמאפשר לאנשי אבטחה מאומתים לעבוד עם יכולות סייבר מתקדמות יותר, כולל גילוי חולשות, reasoning על codebases, ניתוח malware ותהליכי הגנה נוספים. כלומר, גם כאן המסר הוא לא “תפתחו הכל לכולם”, אלא יכולת חזקה בתוך מערכת גישה, ניטור ואחריות.

גם אם עדיין לא מדובר במכונה אוטונומית שמפילה כל מערכת בעולם, הכיוון ברור: יכולות שהיו שמורות לחוקרי אבטחה מקצועיים מתחילות לרדת בעלות, לעלות במהירות, ולהיכנס לתוך workflow של פיתוח ואבטחה.

הדוגמה של הקרנל: למה כל התוכנה הישנה חוזרת לשולחן

הנקודה הזאת חשובה במיוחד כשמסתכלים על חולשות בקרנל ובתשתיות בסיס. באפריל 2026 פורסמה CVE-2026-31431, שכונתה Copy Fail, חולשת local privilege escalation בליבת Linux. CERT-EU תיאר אותה כחולשה גבוהה שמשפיעה על הפצות Linux מרכזיות עם קרנלים שנבנו מאז 2017, וציין שבזמן הפרסום כבר היה proof-of-concept ציבורי.

במאי 2026 פורסמה גם שרשרת Dirty Frag, עם CVE-2026-43284 ו־CVE-2026-43500. לפי Wiz, מדובר בשרשרת חולשות ב־Linux kernel שיכולה לאפשר למשתמש מקומי להגיע להרשאות root בתנאים מסוימים, סביב מנגנוני ESP/IPsec ו־RxRPC.

המסקנה היא לא “Linux לא בטוח”. זו מסקנה שטחית. המסקנה היא שכל שכבת תוכנה גדולה שנבנתה לאורך שנים מכילה שכבות היסטוריות, החלטות עבר, אופטימיזציות, קוד מורכב, קומפוננטות שלא תמיד נבדקו יחד, ומסלולים שאף אחד לא הסתכל עליהם מזווית חדשה הרבה זמן.

עכשיו מגיע סוכן AI ומסתכל על כל זה בלי להתעייף. וזה מחזיר לשולחן קוד ישן, ספריות ישנות, קומפוננטות שנחשבו “יציבות”, וגבולות אמון שאף אחד כבר לא זוכר מי תכנן.

ה־patch window מתקצר — ואולי נעלם

בעולם הישן, היה לארגונים חלון זמן. חוקרים מצאו חולשה, דיווחו, יצרנים תיקנו, ארגונים בדקו patch, ואז פרסו אותו. זה אף פעם לא היה מושלם, אבל היה קצב אנושי.

בעולם החדש, אם מודלים יכולים למצוא חולשות מהר יותר ממה שארגונים יכולים לתקן אותן, חלון התיקון נהיה מסוכן. Palo Alto Networks העריכה במאי 2026 שלארגונים יש חלון צר של שלושה עד חמישה חודשים להתכונן לפני ש־AI-driven exploits יהפכו לנורמה רחבה יותר אצל תוקפים.

גם אם ההערכה הזאת אגרסיבית, הכיוון שלה נכון: מי שמחכה ל־CVE רשמי, לפוסט בבלוג ול־patch נוח עלול להיות מאוחר מדי. ההגנה צריכה לזוז שמאלה: מיפוי נכסים, חשיפה חיצונית, virtual patching, בדיקות קוד רציפות, סריקה יזומה, ותהליך תיקון שלא נתקע שבועות בין Security, DevOps ופיתוח.

מה באמת מסתתר במודלי האבטחה החדשים

לדעתי, מה שמסתתר כאן הוא לא “עוד כלי סייבר”. זו שכבת אבטחה חדשה שמורכבת מחמישה רכיבים:

Reasoning

מודל reasoning חזק

יכולת להבין קוד, תיעוד, היסטוריית commits, תלויות והקשר ארכיטקטוני רחב.

Harness

סביבת עבודה

חיבור לריפו, להרצה, לכלי בדיקה, ל־static analysis, ללוגים ולתהליך CI/CD.

Memory

זיכרון עבודה

שמירת השערות, ממצאים, מסלולים שנבדקו, החלטות ביניים ותוצאות אימות.

Validation

אימות מבודד

בדיקת ממצאים בסביבה מבוקרת כדי להפריד בין רעש לבין חולשה אמיתית.

Governance

שכבת governance

מי מורשה להריץ, על איזה קוד, עם אילו מגבלות, ואיך מונעים שימוש לרעה.

בלי החמישייה הזאת, זה או צעצוע או סכנה. עם החמישייה הזאת, זה יכול להיות יתרון הגנתי עצום.

מה שהאקר אנושי היה מפספס — סוכן יכול למצוא בשקט

בקוד טוב יש חורים. גם קוד איכותי שעבר בדיקות, review, static analysis ו־CI עדיין יכול להכיל חולשות עדינות. לפעמים החולשה לא נמצאת בשורה אחת, אלא בצירוף של כמה החלטות קטנות: הנחה שגויה במקום אחד, trust boundary לא מספיק ברור במקום שני, fallback מסוכן במקום שלישי, והתנהגות לא צפויה בסביבת production.

חוקר אנושי טוב יכול למצוא דברים כאלה, אבל זה לוקח זמן. צריך לקרוא קוד, להריץ ניסויים, להבין היסטוריה, לבדוק קומפוננטות ולבנות מודל מנטלי של המערכת. סוכן AI עם סביבת עבודה מתאימה יכול לעשות חלק גדול מהחיפוש הזה בקצב אחר לגמרי.

המשמעות היא לא שהאדם יוצא מהתמונה. להפך. האדם עובר מתפקיד של “מי שמחפש הכל לבד” לתפקיד של מי שמגדיר גבולות, מאמת תוצאות, מתעדף סיכון, מחליט מה לתקן קודם, ומוודא שהתיקון לא שובר את המערכת.

Discovery

גילוי חולשות

סוכנים יכולים לסרוק קוד, להריץ ניתוחים ולבנות השערות בקצב גבוה בהרבה מסקירה ידנית רגילה.

Validation

אימות מבוקר

הערך האמיתי מגיע כשבודקים ממצא בסביבה מבודדת, בלי לסכן מערכות חיות או צדדים שלישיים.

Remediation

תיקון וראיות

המערכת צריכה להחזיר patch, בדיקות, לוגים, הוכחת תיקון ועדכון ל־CI/CD או למערכת ניהול המשימות.

מה עסקים צריכים לעשות עכשיו

עסק שמחבר סוכן AI לקוד, שרתים, WordPress, CRM, API, וואטסאפ או מערכת פנימית חייב להפסיק לחשוב במונחים של “המודל חכם אז יהיה בסדר”. זה לא מספיק, במיוחד במסגרת הטמעת AI בארגונים שבה יש דאטה, הרשאות, צוותים ותהליכים קיימים.

צריך לבנות שכבת אבטחה סביב הסוכן: הרשאות מינימום, הפרדת סביבות, אישור אנושי לפעולות רגישות, allow-list לכלים, לוגים מלאים, ניטור חריגות, מדיניות מידע, תיעוד החלטות ויכולת לעצור תהליך לפני שהוא עושה נזק.

זה נכון במיוחד כשסוכן חשוף ל־Prompt Injection, לקבצים, ל־API או למערכות פנימיות. בלי המעטפת הזו, סוכן חכם מדי עלול להפוך ממאיץ עבודה למכפיל סיכון.

אבטחת תוכנה כבר לא יכולה להיות שלב בסוף. היא חייבת להיכנס לתוך הפיתוח עצמו: לא פעם בחודש, לא אחרי release, לא רק אחרי incident, אלא כחלק מתהליך קבוע שבו סוכן קורא, בודק, מתעדף, מאמת ומציע תיקון — ואדם מקצועי מאשר.

העיקרון המעשי:
כל סוכן שמקבל גישה לקוד, קבצים, מערכות או לקוחות צריך לקבל גם גבולות. לא “תעשה מה שצריך”, אלא: מה מותר, מה אסור, איפה מותר להריץ, מתי צריך אישור, איך מתעדים, ואיך מחזירים ראיות שהפעולה באמת שיפרה את האבטחה.

המסקנה: עולם התוכנה כבר לא יכול להניח שאף אחד לא יסתכל עמוק

עד היום הרבה מערכות שרדו לא כי הן מושלמות, אלא כי אף אחד לא השקיע מספיק זמן למצוא את החור הנכון. זה השתנה. סוכני סייבר חדשים יכולים לקחת codebase גדול, לחפש חולשות בשכבות שאנשים לא נוגעים בהן, לחבר מסלולים, ולהעלות ממצאים בקצב שלא דומה לעבודה אנושית רגילה.

זה לא אומר שכל סוכן יחליף חוקר אבטחה טוב. להפך — זה מעלה את הערך של מומחי אבטחה אמיתיים, כי עכשיו צריך אנשים שיודעים להפעיל את הסוכנים, להבין מה אמיתי, לתעדף סיכון, לתקן נכון ולא להטביע את הארגון ברעש.

המשחק החדש הוא לא “מי מוצא חולשה”. המשחק החדש הוא מי בונה מערכת שמוצאת, מאמתת, מתקנת ומגינה מהר יותר מהצד השני.

כל קוד ישן חוזר לבדיקה. כל מערכת שלא תוכננה עם אבטחה תחילה הופכת לחשופה יותר. כל ארגון שמחכה לפגיעות הבאה במקום לסרוק את עצמו מראש משחק משחק ישן בעולם חדש.

העידן הבא של הסייבר לא יהיה רק מלחמה בין האקרים לאנשי אבטחה. הוא יהיה מירוץ בין סוכנים שמחפשים חולשות לבין מערכות שמסוגלות לסגור אותן בזמן.

שאלות נפוצות

מה ההבדל בין AI שעושה code review לבין סוכן סייבר?

Code review רגיל בוחן שינוי או קטע קוד. סוכן סייבר עובד בתוך סביבת עבודה רחבה יותר: הוא קורא codebase, משתמש בכלי בדיקה, מריץ ניסויים מבודדים, בונה השערות, בודק מסלולי השפעה ומחזיר ראיות לתיקון.

למה Mythos ו-Daybreak חשובים לעסקים?

הם מסמנים מעבר מגילוי ידני ואיטי של חולשות למערכות שמסוגלות לסרוק קוד ותשתיות בקצב גבוה. זה מעלה את החשיבות של תיעדוף, תיקון, הרשאות, לוגים, בקרת גישה ותהליך disclosure מסודר.

האם GPT-5.5-Cyber מיועד לכל משתמש?

לפי OpenAI, GPT-5.5-Cyber נמצא בגישה מוגבלת ומיועד לתהליכים מורשים ומבוקרים כמו red teaming, penetration testing ואימות בסביבות מורשות, עם בקרות חשבון חזקות יותר.

למה חלון התיקון מתקצר?

כי קצב גילוי החולשות עולה. כשסוכנים מסוגלים למצוא ולתעדף ממצאים מהר יותר, ארגון שלא בנוי לאמת, לתקן ולהפיץ patch במהירות נשאר עם backlog מסוכן של חולשות אמיתיות.

מה עסק צריך לעשות לפני שמחבר סוכן AI לקוד או לתשתיות?

להגדיר הרשאות מינימום, סביבת בדיקה מבודדת, לוגים, בקרת פעולות מסוכנות, אישור אנושי, מדיניות מידע, הפרדה בין סקירה לבין ביצוע, ותהליך תיקון שמחזיר ראיות ל־CI/CD או למערכת ניהול המשימות.

מקורות שנבדקו

OpenAI Daybreak · OpenAI Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber · OpenAI GPT-5.5 System Card · Anthropic Project Glasswing initial update · Anthropic Project Glasswing · Anthropic CVD dashboard · Cloudflare Project Glasswing · CERT-EU Copy Fail advisory · Wiz Dirty Frag analysis · Palo Alto Networks Frontier AI update

רוצה לבדוק אם סוכן AI בארגון שלך מחובר בצורה בטוחה?
אפשר להתחיל מבדיקת Go/No-Go קצרה: הרשאות, כלים, לוגים, Prompt Injection, סביבת בדיקה ותהליך אישור לפני פעולות רגישות. ראה שירות אבטחת סוכני AI.