מודל reasoning חזק
יכולת להבין קוד, תיעוד, היסטוריית commits, תלויות והקשר ארכיטקטוני רחב.
עולם הסייבר נכנס לשלב חדש: לא רק AI שמסביר CVE או עושה review נחמד, אלא סוכנים שמסוגלים לקרוא codebase, להבין ארכיטקטורה, לבדוק מסלולי השפעה, לאמת חולשות ולהחזיר ראיות לתיקון.
עד היום, הרבה ארגונים חשבו על AI בסייבר בתור עוזר: כלי שמסביר CVE, כותב בדיקת YARA, מסכם התראות או עוזר ל־SOC להבין אירוע. זה חשוב, אבל זה כבר לא הקצה של היכולת.
מה שקורה עכשיו עם מודלים כמו Claude Mythos Preview, GPT-5.5, GPT-5.5-Cyber ויוזמות כמו Project Glasswing ו־OpenAI Daybreak הוא עמוק יותר: המודל לא רק קורא את הבעיה. הוא מתחיל לעבוד כמו חוקר אבטחה עם סבלנות גבוהה, יכולת לעבור על כמויות קוד עצומות, ולחזור שוב ושוב על השערות עד שהוא מוצא משהו משמעותי.
ופה נמצאת הנקודה המרכזית: הסכנה וההזדמנות לא נמצאות רק במודל עצמו. הן נמצאות במעטפת שבונים סביבו.
כשמדברים על מודלי frontier בסייבר, קל לדמיין צ׳אט שעונה לשאלות. אבל המהפכה האמיתית היא לא הצ׳אט. המהפכה היא ה־harness: סביבת עבודה שמחברת את המודל לקוד, לכלי בדיקה, לסביבות הרצה מבודדות, ל־static analysis, ל־fuzzing, ללוגים, לתיעוד, להיסטוריית commits, ל־CI/CD ולמערכת שמאפשרת לו לבדוק השערות בצורה חוזרת.
זה ההבדל בין “AI עושה review” לבין “AI עושה security audit רחב”. Review רגיל מסתכל על שינוי נקודתי. Audit סוכנתי מסתכל על המערכת כולה: איפה נכנס קלט, איפה יש הרשאות, איפה יש serialization, איפה יש race conditions, איפה יש path traversal, איפה יש trust boundary שבור, ואיך כמה חולשות קטנות יכולות להתחבר למסלול אחד מסוכן.
OpenAI מתארת את Daybreak כגישה שבה AI עוזר לאנשי אבטחה להבין codebases, לזהות חולשות עדינות, לאמת תיקונים, לנתח מערכות לא מוכרות ולעבור מהר יותר מגילוי לתיקון. לפי OpenAI, Daybreak משלב מודלי OpenAI עם Codex כ־agentic harness, כלומר סביבה שמאפשרת עבודה סוכנתית סביב אבטחת תוכנה ולא רק תשובה בצ׳אט. זה בדיוק סוג ההבדל שבולט גם בעבודה עם OpenClaw וסוכני AI: לא מודל לבד, אלא מערכת עבודה עם כלים וגבולות.
OpenAI גם מפרידה בין רמות גישה: GPT-5.5 רגיל לשימוש כללי, GPT-5.5 עם Trusted Access for Cyber לתהליכים הגנתיים מורשים, ו־GPT-5.5-Cyber כגישה מוגבלת ויותר permissive לתהליכים מיוחדים כמו red teaming, penetration testing ואימות מבוקר בסביבות מורשות.
המסר ברור: ככל שהיכולת יותר חזקה ודו־שימושית, צריך יותר אימות זהות, בקרת חשבון, הגדרת שימוש מורשה, ניטור ואחריות. זו לא רק שאלה של “איזה מודל הכי חזק”. זו שאלה של מי קיבל גישה, באיזו סביבה, עם איזה scope, ואילו ראיות חוזרות למערכת אחרי הפעולה.
| גישה | מה משתנה | המשמעות לארגון |
|---|---|---|
| AI כעוזר בצ׳אט | מסביר ממצא, כותב סיכום, מציע תיקון כללי | עוזר למהירות, אבל לא מחליף תהליך אבטחה. |
| AI בתוך harness | קורא codebase, מפעיל כלים, בודק השערות ומחזיר ראיות | דורש הרשאות, סביבה מבודדת, audit trail ותהליך תיקון. |
| AI עם גישה מורשית לסייבר | מאפשר תהליכים רגישים יותר לאנשי אבטחה מאומתים | חייב בקרות חשבון, monitoring, הגדרת scope ואישור אנושי לפעולות מסוכנות. |
Anthropic השיקה את Project Glasswing כמאמץ מוגבל סביב Claude Mythos Preview, עם גישה לשותפים מרכזיים שמחזיקים תוכנה ותשתיות קריטיות. לפי העדכון של Anthropic ממאי 2026, Project Glasswing ושותפיו השתמשו ב־Mythos כדי למצוא יותר מעשרת אלפים חולשות ברמת high או critical בתוכנות מערכתיות חשובות.
הנתונים הראשוניים חזקים מאוד. Anthropic דיווחה שבסריקה של יותר מ־1,000 פרויקטי open source, Mythos סימן 6,202 ממצאים high/critical מתוך 23,019 ממצאים. מתוך 1,752 ממצאים high/critical שנבדקו ידנית, 90.6% התבררו כ־true positives, ו־1,094 אושרו כ־high או critical.
זה מספר שמשנה את הדיון. כי עד עכשיו bottleneck מרכזי בעולם הסייבר היה “איך מוצאים חולשות”. עכשיו מתברר שהבוטלנק עובר למקום אחר: איך מאמתים, מתעדפים, מדווחים, מתקנים ומפיצים patch מספיק מהר.
כש־AI מסוגל למצוא הרבה יותר חולשות, הארגון שלא בנוי לתקן מהר נכנס לבעיה חדשה: backlog של סיכונים אמיתיים שלא מקבלים טיפול בזמן.
Cloudflare כתבה אחרי עבודה עם Mythos שמה שמרשים במיוחד הוא היכולת לשרשר primitives — לחבר כמה חולשות, תנאים או התנהגויות למסלול השפעה אחד — במקום לדווח על כל ממצא כאילו הוא עומד לבד.
זו נקודה קריטית. בעולם האמיתי, חולשה אחת קטנה לא תמיד מספיקה. הסיכון נוצר כשכמה דברים מתחברים: קלט במקום אחד, הרשאה במקום שני, הנחת trust במקום שלישי, וקוד ישן שלא נבדק מזווית התקפית שנים. Mythos, לפי Cloudflare, בלט לא רק בהצפת ממצאים אלא גם באימות ברור יותר שלהם וביכולת להוריד את הזמן שנדרש כדי להבין אם מדובר בממצא אמיתי או רעש.
וזה בדיוק מה שמשנה את עולם הסייבר: לא רק מציאת באג, אלא היכולת להבין אם הבאג “חי”, אם יש לו מסלול השפעה, ואם הוא יכול להפוך לסיכון עסקי.
גם OpenAI מתייחסת לזה ברצינות. בכרטיס המערכת של GPT-5.5 החברה כותבת שהיא מתייחסת ל־GPT-5.5 כמודל בעל יכולת High בתחום הסייבר תחת Preparedness Framework, אבל עדיין מתחת ל־Critical. לפי OpenAI, העלייה ביכולות הסייבר דרשה הרחבה של ההגנות והבקרות סביב השימוש במודל.
במקביל, OpenAI מתארת את Trusted Access for Cyber כנתיב גישה מבוסס זהות ואמון שמאפשר לאנשי אבטחה מאומתים לעבוד עם יכולות סייבר מתקדמות יותר, כולל גילוי חולשות, reasoning על codebases, ניתוח malware ותהליכי הגנה נוספים. כלומר, גם כאן המסר הוא לא “תפתחו הכל לכולם”, אלא יכולת חזקה בתוך מערכת גישה, ניטור ואחריות.
גם אם עדיין לא מדובר במכונה אוטונומית שמפילה כל מערכת בעולם, הכיוון ברור: יכולות שהיו שמורות לחוקרי אבטחה מקצועיים מתחילות לרדת בעלות, לעלות במהירות, ולהיכנס לתוך workflow של פיתוח ואבטחה.
הנקודה הזאת חשובה במיוחד כשמסתכלים על חולשות בקרנל ובתשתיות בסיס. באפריל 2026 פורסמה CVE-2026-31431, שכונתה Copy Fail, חולשת local privilege escalation בליבת Linux. CERT-EU תיאר אותה כחולשה גבוהה שמשפיעה על הפצות Linux מרכזיות עם קרנלים שנבנו מאז 2017, וציין שבזמן הפרסום כבר היה proof-of-concept ציבורי.
במאי 2026 פורסמה גם שרשרת Dirty Frag, עם CVE-2026-43284 ו־CVE-2026-43500. לפי Wiz, מדובר בשרשרת חולשות ב־Linux kernel שיכולה לאפשר למשתמש מקומי להגיע להרשאות root בתנאים מסוימים, סביב מנגנוני ESP/IPsec ו־RxRPC.
המסקנה היא לא “Linux לא בטוח”. זו מסקנה שטחית. המסקנה היא שכל שכבת תוכנה גדולה שנבנתה לאורך שנים מכילה שכבות היסטוריות, החלטות עבר, אופטימיזציות, קוד מורכב, קומפוננטות שלא תמיד נבדקו יחד, ומסלולים שאף אחד לא הסתכל עליהם מזווית חדשה הרבה זמן.
עכשיו מגיע סוכן AI ומסתכל על כל זה בלי להתעייף. וזה מחזיר לשולחן קוד ישן, ספריות ישנות, קומפוננטות שנחשבו “יציבות”, וגבולות אמון שאף אחד כבר לא זוכר מי תכנן.
בעולם הישן, היה לארגונים חלון זמן. חוקרים מצאו חולשה, דיווחו, יצרנים תיקנו, ארגונים בדקו patch, ואז פרסו אותו. זה אף פעם לא היה מושלם, אבל היה קצב אנושי.
בעולם החדש, אם מודלים יכולים למצוא חולשות מהר יותר ממה שארגונים יכולים לתקן אותן, חלון התיקון נהיה מסוכן. Palo Alto Networks העריכה במאי 2026 שלארגונים יש חלון צר של שלושה עד חמישה חודשים להתכונן לפני ש־AI-driven exploits יהפכו לנורמה רחבה יותר אצל תוקפים.
גם אם ההערכה הזאת אגרסיבית, הכיוון שלה נכון: מי שמחכה ל־CVE רשמי, לפוסט בבלוג ול־patch נוח עלול להיות מאוחר מדי. ההגנה צריכה לזוז שמאלה: מיפוי נכסים, חשיפה חיצונית, virtual patching, בדיקות קוד רציפות, סריקה יזומה, ותהליך תיקון שלא נתקע שבועות בין Security, DevOps ופיתוח.
לדעתי, מה שמסתתר כאן הוא לא “עוד כלי סייבר”. זו שכבת אבטחה חדשה שמורכבת מחמישה רכיבים:
יכולת להבין קוד, תיעוד, היסטוריית commits, תלויות והקשר ארכיטקטוני רחב.
חיבור לריפו, להרצה, לכלי בדיקה, ל־static analysis, ללוגים ולתהליך CI/CD.
שמירת השערות, ממצאים, מסלולים שנבדקו, החלטות ביניים ותוצאות אימות.
בדיקת ממצאים בסביבה מבוקרת כדי להפריד בין רעש לבין חולשה אמיתית.
מי מורשה להריץ, על איזה קוד, עם אילו מגבלות, ואיך מונעים שימוש לרעה.
בלי החמישייה הזאת, זה או צעצוע או סכנה. עם החמישייה הזאת, זה יכול להיות יתרון הגנתי עצום.
בקוד טוב יש חורים. גם קוד איכותי שעבר בדיקות, review, static analysis ו־CI עדיין יכול להכיל חולשות עדינות. לפעמים החולשה לא נמצאת בשורה אחת, אלא בצירוף של כמה החלטות קטנות: הנחה שגויה במקום אחד, trust boundary לא מספיק ברור במקום שני, fallback מסוכן במקום שלישי, והתנהגות לא צפויה בסביבת production.
חוקר אנושי טוב יכול למצוא דברים כאלה, אבל זה לוקח זמן. צריך לקרוא קוד, להריץ ניסויים, להבין היסטוריה, לבדוק קומפוננטות ולבנות מודל מנטלי של המערכת. סוכן AI עם סביבת עבודה מתאימה יכול לעשות חלק גדול מהחיפוש הזה בקצב אחר לגמרי.
המשמעות היא לא שהאדם יוצא מהתמונה. להפך. האדם עובר מתפקיד של “מי שמחפש הכל לבד” לתפקיד של מי שמגדיר גבולות, מאמת תוצאות, מתעדף סיכון, מחליט מה לתקן קודם, ומוודא שהתיקון לא שובר את המערכת.
סוכנים יכולים לסרוק קוד, להריץ ניתוחים ולבנות השערות בקצב גבוה בהרבה מסקירה ידנית רגילה.
הערך האמיתי מגיע כשבודקים ממצא בסביבה מבודדת, בלי לסכן מערכות חיות או צדדים שלישיים.
המערכת צריכה להחזיר patch, בדיקות, לוגים, הוכחת תיקון ועדכון ל־CI/CD או למערכת ניהול המשימות.
עסק שמחבר סוכן AI לקוד, שרתים, WordPress, CRM, API, וואטסאפ או מערכת פנימית חייב להפסיק לחשוב במונחים של “המודל חכם אז יהיה בסדר”. זה לא מספיק, במיוחד במסגרת הטמעת AI בארגונים שבה יש דאטה, הרשאות, צוותים ותהליכים קיימים.
צריך לבנות שכבת אבטחה סביב הסוכן: הרשאות מינימום, הפרדת סביבות, אישור אנושי לפעולות רגישות, allow-list לכלים, לוגים מלאים, ניטור חריגות, מדיניות מידע, תיעוד החלטות ויכולת לעצור תהליך לפני שהוא עושה נזק.
זה נכון במיוחד כשסוכן חשוף ל־Prompt Injection, לקבצים, ל־API או למערכות פנימיות. בלי המעטפת הזו, סוכן חכם מדי עלול להפוך ממאיץ עבודה למכפיל סיכון.
אבטחת תוכנה כבר לא יכולה להיות שלב בסוף. היא חייבת להיכנס לתוך הפיתוח עצמו: לא פעם בחודש, לא אחרי release, לא רק אחרי incident, אלא כחלק מתהליך קבוע שבו סוכן קורא, בודק, מתעדף, מאמת ומציע תיקון — ואדם מקצועי מאשר.
עד היום הרבה מערכות שרדו לא כי הן מושלמות, אלא כי אף אחד לא השקיע מספיק זמן למצוא את החור הנכון. זה השתנה. סוכני סייבר חדשים יכולים לקחת codebase גדול, לחפש חולשות בשכבות שאנשים לא נוגעים בהן, לחבר מסלולים, ולהעלות ממצאים בקצב שלא דומה לעבודה אנושית רגילה.
זה לא אומר שכל סוכן יחליף חוקר אבטחה טוב. להפך — זה מעלה את הערך של מומחי אבטחה אמיתיים, כי עכשיו צריך אנשים שיודעים להפעיל את הסוכנים, להבין מה אמיתי, לתעדף סיכון, לתקן נכון ולא להטביע את הארגון ברעש.
המשחק החדש הוא לא “מי מוצא חולשה”. המשחק החדש הוא מי בונה מערכת שמוצאת, מאמתת, מתקנת ומגינה מהר יותר מהצד השני.
כל קוד ישן חוזר לבדיקה. כל מערכת שלא תוכננה עם אבטחה תחילה הופכת לחשופה יותר. כל ארגון שמחכה לפגיעות הבאה במקום לסרוק את עצמו מראש משחק משחק ישן בעולם חדש.
העידן הבא של הסייבר לא יהיה רק מלחמה בין האקרים לאנשי אבטחה. הוא יהיה מירוץ בין סוכנים שמחפשים חולשות לבין מערכות שמסוגלות לסגור אותן בזמן.
Code review רגיל בוחן שינוי או קטע קוד. סוכן סייבר עובד בתוך סביבת עבודה רחבה יותר: הוא קורא codebase, משתמש בכלי בדיקה, מריץ ניסויים מבודדים, בונה השערות, בודק מסלולי השפעה ומחזיר ראיות לתיקון.
הם מסמנים מעבר מגילוי ידני ואיטי של חולשות למערכות שמסוגלות לסרוק קוד ותשתיות בקצב גבוה. זה מעלה את החשיבות של תיעדוף, תיקון, הרשאות, לוגים, בקרת גישה ותהליך disclosure מסודר.
לפי OpenAI, GPT-5.5-Cyber נמצא בגישה מוגבלת ומיועד לתהליכים מורשים ומבוקרים כמו red teaming, penetration testing ואימות בסביבות מורשות, עם בקרות חשבון חזקות יותר.
כי קצב גילוי החולשות עולה. כשסוכנים מסוגלים למצוא ולתעדף ממצאים מהר יותר, ארגון שלא בנוי לאמת, לתקן ולהפיץ patch במהירות נשאר עם backlog מסוכן של חולשות אמיתיות.
להגדיר הרשאות מינימום, סביבת בדיקה מבודדת, לוגים, בקרת פעולות מסוכנות, אישור אנושי, מדיניות מידע, הפרדה בין סקירה לבין ביצוע, ותהליך תיקון שמחזיר ראיות ל־CI/CD או למערכת ניהול המשימות.
OpenAI Daybreak · OpenAI Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber · OpenAI GPT-5.5 System Card · Anthropic Project Glasswing initial update · Anthropic Project Glasswing · Anthropic CVD dashboard · Cloudflare Project Glasswing · CERT-EU Copy Fail advisory · Wiz Dirty Frag analysis · Palo Alto Networks Frontier AI update