ענן שחור: התקלה של אמזון והלקח שכל חברה צריכה ללמוד
רגע אחד נעצרו אתרי אינטרנט, אפליקציות ושירותים בכל העולם - רק כי ענן אחד קרס. מה שהתחיל בכשל טכני ב־DNS הפך לשיעור חובה בכל הקשור לגיבוי, ביזור ואחריות עסקית. "הבנו מי שוחה בעירום"

הצרה עם AWS, חטיבת שירותי הרשת של אמזון, מתחילה בעצם הצלחתה. החברה שמספקת שירותי ענן ותשתיות אינטרנט ל-4.19 מיליון לקוחות עסקיים, אמנם מתחרה בענקיות כמו מיקרוסופט אזור וגוגל קלאוד, אבל היא הגדולה ביותר בתחומה.
גודל, במקרה זה, פירושו גם אחריות כבדה. ב-48 השעות האחרונות התברר שכאשר AWS נופלת, חלקים נכבדים מהאינטרנט נופלים ביחד איתה. אתר DownDetector, המשמש לדיווח על תקלות בשירותים מקוונים, מסר כי קיבל יותר מ-4 מיליון דיווחים על בעיות ותקלות ממשתמשים ברחבי העולם, ביותר מ-500 חברות שונות. בין השאר נפגעו הפלטפורמות של צ'אט GPT, קאנבה, רובלוקס, פורטנייט, אלקסה, רובין הוד, סיילספורס, מאנדיי, זום, סנאפצ'ט, רדיט, בנק לויד בבריטניה, טינדר ורבים אחרים. כמו כן, הושבתו אתרי האינטרנט של כמה חברות תעופה, בהן דלתא ויונייטד.
מארק שוסטק, מנהל אבטחת מידע בסוכנות הנסיעות המקוונת eSky Group, התייחס לתקלה בראיון ל"גארדיאן" הבריטי והעריך כי הבעיה בשרתי AWS קשורה ל-DNS – מערכת שמות המתחם באינטרנט שמקשרת בין כתובות מספריות לשמות האתרים.
"התקלה הזו מראה כיצד אפילו סביבות הענן הגדולות ביותר עלולות להיות משותקות בשל רכיב תשתיתי שנראה זניח לכאורה", הסביר שוסטק. "במקרה הזה, הבעיה הייתה ב־DNS – היסוד של התקשורת ברשת. וכשה-DNS מפסיק לפעול, אפליקציות ושירותים שלמים עלולים להפסיק להגיב, גם אם הם מתוכננים בצורה מופתית. זה שיעור חשוב לחברות המשתמשות בענן: כדאי לתכנן מערכות כך שכשל באזור אחד או אצל ספק אחד לא ישתק את כל העסק. פיזור גיאוגרפי של משאבים ובדיקת תרחישי חירום צריכים להיות סטנדרט – לא מותרות".

אמזון רשמה 108 מיליארד דולר הכנסות משירותי הענן ב-2024, מתוך 638 מיליארד דולר הכנסות לחברה כולה. לפי יצחק גולדסטנד, Field CTO בחברת קלאודאקס מקבוצת CodeValue, התקלה אירעה במסד נתונים ותיק של אמזון, שהחברה השיקה עוד ב-2006. "מסיבות היסטוריות וטכנולוגיות, לא מעט אזורים שנחשבים כיום גלובליים לחלוטין, למעשה יושבים על השרתים בחוף המזרחי של ארצות הברית, שחוו את התקלה", הוא אומר. "גם לקוחות שמחפשים ברירת מחדל מגיעים, במקרים רבים, לשרתים האלה - ולכן גם הם נפגעו".
גולדסטנד מדגיש, כי זו אינה הפעם הראשונה שבו האזור הספציפי הזה ב-AWS נפגע. הפעם הגדולה הקודמת קרתה ב-2011 וגרמה לענקית הסטרימינג נטפליקס לצאת למסע שדרוג תשתיות, כדי להבטיח שתקלה כזו לא תקרה להם שוב. גולדסטנד: "נטפליקס הבינו כבר לפני 14 שנים, שכדי לא ליפול לבור הזה שוב חייבים לבזר את שירותי הענן ולא לסמוך על ספק אחד, או על אזור אחד".
הדאטה-בייס שנפגע השפיע על פעילות אמזון עצמה?
"בהחלט כן. אפשר להעריך ש-70%-80% מהשירותים של אמזון מאחורי הקלעים ישבו על אותו דאטה בייס ותיק שנפל. כלומר, לא רק הלקוחות נפגעו ישירות, אלא גם אמזון עצמה. זו הייתה נפילה קטסטרופלית מבחינת אמזון".
מה הלקחים שאפשר ללמוד מתקלה כזו?
"קודם כל, כלקוחות של הענן אסור לנו לצפות שהענן אף פעם לא ייפול. עסקים צריכים לדעת אילו נפילות הם יכולים לשאת ואילו לא, ובהתאם לבזר את פעילותם בענן גם מבחינה גאוגרפית; לא לשים הכל באזור אחד. מעבר לכך, צריך להקשיב לאמזון שאומרים גם היום שנפילות כאלו יכולות לקרות ולכן לא צריך להגיב אליהן בהפתעה ובפאניקה".

ומה יהיה אם תקרה תקלה דומה בשרת הממוקם באזור הישראלי?
"במקרה כזה", מזהיר גולדסטנד, "המגזר הציבורי כאן עלול להיות בבעיה כי אסור לו על פי חוק להוציא את הדאטה לאחסון מחוץ ישראל. כשאין ביזור, זו בעיה. מה עושים? מנסים לשמור גיבויים לכל מה שאפשר. כמו כן, אם אי אפשר לבזר, צריך לפחות להבין שהענן הוא לא משהו מושלם וחסין מתקלות ותמיד קיימת אפשרות להפתעות, כמו בכל תחומי החיים".
"העולם לא יכול בלי אמזון"
גיא נתן, מנהל קרן הגידור Valley ומנהל תיקי לקוחות, לא הופתע מכך שמניית אמזון (AMZN) דווקא הוסיפה לערכה כמעט 1% בפתיחת המסחר של יום שני, כמה שעות לאחר הפרסומים על התקלה ב-AWS.
נתן: "התקלה הזו דווקא הראתה עד כמה יש צורך באמזון, עד כמה ידה בכל. יש אמנם פגיעה במוניטין של החברה, אבל משקיעים שמסתכלים על המניה מבינים עד כמה העולם כיום לא יכול בלי אמזון. רובנו הרי לא יודעים איזו חברה משתמשת באיזה דאטה בייס ובאיזה ענן. זה כמו בריכה שמתרוקנת פתאום ורואים מי שוחה בעירום".
לטווח הארוך, התקלה לתפיסתך יצרה מומנטום חיובי?
"אמזון חייבים לוודא שהתקלה הזו לא תחזור. עם זאת, אפשר להזכיר בהקשר הזה את חברת הסייבר CrowdStrike, שמנייתה קרסה עקב תקלה טכנולוגית, אבל גם היא טיפסה אחר כך לשווי כמעט כפול מהשווי שהיה לה לפני התקלה. זה קרה כי משקיעים רבים גילו פתאום איזו השפעה יש לחברה הזו על עולם העסקים.
"אמזון גם ככה היא מניה שמתומחרת בחסר, היא ירדה יותר מ-2% מתחילת לעומת עלייה של 10% במדד S&P 500. בחמש השנים האחרונות היא עלתה קצת יותר מ-30%, לעומת קרוב ל-100% ב--S&P 500. מדברים שם על פיטורי המנכ"ל ואולי עכשיו זה יקרה, אבל זה לאו דווקא שלילי. בכל מקרה, המשקיעים פחות נבהלים מהתקלה ורואים בה אירוע נקודתי".

אם אחד מלקוחות ניהול התיקים שלך יתקשר וישאל על מניית אמזון, אתה תדגיש בפניו את ההיבטים החיוביים של התקלה?
"לגמרי. זה אמנם לא אירוע חיובי לאמזון, אבל חשוב לשים לב גם שהבעיה נפתרה תוך כמה שעות ולא הלכו לאיבוד נתונים משמעותיים. המשקיעים יודעים שאחת הבעיות העיקריות של אמזון כיום זו חוסר היכולת של החברה להציף ערך בסגמנטים הטכנולוגיים שלה, שאינם קמעונאות. הבעיה העיקרית של אמזון כיום היא איך היא מצטיירת בעיני המשקיעים ובדוחות הכספיים שלה. ובהקשר הזה, התקלה דווקא מאירה זרקור על כך שאמזון כיום היא חברת טכנולוגיה".
"מה קורה אם הענן שלי נופל?"
עו"ד אבי מיזן, ראש התחום הפיננסי בברוקר הביטוח הבינלאומיAon ישראל, מסכים ש"קיבלנו תזכורת לכך שהעולם כולו נשען על תשתיות ענן מצומצמות, הנשלטות בידי מספר קטן של שחקנים. כשאזור אחד של ספק ענן נופל זו לא תקלה מקומית, אלא הפרעה גלובלית שמורגשת בשרשרת הערך של חברות רבות".
לפי מיזן, התלות המוחלטת בעננים ציבוריים יוצרת "סיכון מערכתי חדש", כזה שאינו נובע מפעולות אנוש או מתקפות סייבר, אלא פשוט מכשל טכני בתשתית משותפת. "חברות השקיעו משאבים רבים באבטחת מידע", הוא מסביר, "אבל לא תמיד בדקו מה יקרה אם ספק הענן פשוט יפסיק לעבוד. זו חוליה חלשה שלא תמיד מנוהלת כמו שצריך. ניהול סיכוני ענן הוא היום חלק בלתי נפרד מהאסטרטגיה העסקית".

האם ביטוח סייבר מכסה מקרים כאלה? מיזן סבור שלא, אלא אם כן הפוליסה מגדירה במפורש כיסוי למקרי vendor outage או cloud service failure . "ביטוחי סייבר נבנו כדי להתמודד עם תקיפות זדוניות, לא עם תקלות מערכתיות", הוא מסביר.
"התקלה ב-AWS ממחישה עד כמה חשוב להבין מה באמת כתוב בפוליסה. רבים מניחים שהם מכוסים עד שהם מגלים שהתקלה של הספק לא נחשבת ‘אירוע סייבר’ במסגרת הפוליסה. האירוע הזה מזכיר לנו שהענן הוא לא קסם, אלא מערכת טכנולוגית עם סיכונים אמיתיים. ביטוח סייבר הוא כלי חשוב, אבל הוא לא תחליף לניהול סיכונים חכם ולתכנון גיבוי. בסוף, האחריות על ההמשכיות העסקית נשארת אצל הארגון עצמו. כל חברה - קטנה כגדולה - צריכה לשאול את עצמה שאלה אחת פשוטה: מה קורה אם הענן שלי נופל?"