Една конфигурациска датотека го „сруши“ половина интернет: Анализа на вчерашниот Cloudflare колапс

во Вести

Вчерашниот ден нѝ покажа колку е кревка мрежата на која се потпира целиот современ свет. Една грешка во кодот на гигантот Cloudflare беше доволна да ги направи недостапни сервисите како ChatGPT, Spotify, Discord и X, потсетувајќи нè дека кога „облакот“ ќе кивне, целиот интернет настинува.

Ако вчера околу пладне се обидовте да ја отворите вашата омилена апликација за продуктивност, да испратите порака на Discord или едноставно да „скролате“ на X, веројатно ве пречека добро познатата и фрустрирачка порака: „500 Internal Server Error“. Не бевте сами. Милиони корисници ширум светот, вклучувајќи нè и нас во Македонија, гледаа во екрани што одбиваа соработка.

Виновникот? Не беше руски хакерски напад, ниту пак масивен DDoS удар. Виновникот беше Cloudflare, или поточно, една лоша конфигурациска промена во нивниот систем.

Што точно се случи?

Според официјалниот извештај на компанијата, проблемите започнаа околу 12:20 часот по македонско време (11:20 UTC). Cloudflare, кој служи како „штит“ и забрзувач за милиони веб-страници (се проценува дека опслужува значаен процент од целиот веб сообраќај), искуси критичен пад во своите системи.

Иронијата е во тоа што алатката дизајнирана да го штити интернетот, всушност го сруши. Проблемот настанал поради „латентен баг“ во системот за заштита од ботови. Инженерите на Cloudflare направиле рутинска промена во конфигурацијата, што требало да биде стандардна процедура.

Меѓутоа, оваа промена генерирала конфигурациска датотека која била многу поголема од очекуваното. Кога оваа масивна датотека била испратена до серверите низ глобалната мрежа на Cloudflare, софтверот што требало да ја процесира едноставно „пукнал“ (crashed). Ова предизвика верижна реакција, оневозможувајќи го рутирањето на сообраќајот и резултирајќи со тој фамозен код 500 кај крајните корисници.

Не, не беше сајбер напад

Во првите моменти од падот, интернетот веднаш почна да шпекулира. Дали е ова масивен напад врз инфраструктурата на САД? Дали е ова почеток на сајбер војна?

CTO-то на Cloudflare, Дејн Кнехт, брзо ги смири страстите. Тој појасни дека иако првично забележале скок во сообраќајот што личел на напад, вистинската причина била внатрешна грешка. Системот влегол во „loop“ на рестартирање обидувајќи се да ја процесира лошата датотека, што предизвикало оптоварување на процесорите на нивните сервери.

Ова е класичен пример за тоа како во светот на комплексни системи, најголемите проблеми често доаѓаат од внатре, а не од надвор. Една линија код или една лошо пресметана големина на датотека може да направи штета што ниту една армија ботови не може да ја постигне толку ефикасно.

Македонскиот агол и локалното влијание

Иако зборуваме за глобални сервиси, ударот силно се почувствува и кај нас. Голем број македонски портали, е-трговија сајтови и бизнис апликации ја користат инфраструктурата на Cloudflare за заштита од DDoS напади и за CDN (Content Delivery Network) услуги.

За време на прекинот, кој траеше интензивно околу два часа, многу локални бизниси беа недостапни. Ова уште еднаш го отвора прашањето за зависноста на домашните IT компании од неколку глобални провајдери. Кога AWS, Azure или Cloudflare имаат проблем, ние во Македонија, а очигледно и во светот, немаме многу опции освен да чекаме некој инженер во Сан Франциско да го најде решението.

Лекцијата за централизацијата на интернетот

Овој инцидент е уште еден во низата потсетници за опасноста од централизацијата на интернетот. Денешниот веб не е онаа дистрибуирана мрежа каква што беше замислена во 90-тите. Денес, тој е суштински потпрен на грбот на неколку гиганти.

Cloudflare, Amazon Web Services и Google Cloud држат толку голем дел од инфраструктурата, што секој нивен проблем станува глобална криза. Ако Cloudflare падне, паѓаат и банките, и стриминг сервисите, и алатките за работа.

Дали ова ќе промени нешто? Веројатно не. Удобноста и безбедноста што ги нудат овие сервиси се премногу добри за да се откажеме од нив. Но, за IT професионалците и систем администраторите, вчерашниот ден беше добар потсетник: „single point of failure“ не е само теоретски концепт од учебниците, туку реалност која може да ви го уништи вторникот.

Услугите се сега вратени во нормала, а Cloudflare вети детална „post-mortem“ анализа во наредните денови. До следниот пат кога интернетот ќе трепне, останува само да се надеваме дека некој внимава на големината на конфигурациските датотеки.


Оваа содржина е генерирана со помош на вештачка интелигенција, но е внимателно проверена, уредена и дополнета од уредничкиот тим на IT.mk, со цел да обезбедиме точни, релевантни и квалитетни информации за читателите.

Стани премиум член и доби пристап до сите содржини, специјален попуст на над 2.200 производи во ИТ маркет, верификуван профил и можност за огласување на ИТ Огласник. Плус ќе го поддржиш медиумот кој го градиме цели 16 години!

basic

членство

42 ден./мес

зачлени се

1337

членство

125 ден./мес

зачлени се
* плаќањето е на годишно ниво

Доколку веќе имаш премиум членство, најави се тука.

Добивај известувања
Извести ме за
guest
0 Коментари
Најнови
Најстари Со највеќе гласови
Inline Feedbacks
View all comments