Вдруге за рік у Cloudflare виникли серйозні збої, цього разу вони вплинули на широкий спектр платформ після того, що компанія назвала незвичним сплеском трафіку.
Що сталося
У вівторок, 18 листопада, Cloudflare підтвердила збій, який викликав масові помилки у популярних сервісах, застосунках і на вебсайтах. Навіть Downdetector, вебсайт, який відстежує відключення інтернету через скарги користувачів, був тимчасово недоступний.
Ось короткий перелік сайтів і сервісів, роботу яких порушив збій у Cloudflare:
- Archive of Our Own
- Canva
- Depop
- Downdetector
- Grindr
- League of Legends
- OpenAI / ChatGPT
- Spotify
- X (Twitter)
Багато сайтів, на які вплинув збій у Cloudflare, зокрема OpenAI.com, відображають повідомлення про помилку з текстом “Please unblock challenges.cloudflare.com to proceed.”
У заяві, надісланій електронною поштою для Mashable, компанія повідомила, що причиною проблем став збій у програмній системі, яка обробляє трафік. Також було підкреслено, що немає доказів зловмисної активності.
Текст заяви:
“Багато сервісів Cloudflare зазнали значного збою сьогодні, починаючи приблизно з 11:20 UTC. Проблему було повністю усунено о 14:30 UTC. Коренем збою став конфігураційний файл, який автоматично генерується для керування трафіком, пов’язаним із загрозами. Файл виріс до розміру, що не передбачався, і спричинив збій у програмній системі, яка обробляє трафік для частини сервісів Cloudflare”.
За кілька годин компанія повідомила про повне вирішення проблеми. “Виправлення впроваджено, і є підстави вважати, що інцидент усунуто”, зазначено в оновленому статусі компанії. “Продовжується моніторинг для впевненості, що всі сервіси повернулися до нормальної роботи”
Кількість повідомлень про помилки на сайті Downdetector почала швидко зменшуватися.
Що таке Cloudflare
Cloudflare є компанією, з якою багато користувачів не знайомі. Її часто описують як найбільшу компанію, про яку ніхто не чув. Вона керує та забезпечує безпеку трафіку приблизно для 20 відсотків інтернету.
Cloudflare є постачальником інтернет-інфраструктури та хмарних обчислень, який працює за принципом, схожим на сервіси хмарної інфраструктури. Компанія розміщує численні онлайн сервіси, але найбільш відома як глобальна мережа доставки контенту. Така мережа прискорює роботу сайтів, перенаправляючи їх через свої сервери, розташовані ближче до користувачів. По суті, Cloudflare працює як масштабний посередник інтернету, завдяки якому сайт із сервером, що фізично розміщується у США, завантажується швидко, навіть якщо користувач знаходиться на іншому кінці світу.
Компанія має сервери по всьому світу, і вони можуть кешувати величезний обсяг контенту. Це дає змогу розподіляти навантаження на тисячі вузлів у глобальній мережі Cloudflare. Кожен вузол може обробляти великий обсяг запитів без необхідності щоразу звертатися до початкового сервера. Це запобігає одночасному перевантаженню сайтів і знижує ризик відмови.
Локальний вузол Cloudflare майже завжди знаходиться на кілька переходів ближче, ніж сервер, на якому фактично розміщено сайт. Перехід є одним етапом руху даних мережею. Менша кількість переходів означає меншу відстань і менший час очікування при передачі даних, а це знижує затримку та прискорює завантаження контенту.
Оскільки програмне забезпечення Cloudflare є основою роботи великої кількості компаній, подібні збої мають значний вплив. Збій у вівторок поширився інтернетом, спричинивши падіння або уповільнення роботи таких сервісів, як ChatGPT, соціальна платформа X.
Інтернет задумувався як децентралізована система, але це в минулому
Наслідки аварії Cloudflare та інших аварій великих хмарних провайдерів підкреслюють ключовий зсув в архітектурі інтернету. З самого початку інтернет проєктувався як мережа, де немає єдиного централізованого контролера, а обмін даними здійснюється через множинні незалежні вузли. Ідея полягала в розподілі функцій – кожен вузол або мережа можуть автономно передавати пакети, маршрутизація здійснюється в розподіленому режимі, а сервіси можуть бути розміщені там, де це зручно і економічно вигідно. Такий підхід було обрано саме для того, щоб проблеми одного вузла не паралізували роботу значної частини мережі. Також це підвищувало стійкість до цензури та давало можливість різним організаціям і приватним особам створювати сервіси без одного централізованого оператора.
Чи залишився інтернет децентралізованим сьогодні? Сьогодні інтернет є гібридною системою – поєднанням залишків початкової децентралізації на рівні протоколів і сильної централизації на рівні сервісів та інфраструктури.
Базові мережеві протоколи – IP, TCP, BGP, SMTP та інші – залишаються розподіленими за своєю природою. Маршрутизація і передача пакетів виконуються через численні автономні системи.
Однак великі хмарні провайдери і CDN-платформи (наприклад, Cloudflare, AWS, Google Cloud тощо), а також великі платформні сервіси і соціальні мережі зосереджують величезну частку трафіку, обробки запитів і даних користувачів. Це створює точки контролю, які в разі збоїв або політичного тиску мають масштабний вплив.
Наслідки центрування спостерігають мільйони людей. Це підвищена вразливість інтернет-сервісі до масових відмов. Один збій у великого провайдера призводить до масштабних перебоїв у роботі сотень або тисяч сервісів. Концентрація інфраструктури спрощує вплив на доступ до контенту або даних – владі простіше натиснути на одного великого провайдера.
Хоча у технічному сенсі інтернет ще зберігає децентралізовані принципи, в операційному та бізнесовому вимірі значна частина повсякденного інтернет-трафіку і сервісів опинилася під контролем кількох великих організацій.



