amazon-web-services-outage
Une panne majeure d'Amazon Web Services (AWS) a mis à l'arrêt des plateformes majeures comme Airbnb et Reddit, illustrant la dépendance critique du monde digital aux infrastructures des géants américains de la tech et soulevant des questions sur la résilience des systèmes cloud.

Une panne majeure d’Amazon Web Services (AWS) aux États-Unis a paralysé une partie significative d’Internet, affectant des géants comme Airbnb, Reddit, Roblox, ainsi que des applications courantes telles que Slack, Snapchat et Fortnite. L’incident, qui a duré plusieurs heures, a mis en évidence la dépendance croissante du monde aux infrastructures des géants de la tech américains. Amazon a finalement annoncé la résolution complète de la panne après environ quinze heures de gestion de crise, anticipant un rétablissement total des services dans les heures suivantes.

Filiale d’Amazon, AWS est un leader mondial de l’informatique à distance (cloud), fournissant des services essentiels comme le stockage, les bases de données et l’IA. Elle détient près d’un tiers du marché mondial, devant Microsoft Azure et Google Cloud. Cette défaillance a entraîné des blocages de paiements, des livraisons interrompues et une multitude d’autres activités professionnelles et privées empêchées, soulignant les risques liés à la concentration de services essentiels chez un petit nombre de fournisseurs.

Selon Junade Ali, expert en cybersécurité à l’IET, cette panne « met en évidence les défis liés à la dépendance » aux fournisseurs basés à l’étranger. Michael Hewson, analyste financier, s’interroge sur la pertinence pour les entreprises d’externaliser leur infrastructure essentielle afin de réaliser des économies. Gadjo Sevilla d’Emarketer a souligné que cette dépendance excessive « menace plus que la simple disponibilité des services : elle met en péril la réputation de la marque et la confiance des clients », plaidant pour des stratégies de redondance malgré les coûts supplémentaires.

Le déclencheur de l’incident a été identifié comme un problème de DNS, le système de nom de domaines des sites Internet, affectant l’accès à la base de données DynamoDB. Cette défaillance initiale a provoqué une réaction en chaîne, touchant les serveurs EC2, une brique fondamentale d’AWS, puis le système de vérification des répartiteurs de charge réseau. Bien qu’AWS ait structuré son réseau en de multiples régions isolées pour éviter ce type de problème, l’incident a démontré qu’un certain nombre de requêtes fondamentales continuent de transiter par US-East-1, le centre le plus ancien et le plus important situé en Virginie. Un incident similaire en juillet 2024, lié à une mise à jour logicielle de CrowdStrike, avait déjà paralysé divers services mondiaux.