Aperçu
Le 20 octobre 2025, une panne des services d'Amazon Web Services (AWS) a entraîné l'interruption ou le ralentissement de plusieurs sites web, jeux en ligne et applications, affectant des utilisateurs et des services dans plusieurs pays.
Chronologie des événements
- Premiers signes de dysfonctionnement : des ralentissements généralisés ont été observés dès le matin, avec des signalements initiaux vers 07:11 GMT.
- Début des perturbations locales : en Suisse, des interruptions ont été signalées peu après 09:00 (heure locale), touchant certains services bancaires et opérateurs de télécommunications.
- Tentative de rétablissement : en milieu de journée, AWS a indiqué que "la plupart des opérations du service AWS fonctionnent désormais normalement" pour certaines zones, tout en prévenant d'éventuels ralentissements jusqu'à la résolution complète de l'incident.
- Résurgence des perturbations : des nouvelles difficultés ont été relevées en début d'après-midi (vers 15:00 GMT), affectant d'autres clients et services.
- Identification de la cause profonde : en fin de journée (vers 18:00 heure suisse), AWS a indiqué que la cause principale provenait d'un sous-système interne chargé de la surveillance des répartiteurs de charge réseau.
Services et impact
Plusieurs types de services ont été affectés :
- Sites de réservation et communautés en ligne (ex. plateformes de logement et forums).
- Jeux en ligne et services de divertissement (ex. titres multijoueurs et plateformes de streaming).
- Applications et services liés aux cryptomonnaies et à l'intelligence artificielle.
- Services bancaires et télécommunications dans certains pays.
Parmi les services et entreprises rapportés comme touchés figurent des plateformes de réservation, des sites communautaires, des jeux vidéo en ligne, des services de streaming, des plateformes d'échange de cryptomonnaies et certains services bancaires.
Causes techniques signalées
Les éléments techniques évoqués durant l'incident incluent :
- Problèmes initiaux liés au DNS (système de noms de domaine), résolus par la suite selon les informations communiquées par AWS.
- Taux d'erreur élevés sur des requêtes adressées à DynamoDB, une base de données utilisée par de nombreuses applications.
- Localisation de l'incident dans la région d'infrastructure identifiée comme "US-EAST-1", dans le nord de la Virginie (États-Unis).
- Déclaration ultérieure d'un défaut dans un sous-système interne de surveillance des répartiteurs de charge réseau, qualifié par AWS de cause profonde.
Réactions et conséquences
L'incident a été cité comme un exemple des risques opérationnels associés à la concentration de services cloud auprès d'un nombre limité de fournisseurs. Des experts en sécurité informatique et des analystes ont évoqué les implications pour la gestion des infrastructures, la redondance régionale et les stratégies de continuité d'activité.
Des signalements d'utilisateurs et des outils de suivi des pannes ont permis de mesurer l'étendue et la temporalité des interruptions, avec des rétablissements progressifs pour certains clients et des perturbations persistantes pour d'autres avant la fin de la journée.
Points de vigilance technique
- La réplication de données entre régions et la conception des architectures multisites sont des leviers techniques pour réduire l'impact des interruptions localisées, mais impliquent des coûts et des contraintes opérationnelles.
- Les incidents sur des composants de supervision ou de répartition de charge peuvent provoquer des effets en chaîne au-delà des seuls mécanismes de routage DNS.
Conclusion
L'incident du 20 octobre 2025 illustre les conséquences opérationnelles d'une interruption de services cloud sur un ensemble varié de services numériques. Les communications d'AWS ont décrit une résolution partielle suivie d'un diagnostic identifiant un sous-système de surveillance des répartiteurs de charge comme cause principale. Les observations issues de cet incident ont conduit à des discussions sur la conception d'architectures résilientes et les stratégies de dépendance aux fournisseurs cloud.