
Dans les coulisses
Black Friday: comment une expérience risquée nous a sauvés la journée
par Dominik Bärlocher
Black Friday est là. Une traductrice et un rédacteur vous informent depuis la cellule de crise des ingénieurs où l’on veille constamment au bon fonctionnement des serveurs. Pour le moment, tout se passe bien.
Dominik Bärlocher, le rédacteur, et Anne Chapuis, la traductrice, vous informent en direct de la cellule de crise des ingénieurs durant le Black Friday, tant que les serveurs tiennent.
Les ingénieurs lèvent l’alerte. Nous sommes venus à bout de cette journée. Actuellement, nous recensons à nouveau un pic, mais nous sommes bien loin de pouvoir inquiéter les ingénieurs présents dans la War Room, où l’on diffuse actuellement de la musique.
Nous passons donc le relais aux collègues des succursales. À Zurich, trois autres camions viennent d’arriver et à Winterthour, plus de 700 articles ont été livrés.
Depuis la War Room, nous pouvons tirer la conclusion suivante: les serveurs ont tenu le coup.
Nous vous saluons. Merci pour votre attention, les commentaires et surtout les blagues à deux balles. C’est avec plaisir que nous repasserons une nouvelle nuit au côté de toute la communauté. À la prochaine!
Bonne soirée.
Des nouvelles du service client à Zurich. Hier soir vers 23h55, il restait 150 e-mails dans la boîte de réception du Customer Care. Vers 01h45 elle en comptait déjà 450. La majorité des e-mails traitaient du problème de finalisation des commandes.
Pour que l’équipe de Michael Smith arrive à venir à bout de tous ces e-mails, le service client a commencé à travailler une heure plus tôt. Jusqu’à midi, ils ont réussi à atteindre 65% du volume journalier normal. Les premières évaluations de 444 chats montrent que les clients sont satisfaits à 98% du service client.
Félicitation!
Hier soir, peu avant minuit, nous avons désactivé certaines fonctionnalités qui utilisaient beaucoup de ressources. La fonctionnalité «Articles récemment consultés» était l’une d’elles. Elle est maintenant à nouveau en ligne. Les ingénieurs en sont certains: les serveurs tiennent le coup.
L’ambiance est encore détendue du côté du shop de Wohlen. Mais cela risque bien de changer en fin de journée.
Wohlen nous a envoyé l’image suivante du département d’emballage.
Des nouvelles de la capitale: la succursale de Berne est pleine et tout le monde est occupé.
La succursale de Winterthour annonce que ses étagères sont pleines, que les clients entrent et sortent et que tout se passe pour le mieux.
Digitec Galaxus ne donne pas souvent de chiffres, mais quand ils le font, même les internes sont impressionnés. Peu avant 10 heures ce matin, nous avons dépassé la barre des 500 000 visiteurs sur digitec.ch et galaxus.ch. Merci!
Oui, les serveurs tiennent bon. Ils tiennent même tellement bien le coup que nous pouvons faire une pause pour aller manger. Au fait : les collègues de la rédaction de Galaxus servent de la raclette devant la succursale de Zurich. Gratuitement.
Bon appétit.
Dans la succursale de Zurich, vous êtes servis par des women et des men in black. Toujours avec style; bien sûr.
St-Gall est déjà au travail.
L’équipe de Dietikon est débordée. «Aujourd’hui, c’est difficile d’avoir tout le monde sur une photo», ajoute le Shop Manager Aleksandar Jelic.
Les collègues de Genève sont prêts à vous accueillir et vous passent un bonjour de Romandie.
La succursale de Bâle est prête à vous recevoir. La première livraison est là et l’ambiance est top.
La succursale de Zurich est pleine à craquer. Le premier camion vient d’arriver avec des commandes.
De plus, voici encore quelques infos de l’Engineering concernant le thème «j’ai passé commande, l’argent a été déduit, mais je ne vois pas de commande dans mon profil»: ce phénomène touche une centaine de commandes. Dans la plupart des cas, la commande a été annulée, car les utilisateurs ont, en peu de temps, essayé plusieurs fois de payer. Cela peut entraîner l’activation de la protection contre les fraudes (Fraud Protection) au niveau de la société de cartes de crédit.
D’un point de vue historique, la War Room des ingénieurs montre une charge élevée vers 9 heures. Mais pas aujourd’hui. Aujourd’hui, on blague: «Il nous faudrait d’abord réduire le nombre de serveurs pour voir un pic.»
Au fait, les donuts sont en rupture de stock.
La nuit est passée, mais la journée s’annonce dure. Les chasseurs de bonnes affaires ont ramené leur butin, maintenant arrivent tous ceux qui ne voulaient pas se lever la nuit. Pour le petit déjeuner, un peu de statistiques de la nuit:
Les chiffres sont très simplifiés, c’est vrai; le contexte technologique est plus complexe, mais la crise 502 n’était pas aussi grave que nous le pensions.
L’équipe de nuit a laissé la place à celle de jour. Cette équipe est dirigée par René Zweifel. Il vous passe le bonjour.
Dominik et moi allons nous coucher. Nous serons de retour vers 7 ou 8 heures et vous tiendrons informé de ce qui s’est passé durant le reste de la nuit. Mais nous ne pensons pas qu’il se passera grand-chose.
Bon… les 200 AirPods sont en rupture de stock et rejoindront leurs nouveaux propriétaires dès demain.
Nous avons pu éliminer une erreur dans la banque de données qui empêchait des commandes. Quelques secondes plus tard, la PlayStation était en rupture de stock, et le nombre d’AirPods, de nouveau correct.
Les problèmes de banque de données, d’après la théorie actuelle, viennent du fait que beaucoup de clients veulent acheter le même article en même temps. Les AirPods et la PlayStation sont actuellement touchés.
Le conseil des ingénieurs: «Achetez une Xbox; la situation se détendra», tout le monde s’est mis à rire.
La banque de données a un peu de mal. Elle fonctionne certes de manière stable, mais ses performances ne nous satisfont pas vraiment. Les ingénieurs sont ambitieux. Ils ne veulent pas seulement que la boutique fonctionne, ils veulent qu’elle fonctionne bien.
Comme elles ne viennent pas de chez nous, les erreurs 502 lors du passage en caisse perdurent.
Dans le live stream Sandro a demandé à Dominique de lui communiquer le lien pour le texte suivant:
La panne est passée. Elle a plus ou moins duré une minute. La raison? Un basculement. Nous sommes de nouveau en ligne.
Nous sommes hors ligne. On ne sait pas pourquoi. Nous y travaillons.
La communauté signale que les boutiques en ligne affichent des codes d’erreur 502. Ce qui signifie qu’un serveur signale un time out lors du passage en caisse. Cela peut arriver quand trop de commandes arrivent en même temps dans le système – soit le nôtre ou celui de la société de cartes de crédit.
Veuillez documenter le tout pour un éventuel cas de garantie et essayez de changer le moyen de paiement. Fraud Protection devrait normalement intervenir, mais on n’est jamais trop sûr.
Les premiers scripts du système sont en panne. De plus, Twint est hors ligne. Veuillez choisir un autre moyen de paiement.
Les scripts en panne ont, bien entendu, redémarré. Actuellement, personne ne panique.
Nous l’avons dit! Les serveurs tiennent. Nous travaillons certes avec une performance de système de 600%, mais ils tiennent le coup.
Deux des 30 serveurs affichent des difficultés. Si vous êtes sur l’un de ces serveurs, cliquez sur F5.
Mais les systèmes tiennent. Ouf!
Thierry Pool et Sandro Hostettler streament les évènements de la nuit en direct (seulement en allemand, mais qui sait, si vous êtes sages peut être que l'année prochaine il sera aussi en français :P). Vous trouverez le stream sur Facebook
Let's Dance!
Stefan Müller vient de donner les dernières instructions. Les fonctionnalités qui ne sont pas indispensables sur le site sont désactivées, les capacités du serveur, laissées pour les fonctionnalités de la boutique en ligne.
«On s’ennuie», ajoute quelqu’un peu après le stand up meeting. Tout le monde se met à rire.
La réponse: «Espérons que ça dure.»
Vous êtes très impatients. Nous avons vite eu une charge de serveur de 70%.
Un problème? Réglé! Team BlackJack a connu son premier succès de la soirée.
Les derniers tableaux de bord sont ajustés, les serveurs fonctionnent encore de manière stable.
La série de blagues à deux balles (en allemand) dans les commentaires continue de grandir. Peut-être que les Romands en ont une ou deux à partager?
Je lance la première: connaissez-vous la blague de la chaise?... Elle est pliante…
Le premier briefing est terminé. CTO Stefan Müller vient d’informer les ingénieurs de toutes les équipes. De la répartition des rôles jusqu’à la nourriture; tout est réglé.
Les serveurs tiennent encore. On constate déjà quelques anomalies, mais toujours rien de préoccupant. L’ambiance est détendue.
«C’est drôle: les résultats du sondage ne donnent pas 100%», remarque Stefan Müller.
Bref: les ingénieurs sont prêts.
Le plus éprouvant de l'année pour les serveurs digitec et les ingénieurs qui font leur maintenance et leur mise à jour: le Black Friday. Aucun autre jour ne voit autant d'utilisateurs se connecter simultanément sur le site et ne voit autant de trafic. Bref: vous et la communauté mettez nos serveurs à rude épreuve durant 24 heures.
Une équipe provenant des quatre coins du département Engineering veut y remédier. Aujourd'hui, dès 22 heures, elle prendra ses quartiers à la Pfingstweidstrasse et attendra de voir ce qui passe. L'équipe de garde, surnommée «War Room» pour l'occasion, est dirigée par la team BlackJack. Sa tâche principale est le Site Reliability Engineering: «nous veillons à ce que le site fonctionne le plus fiablement et longtemps possible», résume le chef d'équipe René Zweifel.
La rédaction digitec sera présente et, dans la mesure du possible, relatera les évènements en direct du War Room of Engineering. Si les ingénieurs se donnent de la peine, alors la rédaction aussi. Anne Chapuis, la traductrice, m'accompagnera et traduira notre article en français presque intantanément. Nous espérons que les serveurs tiendront le coup, sinon nous aurons passé une nuit blanche en vain.
L'équipe BlackJack n'a pas manqué d'ironiser la situation: «L'année dernière, les serveurs ont planté au bout de 17 secondes. Mais cette fois-ci. avec toutes nos mises à jour de performance, nous sommes sûrs de pouvoir y arriver en moins d'une seconde.»
Les serveurs digitec sont mis à l'épreuve lors du Black Friday. Pensez-vous qu'ils tiendront le coup?
Le concours est terminé.
Journaliste. Auteur. Hackers. Je suis un conteur d'histoires à la recherche de limites, de secrets et de tabous. Je documente le monde noir sur blanc. Non pas parce que je peux, mais parce que je ne peux pas m'en empêcher.