3h du matin. Votre téléphone vibre, puis sonne. Alerte Sev1 : la production est tombée. Votre cœur s’accélère avant même que votre cerveau soit pleinement réveillé. Bienvenue dans le quotidien des équipes d’astreinte.
Le chaos organisé ou la « panic room » ?
Quand une crise majeure survient (Incident Sev1), votre processus ressemble-t-il à une ruche organisée ou à une « panic room » où tout le monde crie ?
La réponse habituelle : « C’est une question d’outillage et de processus. »
La vraie réponse, celle qu’on ose rarement dire : c’est aussi une question de santé mentale et de soutenabilité humaine.
Lors d’une panne critique, le MTTR (Temps Moyen de Résolution) explose rarement à cause de la complexité technique du bug. Il explose à cause de la communication défaillante : « Qui doit-on appeler ? », « Qui est d’astreinte ce soir ? », « Qui sont les bons interlocuteurs à mettre autour de la table ? ».
Mais derrière ces questions opérationnelles se cache une dimension psychologique rarement évoquée.
La charge cognitive invisible de l’astreinte
L’ergonomie nous apprend que l’astreinte génère une charge cognitive continue, même quand rien ne se passe.
Vous êtes en astreinte ? Votre cerveau ne déconnecte jamais vraiment :
→ Vous vérifiez régulièrement votre téléphone
→ Vous évitez les sorties qui ralentiraient votre capacité de réaction (et si ça sonne ?)
→ Votre sommeil est plus léger (en attente inconsciente de l’alerte)
C’est ce qu’on appelle la « disponibilité psychique permanente » : même non sollicité, vous êtes en état de veille.
L’astreinte, c’est en quelque sorte porter seul le poids de la responsabilité pour l’ensemble de l’organisation.
« Si je rate l’alerte, des millions d’euros de CA sont perdus. Si je me trompe dans le diagnostic, la panne dure 2h de plus. » Cette pression est écrasante.
Le duo JSM + Operations : automatiser pour protéger
Le duo Jira Service Management (JSM) + Operations est la réponse structurée d’Atlassian à ce chaos :
L’alerte ciblée (Operations)
Arrêtez de réveiller toute l’équipe. Les plannings d’astreinte et les règles d’escalade ciblent la bonne personne immédiatement (SMS, Appel, Push). Si elle ne répond pas en 5 min, ça escalade au manager.
Techniquement, c’est efficace. Humainement, c’est vital : ne plus réveiller 10 personnes mais seulement celle qui est d’astreinte, c’est protéger le droit au repos des 9 autres.
La « War Room » (JSM)
Dès que l’incident est qualifié de « Majeur », un ticket spécial est créé, un canal Slack dédié est ouvert automatiquement, et une conférence Teams est lancée.
Techniquement, cela structure la communication. Psychiquement, cela soulage : vous n’êtes plus seul face au problème. L’escalade automatique signifie : « si c’est trop grave, du renfort arrive automatiquement ».
️ Ce que l’outil ne résout pas
Mais soyons lucides : l’outil ne résout pas tout.
Il ne résout pas :
→ La fatigue accumulée après une semaine d’astreinte sans incident, mais en vigilance permanente
→ Le sentiment de culpabilité quand on a mis 7 minutes à répondre au lieu de 5
→ La difficulté à retrouver le sommeil après avoir résolu un incident à 3h du matin
→ Le déséquilibre vie pro/perso quand les astreintes s’enchaînent trop fréquemment
La sociologie du travail nous apprend que les astreintes sont souvent un marqueur de hiérarchie : plus vous montez, moins vous faites d’astreintes. C’est le « sale boulot » qu’on délègue aux plus juniors ou aux externes.
Mais ironiquement, ce sont aussi ceux qui ont le moins d’expérience pour gérer la complexité d’un Sev1 à 3h du matin, seuls, fatigués, stressés.
ITIL 4 : collaborer, oui, mais aussi protéger
L’ITIL 4 nous enseigne de « Collaborer et promouvoir la visibilité ». C’est exactement ce que permet un processus de gestion des incidents majeurs (MIM) bien outillé.
Mais j’ajouterais : et protéger la santé des équipes.
Un bon processus MIM avec JSM + Operations doit aussi :
→ Limiter la fréquence des astreintes (rotation fair, temps de récupération)
→ Prévoir un debriefing post-incident qui ne soit pas que technique mais aussi humain : « Comment t’es-tu senti ? Avais-tu besoin d’aide ? »
→ Valoriser et compenser financièrement les astreintes (ce n’est pas « normal » d’être disponible 24/7)
→ Mesurer et limiter le nombre d’alertes pour éviter la « fatigue d’alerte » (trop d’alertes = désensibilisation)
La vraie question : votre organisation traite-t-elle l’astreinte comme un enjeu de santé au travail ou comme une contrainte technique à optimiser ?




