La façon la plus rapide de tuer une preuve de concept réussie est de la remettre aux opérations sans observabilité. Vous avez construit quelque chose qui fonctionne. Ça résout le problème. Tout le monde est excité. Puis ça atterrit en production et l'équipe SRE n'a aucune idée de comment le surveiller, aucun moyen de le déboguer, et aucune confiance pour le rollback si quelque chose casse à 2h du matin.
Six mois plus tard, ça tourne toujours sur le laptop du développeur original parce que personne ne lui faisait assez confiance pour le faire tourner correctement.
Nous résolvons cela avec ce que nous appelons le contrat de télémétrie : un ensemble d'exigences non négociables d'observabilité et de transfert qui accompagnent chaque Proof Sprint.
Pourquoi la télémétrie est un problème de livraison, pas d'ops
La plupart des équipes traitent l'observabilité comme quelque chose que les ops ajoutent après la livraison. Le contrat de télémétrie inverse cela. L'observabilité est une exigence de livraison, pas une réflexion après coup.
Parité des signaux : vos collecteurs, vos tableaux de bord
Chaque Proof Sprint émet des traces, métriques et logs dans les formats que le client utilise déjà. S'ils sont sur Datadog, nous émettons vers Datadog. S'ils sont sur Grafana avec Prometheus et Loki, nous émettons vers ceux-ci.
Le paquet de preuves
Chaque Proof Sprint inclut un paquet de preuves : un bundle documenté d'artefacts de sécurité et opérationnels. Le paquet comprend : SBOM, rapport SCA, diff IAM, et documentation du flux de données.
Piste pour ops : rendre le Jour 2 ennuyeux
Le premier jour qu'un système tourne en production est excitant. Le deuxième jour devrait être ennuyeux. Nous concevons pour des Jours 2 ennuyeux avec : plan de déploiement canary, runbooks, procédures de rollback, et notes de planification de capacité.
Pourquoi c'est important pour le business case
Le contrat de télémétrie dé-risque tout cela dès le départ. Quand nous transférons le Proof Sprint, l'équipe ops sait déjà comment le supporter parce qu'ils utilisent leurs outils existants.