{
    "uuid": "d7f3de89cf8ef3c8d62de19ec06e7370",
    "slug": "gtb-supervision-test-datacenter",
    "lang": "fr",
    "audience": null,
    "count": 6,
    "conseils": [
        {
            "uuid": "c6e09ca30a9e4a4daa5ad4df9f3ac0a7",
            "category": "operational",
            "audience": [
                "technician",
                "auditor"
            ],
            "severity": "mandatory",
            "title": "Tester chaque alarme critique en mode simulation avant validation",
            "content": "Ne pas se limiter à vérifier l'existence du point dans la supervision. Simuler chaque alarme critique (température salle, haute tension, coupure secteur, incendie, perte de groupe froid) et vérifier que la notification remonte correctement jusqu'au destinataire final (astreinte, plateau de supervision, SMS). Un point qui apparaît 'OK' en supervision mais dont la chaîne de notification est interrompue ne sert à rien. Consigner pour chaque alarme : mode de test, résultat, temps de remontée."
        },
        {
            "uuid": "3510d37b76a349e899fc82f9356a7173",
            "category": "safety",
            "audience": [
                "technician",
                "manager"
            ],
            "severity": "critical",
            "title": "Vérifier la cohérence entre les seuils d'alarme et les valeurs admissibles",
            "content": "Les seuils d'alarme température doivent être paramétrés en dessous des seuils admissibles des équipements surveillés. Par exemple, si la température maximale admissible d'une salle serveur est 35 degC (ASHRAE A2), l'alarme critique doit se déclencher à 30 degC et l'alarme d'avertissement à 25 degC. Des seuils mal paramétrés (ex : alarme à 40 degC alors que les équipements s'arrêtent à 38 degC) peuvent laisser endommager le matériel avant déclenchement. Vérifier et documenter chaque seuil."
        },
        {
            "uuid": "175628d3a96549a890f0d6609ea494a8",
            "category": "maintenance",
            "audience": [
                "technician"
            ],
            "severity": "mandatory",
            "title": "Tester la communication entre automates et serveur de supervision",
            "content": "Vérifier la latence et la fiabilité du protocole de communication (BACnet, Modbus, SNMP selon l'installation). Un automate qui ne répond plus depuis 30 minutes sans alarme générée est une faille grave. Tester le comportement en cas de perte de communication : la supervision doit générer une alarme de perte de contact dans les 5 minutes maximum. Vérifier l'horodatage des événements : un décalage d'horloge entre automates et serveur fausse les corrélations d'incidents."
        },
        {
            "uuid": "8feb624b40364c60b037ff8c06ce63e4",
            "category": "operational",
            "audience": [
                "technician",
                "auditor"
            ],
            "severity": "recommended",
            "title": "Vérifier l'archivage des données historiques",
            "content": "La supervision doit archiver les données de température, d'humidité et de puissance sur au moins 12 mois glissants. Vérifier que l'espace disque est suffisant et que la rotation des archives ne supprime pas de données récentes. Tester l'export des données historiques (CSV ou format standard) pour s'assurer que les archives sont exploitables en cas d'audit ou d'analyse post-incident."
        },
        {
            "uuid": "666352751e1b41ef9caa771d0c8444df",
            "category": "regulatory",
            "audience": [
                "manager",
                "auditor"
            ],
            "severity": "mandatory",
            "title": "Documenter la topologie de supervision et les responsabilités d'astreinte",
            "content": "Le rapport de test GTB doit inclure le schéma logique de la supervision (automates, capteurs, protocoles), la liste des alarmes avec leurs seuils, la matrice d'escalade (qui est notifié, par quel moyen, dans quel délai) et les coordonnées de l'astreinte technique. Cette documentation est exigée par les certifications datacenter (Tier, ISO 27001, HDS) et par les clients colocataires. Mettre à jour à chaque modification de configuration."
        },
        {
            "uuid": "7648558c1ba74159b5ec136a45553353",
            "category": "operational",
            "audience": [
                "technician"
            ],
            "severity": "recommended",
            "title": "Tester le basculement en mode secours de la supervision elle-même",
            "content": "Si la supervision est en haute disponibilité (redondance serveur, alimentation sur onduleur), tester le basculement : couper le serveur principal et vérifier que le serveur de secours prend le relai sans perte de données et sans rupture de la notification d'alarme. Un serveur de supervision qui s'arrête pendant une coupure secteur (le moment où les alarmes sont les plus nombreuses) est une configuration inutile."
        }
    ]
}