11
La relance du serveur d’exploitation n’aura guère durée, trois jours plus tard il est définitivement hors service.
La relance du serveur d’exploitation n’aura guère durée, trois jours plus tard il est définitivement hors service.
Le serveur NetBSD sur lequel est basé l’exploitation du réseau est tombé en panne cette nuit à 2H du matin, au bout de quatre ans et quelques mois de loyaux services.
raid0: Components: /dev/wd0a /dev/wd1a[**FAILED**]
Après deux redémarrages de la machine, l’état est stable avec toutefois le second disque toujours hors ligne; réinitialisation du disque par la commande raidctl -R /dev/wd1a raid0; cette opération a remis le disque en service en 2H15, extrait du dmesg :
raid0: initiating in-place reconstruction on column 1
raid0: Reconstruction of disk at col 1 completed
raid0: Recon time was 7873.565271 seconds, accumulated XOR time was 0 us (0.000000)
raid0: (start time 1260264857 sec 255594 usec, end time 1260272730 sec 820865 usec)
raid0: Total head-sep stall count was 0
raid0: 4815955 recon event waits, 1946 recon delays
raid0: 28180000 max exec ticks
Reprise des services (http, cacti, etc …) à 9H45, aucune incidence directe pour les abonnés.
Le serveur d’exploitation est tombé en panne à 2H du matin durant le processus de sauvegarde des données. Le problème vient du raid logiciel des disques durs qui donnait des signes de faiblesse depuis quelques semaines.
Relancé à 11H30, aucun abonné n’a été impacté, juste un gros trou dans les données cacti et une indisponibilité des sites http (www.lekermeur.net, blog.lekermeur.net, www.nature-bretagne.net).