Déc 2009
11

La relance du serveur d’exploitation n’aura guère durée, trois jours plus tard il est définitivement hors service.

Déc 2009
08

Le serveur NetBSD sur lequel est basé l’exploitation du réseau est tombé en panne cette nuit à 2H du matin, au bout de quatre ans et quelques mois de loyaux services.




Le second disque du système RAID s’est mis hors service, extrait dmesg :

raid0: Components: /dev/wd0a /dev/wd1a[**FAILED**]

Après deux redémarrages de la machine, l’état est stable avec toutefois le second disque toujours hors ligne; réinitialisation du disque par la commande raidctl -R /dev/wd1a raid0; cette opération a remis le disque en service en 2H15, extrait du dmesg :

raid0: initiating in-place reconstruction on column 1
raid0: Reconstruction of disk at col 1 completed
raid0: Recon time was 7873.565271 seconds, accumulated XOR time was 0 us (0.000000)
raid0: (start time 1260264857 sec 255594 usec, end time 1260272730 sec 820865 usec)
raid0: Total head-sep stall count was 0
raid0: 4815955 recon event waits, 1946 recon delays
raid0: 28180000 max exec ticks

Reprise des services (http, cacti, etc …) à 9H45, aucune incidence directe pour les abonnés.

Jan 2009
08

Le serveur d’exploitation est tombé en panne à 2H du matin durant le processus de sauvegarde des données. Le problème vient du raid logiciel des disques durs qui donnait des signes de faiblesse depuis quelques semaines.

Relancé à 11H30, aucun abonné n’a été impacté, juste un gros trou dans les données cacti et une indisponibilité des sites http (www.lekermeur.net, blog.lekermeur.net, www.nature-bretagne.net).