Déc 2009
29

Le relais du Gaec des Chênes, mis en place en Aout 2006, a été entièrement refait et sa desserte modifiée.

Les deux Linksys sous Openwrt ont été remplacés par une carte Mikrotik RB411AR dans un boîtier antenne Station Box.

Déc 2009
28

Sous OpenBSD, après l’installation du package nut, en fonctionnant sur le câble USB avec le driver usbhid-ups, on obtient le message d’erreur :

Network UPS Tools: 0.29 USB communication driver - core 0.32 ()
No matching HID UPS found
Driver failed to start (exit status=1)

Ce message met sur une fausse piste pour la résolution du problème, il s’agit en fait d’un simple problème de droits d’écriture sur les devices /dev/ugen*, il suffit de les rendre accessibles à l’utilisateur _ups pour que tout fonctionne.

A noter que l’entrée port du fichier de configuration /etc/nut/ups.conf doit absolument être renseignée pour que le daemon upsd se lance, mais  qu’on peut y mettre n’importe quoi comme valeur (auto, toto, /dev/tty00, …), le driver se chargeant de trouver lui même les bon ports (/dev/ugen0.00 et /dev/ugen0.01 d’après la commande fstat -u _ups -n), ce qui donne la configuration ci-dessous, pour un onduleur MGE Ellipse 1500 :

[ellipse]
driver=usbhid-ups
# La valeur port est ignore par ce driver
port=auto
vendorid=0463
productid=ffff
desc="MGE Ellipse 1500"

Instabilités du driver usbhid-ups

Elles se traduisent par des erreurs ‘Data stale‘, pour les corriger augmenter la valeur MAXAGE dans upsd.conf; si cette modification ne suffit pas, un script bien bourrin de relance du driver, en crontab, fait aussi l’affaire :

#!/usr/local/bin/bash
TST=$(/usr/local/bin/upsc ellipse ups.status 2>/dev/null)
if [ "x$TST" == "x" ]; then
 /usr/local/bin/upsdrvctl stop
 /usr/local/bin/upsdrvctl start
 logger -p local0.notice -t NUT "Relance daemon UPS"
fi

Depuis la version 4.6 d’OpenBSD, ces erreurs semblent avoir disparues.

Déc 2009
28

Suite à l’incident sur le serveur, les services liés à l’exploitation du réseau sont séparés des services purement Web et placés sur une carte Alix 2D3, avec un disque dur 2,5″, sous OpenBSD.

Cette séparation permet une meilleure tenue des onduleurs du fait de la faible consommation de l’ensemble Alix, de l’ordre de 7W avec le disque dur; en contrepartie l’affichage des graphes de Cacti n’est pas foudroyant mais la collecte des données est ok, jusqu’à 150 devices par minute avec Spine.

Liens :

Monitoring du Net Kermeur, (document PDF)

Extensions SNMP pour Openwrt

Déc 2009
11

La relance du serveur d’exploitation n’aura guère durée, trois jours plus tard il est définitivement hors service.

Déc 2009
08

Le serveur NetBSD sur lequel est basé l’exploitation du réseau est tombé en panne cette nuit à 2H du matin, au bout de quatre ans et quelques mois de loyaux services.




Le second disque du système RAID s’est mis hors service, extrait dmesg :

raid0: Components: /dev/wd0a /dev/wd1a[**FAILED**]

Après deux redémarrages de la machine, l’état est stable avec toutefois le second disque toujours hors ligne; réinitialisation du disque par la commande raidctl -R /dev/wd1a raid0; cette opération a remis le disque en service en 2H15, extrait du dmesg :

raid0: initiating in-place reconstruction on column 1
raid0: Reconstruction of disk at col 1 completed
raid0: Recon time was 7873.565271 seconds, accumulated XOR time was 0 us (0.000000)
raid0: (start time 1260264857 sec 255594 usec, end time 1260272730 sec 820865 usec)
raid0: Total head-sep stall count was 0
raid0: 4815955 recon event waits, 1946 recon delays
raid0: 28180000 max exec ticks

Reprise des services (http, cacti, etc …) à 9H45, aucune incidence directe pour les abonnés.

Déc 2009
06

Coupure de 6H30 à 18H30 le câble d’antenne du Whr137 s’est de nouveau desserti coté routeur, rétablissement provisoire par Patrick J., le propriétaire des lieux.

Cinq abonnés ont été impactés par cet incident, une première intervention avait déjà eu lieu au mois de Mai.

Déc 2009
06

La première alerte de l’hiver 2009/2010, réception du mail de prévision de coupure à 21H depuis le relais du Grinec, toutefois la prévision n’a pas été confirmée par la mesure à 1H du matin et il n’y a donc pas eu de coupure de ce relais cette nuit.
Cette première alerte confirme les observations des années précédentes, la période noire du 15 Novembre au 15 Décembre (Miz Du et Miz Kerzu en breton), les jours plus froids de fin Décembre et du mois de Janvier sont en général plus ensoleillés.

Evolution de la tension batterie (en rouge) ces trois derniers mois.
Le premier délestage réel (mail à 21H00, coupure de 1H à 6H du matin) a eu lieu la nuit du 8 au 9/12.

Déc 2009
05

Sur la base du SDK 3.5 d’AirOS, développement d’un firmware qui, à l’instar du firmware Openwrt déjà en service sur les matériels à base Broadcom (Linksys, Buffalo), permet de personnaliser les configurations de chaque station à partir des données de la base Mysql du serveur d’exploitation ou les traitements batchs de mises à jour.

La QOS est entièrement revue, avec intégration de modules Iptables manquants et un traitement plus proche de celui qui est fait sur les AP Mikrotik avec mises en place de classes de trafic et marquage des paquets.

Un quart du parc est concerné par ces modifications (Nanostation 2 et 5, Nano Loco 5, Bullet 2 et 5).