ALPHANET: Problèmes

Introduction

Le but de ce document est de lister les problèmes connus, les pannes et la maintenance annoncée. Nous utilisons aussi un système de gestion automatisé de tickets, (rt.alphanet.ch), non accessible au public.

Nous avons historisé les anciens problèmes.

Avis de maintenance de wiki.alphanet.ch.

Arrêts d'exploitation planifiés

Date quoi

Problèmes en cours

Date quoi
2022-07-13 Problème RAM, voir RT#1147, work-around en place
2022-09-16 ~22:30 - Annonce de route 193.72.186.0/24 pas faite, quelques services inatteignables (DS), quelques services se connectent lentement une fois sur 2, cf RT#1178. Le problème semble être lié au routeur de SNN qui n'accepte plus les connexions BGP TCP/179 en v4 (v6 ok). Work-around en place à 11:15 et fonctionnel à 11:17.

Informations

Date quoi
mars 2020 la liaison de secours init7 passe maintenant par du FTTS Swisscom, débit max possible 250/50, actuellement environ 150/50, un débit plus élevé que 100/50 nécessite le changement de l'alix en apu2 et du modem pour G.fast
2020-05-14 liaison principale UPC passe de 250/25 à 1000/100
2020-06-25 mise à jour modem init7, bon délai, meilleur débit ~ 160 MBit/s / 57 MBit/s
2020-07-11 mise à jour de virtual à buster
2020-07-28 - 2020-07-29 mise à jour shakotay à buster (tous services)
2020-11-06 Routage de 193.72.186.0/24 via init7, qui est plus performant qu'UPC pour ce VPN: de plus cela nous permet un véritable load-balancing et haute disponibilité sur quelques services (web notamment)
2020-12-04 Ajouté dans spamassassin: SPF, DKIM et DMARC
2021-11-20 Activation du work-around SPF dans mes mailing-lists et celle de P. C., information des ml-admins
2022-02-25 Activation du blocage SPF & DMARC pour quelques domaines historiques utilisés par les spammeurs
2022-07-13 Changement câble téléphonique à Chalet 4, distance passe à 167 m, débits 373/82; mesuré 24.6 MByte/s et 9.1 MByte/s
2022-08-05 18h-22h test RAM et divers maintenance (RT#1147, #1122)
2022-08-18 13h30-15h30 coupure courant pour introduction Chalet 4 (groupe-e m'a téléphoné un peu tard); finalement aucun downtime à part le WiFi? Chaumont, grâce à la batterie solaire RT#1152

Problèmes et changements récents (résolus)

Date quoi

2020-08-06 14h-14h20 mise à jour firmware modem UPC suite aux problèmes relevés avec OpenVPN? UDP (cf RT#912), semble corriger le problème
2020-08-08 redémarrage virtual pour derniers tests liés à la mise à jour
2020-08-06 Depuis à mise à jour de virtual à buster, les I/O ne sont plus aussi fluides qu'avant. Le scheduler CFQ n'existe plus et le défaut semble être un scheduler plus agressif orienté desktop. Divers work-arounds sont en cours de test (p.ex. utilisation du scheduler I/O BFQ, limitation des tailles I/O écriture), voir RT#911 semblent avoir montré leur efficacité maintenant.
2020-10-03 - 2020-10-09 Problème UDP Cablecom: à la fois pour les deux VPNs et pour Jitsi. Basculement VPN-SNN sur init7 en attendant. Réouvert RT#912. Problème semble corrigé le 2020-10-09 15h15 par changement de fw modem.
2020-10-23 Changement de modem UPC, en espérant que cela corrige le problème de pertes de paquets UDP découvert depuis le 2020-10-03 (deux VPN, VoIP, Jitsi). Voir RT#912. A l'air de marcher.
2020-10-26 23:00 - 00:00 Panne UPC
2020-12-09 23:00 - 2020-12-10 08:00 Problème certificat SNN pour 193.72.186.0/24, mis dans RT le prochain changement en 2022
2020-12-10 machine bloquée, beaucoup d'I/O, sync+reboot nécessaire; est-ce lié aux dernières màj? ou problème mod_perl sur 103, voir RT#951, désormais mise en place limitation cyclique Apache 103/104 et limite dure mémoire sur conteneurs
2020-12-19 mise à jour du kernel de 4.19.0-10-amd64 à 13; test clé USB boot; recâblage électrique
2020-12-25 Reconfiguration Ethernet / VLAN / 10GBit en fin d'après-midi (RT#900)
2021-01-15 (soir), 2021-01-17 (après-midi) Investigations des problèmes de redémarrage systemd RT#956, plusieurs redémarrages nécessaires. Semble OK
2021-01-31 bl.spamcop.net plus valable, remis en mars avec surveillance automatique, voire RT#966
2021-04-20 Panne net2000 7h20-8h30 environ (ampli en panne dans la région), re-panne autour de 8h47, remarche à 8h53, replanté à 9h13, ok à 9h15
2021-05-07 Panne init7 17h-17h51
2021-05-07 20:06-20:24 Mise à jour kernel virtual, redémarrage de tous les services
2021-07-09 11:02-11:28 Mise à jour kernel virtual à -17, pas vraiment nouveau microcode 0x21, redémarrage de tous les services
2021-09-02 UPS plus beaucoup de capacité (RT#646)
2021-09-24 11:30 Changement certificat SSL https et IMAP/POP/SMTP cf RT#711
2021-09-24 soir changement enclosure disque bruyant
2021-09-18 IDS un peu trop sensible aux erreurs naturelles auth/basic Apache2, tentative d'amélioration (RT#1024); semble mieux
2021-09-24 midi ou début d'après-midi ajout ventilateur: effectué, en test, OK
2021-10-15 17h15-17h30 Mise à jour kernel, suppression LED ventilateurs, ajout câble série (RT#1033)
2021-11-20 17:35 Arrêt intempestif à cause test UPS (vide), cf RT#646
2021-11-24 reboot intempestif de tout en raison coupure de courant et UPS en panne
2021-11-25 16h20-16h40 changement UPS, arrêt virtual pour tests
2021-12-15 Activé SPF, DKIM et DMARC (en mode soft, sur lists.alphanet.ch et alphanet.ch), en raison des problèmes d'envoi de notifications de mailing-lists, de mailing-lists et du test de ping gmail, semble corrigé
2022-01-21 Reboot virtual
2022-02-05 13h30-14h15 remplacement CMOS battery et reconfig BIOS (notamment AHCI) et test ventilateur CPU (RT#1052)
2022-07-13 10h11-10h57 mise à jour kernel et microcode, tests RAM (RT#1147) et tests ou résolution problème bridge/fw RT#1100
2022-10-09 infomaniak exclu du greylisting, car plusieurs serveurs en sortie et un test a montré qu'avec delay=300 (5 minutes), ça devient plutôt 1 heure
2022-10-09 7h59-10h30 arrêt pour cause indéterminée serveur virtual, diagnostic en cours; quelques améliorations effectuées (RT#1191)

 
info@alphanet.ch - Copyright © 1997-2009 - ALPHANET / Marc SCHAEFER