Lenteur et indisponibilité des services mail globenet et no-log.
Par Mistur, lundi 9 janvier 2006 à 12:14 - Incidents - #48 - rss
Le SMTP est indisponible depuis hier soir sur Hal (le serveur de courrier de no-log).
Sur Est (le serveur de courrier + listes de globenet.org) il semble que le nouveau ventilateur installé hier ne tourne pas assez vite pour assurer un refroidissement correct du processeur. Ceci entraine une forte charge rendant les services indisponibles. Nous avons du arrêter Mailman (le logiciel de gestion des listes) afin de rendre les services courrier (SMTP, POP, IMAP) accessibles.
Nous travaillons actuellement au rétablissement des service.
maj @ 13h36 : Jacques se rend au TH2
Il y a des soucis sur Hal, la machine de no-log. Une vérification des filesystems est nécessaire ce qui va entrainer un arrêt des services de No-Log.
De plus, le changement de ventilateur sur Est n'a pas été bénéfique, on va donc remettre l'ancien afin que les services mail (webmail, pop, imap et mailing list) de globenet re-fonctionnent de manière correcte. Cette opération devrait entrainer un arrêt de service d'environ 15 min.
Le service Mailman a été relancé entre temps, un fois la charge liée aux services pop et imap redescendu.
maj @ 15h22 : Nous travaillons sur la vérification des filesystems de Hal, le serveur de mail de globenet Est fonctionne même si les temps de réponse sont un peu lent. dès que le serveur de no-log est rétabli, nous nous occuperons de Est (enfin Jacques s'en occupera).
maj @ 15h40 : L'opération dure un peu sur Hal. Nous devons attendre la fin de la synchronisation des partitions RAID afin de pouvoir finir les vérifications. Ces opérations devraient durer encore 45min à 1h.
maj @ 15h50 : En attendant la fin de l'opération sur Hal, Jacques effectue l'opération sur Est.
maj @ 16h50: Pour Hal, il semble que la memoire (neuve!) soit en cause... Est a toujours un peu trop chaud, Jacques peaufine la configuration du ventilo!!!
maj @ 22h30: Jacques est toujours dans la salle machine. Il a du verifier toutes les barrettes de RAM des serveurs, et découvrir des incompatibilités et défaillances insoupçonnées; bricoler le ventilo tout neuf qui veut pas tourner aussi vite que son prédécesseur; réparer des partitions sur des disques. Tout cela bien sur en simultané, alors qu'une panne peut en cacher une autre...
maj @ 00h00: Ca semble OK. Les serveurs sont repartis, la RAM valable est branchée là où ça marche, les filesystems ont été réparés, le ventilo tourne pas trop mal. Les services fonctionnent donc en théorie; en pratique, ils sont encore un peu surchargés par tous les messages qu'ils doivent traiter en raison de la pause qui vient de prendre fin. Ca devrait se décanter doucement et revenir au beau fixe au cours de la nuit. (PS : pour les anecdotes et le récit "vécu", autour de la bière demain soir après la réunion mensuelle de Globenet... :-)
Commentaires
1. Le lundi 9 janvier 2006 à 13:05, par Kryss
2. Le lundi 9 janvier 2006 à 13:32, par Virgilus
3. Le lundi 9 janvier 2006 à 16:43, par yakuza - site
4. Le lundi 9 janvier 2006 à 16:46, par Alain
5. Le lundi 9 janvier 2006 à 17:22, par Thomas
6. Le lundi 9 janvier 2006 à 18:52, par ayk
7. Le lundi 9 janvier 2006 à 19:17, par JEFF64
8. Le lundi 9 janvier 2006 à 19:28, par kml
9. Le lundi 9 janvier 2006 à 19:34, par 6mouches
10. Le lundi 9 janvier 2006 à 19:43, par ernestine
11. Le lundi 9 janvier 2006 à 19:44, par salamander - site
12. Le lundi 9 janvier 2006 à 20:42, par skamp
13. Le lundi 9 janvier 2006 à 21:55, par claudanyok
14. Le lundi 9 janvier 2006 à 22:05, par bishop
15. Le lundi 9 janvier 2006 à 22:48, par chab
16. Le lundi 9 janvier 2006 à 23:27, par Metaldeth
17. Le lundi 9 janvier 2006 à 23:35, par ayk
18. Le lundi 9 janvier 2006 à 23:41, par clem
19. Le mardi 10 janvier 2006 à 01:22, par marie
20. Le mardi 10 janvier 2006 à 13:43, par julls
21. Le mardi 10 janvier 2006 à 14:42, par ayk
22. Le mardi 10 janvier 2006 à 15:08, par Mistur - site
23. Le mardi 10 janvier 2006 à 18:50, par FrancisM
24. Le mercredi 11 janvier 2006 à 18:50, par freddo
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.