[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
même les précautions peuvent entrainer des soucis...
- To: Linux 31 <linux-31@culte.org>
- Subject: même les précautions peuvent entrainer des soucis...
- From: "jdd@dodin.org" <jdd@dodin.org>
- Date: Thu, 14 Dec 2023 19:40:04 +0100
- Dkim-signature: v=1; a=rsa-sha256; q=dns/txt; c=relaxed/relaxed; d=dodin.xyz; s=default; h=Content-Transfer-Encoding:Content-Type:To:Subject:From: MIME-Version:Date:Message-ID:Sender:Reply-To:Cc:Content-ID: Content-Description:Resent-Date:Resent-From:Resent-Sender:Resent-To:Resent-Cc :Resent-Message-ID:In-Reply-To:References:List-Id:List-Help:List-Unsubscribe: List-Subscribe:List-Post:List-Owner:List-Archive; bh=IECQ7U4nH5NAgMy+8DIJgQVmKjFcG63X8IYbhTN3uyc=; b=UDADH86pK+SiINRU50k1Mn7VzD B5011x9CfbshP+hB6TpM3gVhC1pcQI7XyjCwFbDH+xJS6in1q9EyFgNTW8LtCPANyHPX8L8C32ph+ BPbFFWUDHsrwDTw+vL+O+TKZU8DaSmu2Epji9HZg+83FK7MLyt7dY8yOVtfqS94GYP75wO+4dczHu MqnNJjvRU2gqHcCa7KIR9ryHueCaBXQuuw1/iUrz6hR7xMUOo5v73qQr/8Vinf3uHBlgGMTvxd3lw yP7Yq3yhvAo7jz7gIoPwSjECrjV16gQNk9I0weixlmhBuoaw+54JmXua3CrTr6w1ISfyz9k+mimZH 56X2ZWPQ==;
Panne générale sur o2switch ce matin: plus de site web, plus de
courrier. Heureusement leur site principal était toujours joignable,
j'ai ouvert un ticket et je n'ai sûrement pas été le seul...
c'est revenu vers 15h (pour moi), et peut-être pas complètement, ce
message n'est pas passé la première fois :-(. La réponse au ticket:
"Bonjour,
Pour suite à l'incident, ayant commencé à s'être déclaré ce matin vers 10h.
Sur l'intégralité de nos serveurs nous utilisons Kernelcare :
https://cloudlinux.com/kernelcare-hosting/
Il s'agit d'un système de patchs pour kernel, afin d'éviter de devoir
redémarrer un serveur à chaque mise à jour du noyau Linux.
Kernelcare est utilisé avec succès par de nombreux hébergeurs, et chez
nous depuis +8ans.
Kernelcare réalise applique automatiquement ses patchs, qui sont censés
êtres testés et ne poser aucun problème.
De même que nous testons aussi, au préalable, sur un lot de serveurs (où
il n'y a pas eu d'incident..)
Ainsi, il n'y a pas de périodicité spécifique ni d'heure d'application :
dès qu'un patch est disponible, il est appliqué.
Ce matin vers 10h tous les serveurs ont réceptionné un patch appliqué
dans la foulée.
Problème : sur ~ 50 machines physiques, le patch a provoqué une
incompatibilité entre le matériel (carte réseau indépendante) et le
kernel. Ayant pour résultat de bloquer complètement le réseau du serveur
physique concerné.
Naturellement, pour annuler le patch, nous devons avoir accès au
réseau.. Réseau qui ne fonctionne plus.
Nous devons donc nous connecter physiquement sur tous les serveurs, voir
ce qu'il est possible de faire,
et le cas échéant remplacer physiquement le carte réseau provoquant
l'incompatibilité sur le serveur concerné.
Ces opérations sont relativement complexes, doivent êtres réalisées
serveur par serveur, et nous faisons au plus vite.
Nous sommes désolé pour le manque d'information le temps d'avoir trouvé
l'origine de l'incident.
Les serveurs concernés vont revenir progressivement en ligne sur le réseau.
Cordialement
Service Technique"
pour info
jdd
--
https://artdagio.fr