Depuis plusieurs semaines nous constatons des instabilités sur les hosts AMD de la gamme 2014.
Elles se caractérisent, du point de vue vSphere, par une indispo du host dans l'inventaire.
Des hosts de spare sont ajoutés lorsque l'évènement se produit et dans la plupart des cas le host impacté est retiré de l'inventaire.
Des investigations sur la perte de disponibilité sont en cours dans nos labo.
Update(s):
Date: 2016-03-17 13:41:55 UTC Le problème a été corrigé sur tous les hosts du parc.
Date: 2016-01-14 10:24:26 UTC Nous avons trouvé un moyen de retrouver l'info lors du recyclage des hosts.
Nous préparons une maintenance pour échanger les hosts non modifiés par des hosts modifiés.
Date: 2015-12-29 13:27:52 UTC Nous sommes toujours en train de travailler sur un moyen de retrouver ces infos via ESXi
Date: 2015-11-16 10:45:41 UTC Tous les tests que nous avons fait sont concluants. Il y a ces paramètres à changer dans le BIOS :
BIOS Menu \\Advanced \\Procoess&Clock options
- C State Mode =Disabled
- C1E Support = Disabled
BIOS Menu \\Advanced \\Advanced Chipset Control \\Memory Configuration
- Power Down Enabled = Disabled
Nous travaillons sur un moyen de retrouver ces infos via ESXi pour prévoir les clients impactés.
Date: 2015-11-04 09:38:58 UTC Après plusieurs investigations l'origine de la perte du host vient de settings du BIOS à configurer différement.
Après les avoir changé, nous ne constatons plus d'indisponibilité.
Cette indisponibilité intervient dans le temps et n'est lié qu'aux profils L/L+ de la gamme.
Du fait que la panne ne survient qu'au bout d'un certain temps, il nous est nécessaire d'avoir des tests sur du long terme sur ce type de matériel.
Pour le moment, le changement des settings du BIOS corrige tous les symptomes.
Une mise à jour du parc sera à prévoir le cas échéant.