EX101 : Problèmes de stabilité avec l’i9-13900

* Je pense

J’ai récemment commandé 4 EX101. L’un d’eux plantait aléatoirement sans aucune raison et devenait injoignable en SSH ou par ping, il cessait simplement d’exister, parfois en ne faisant rien ou même lorsqu’il était connecté en SSH et restait inactif. J’ai contacté le support et en ai remplacé un, puis au bout d’un moment, un deuxième a commencé à faire la même chose de manière aléatoire, parfois après des heures de fonctionnement, parfois après des jours.

J’ai utilisé plusieurs EX44 et aucun problème avec eux. Je pense que le problème vient de l’Intel i9-13900.

J’ai résilié tous les serveurs car ils semblaient bien trop peu fiables pour être utilisés en production, même de loin.

Quelqu’un d’autre a-t-il vécu cela ?

26 replies

  1. Tsuneo Ouchi · 2 weeks ago

    Je ne suis pas autant Intel, mais les 13e et 14e générations n’étaient-elles pas connues pour des problèmes de stabilité matérielle ? Je me souviens avoir vu des chaînes YouTube en parler, mais je ne suis pas sûr de savoir comment cela s’est terminé.

    1. Jürgen Kruse · 1 week ago

      Oui, c’est exact, mais à un moment donné, Intel a reconnu le problème et a publié une mise à jour de microcode pour le corriger, si je me souviens bien — ne me citez pas là-dessus.

  2. Annika Ott · 2 weeks ago

    Optez pour le 12900k si vous le pouvez, ou si vous avez absolument besoin de plus de performances, passez peut-être au niveau supérieur au-dessus du 13900k.

  3. Olivia Reid · 2 weeks ago

    Fonctionne-t-il de manière stable et sans problème depuis le remplacement ?

    1. Jürgen Kruse · 2 weeks ago

      J’ai annulé tous les serveurs EX101, trop risqué.

      1. Jörg Wagner · 2 weeks ago

        Vous devriez créer votre propre fil de discussion, le problème de l’OP n’a rien à voir avec ce que vous vivez.

        1. Jiro Kojima · 2 weeks ago

          J’ai ouvert un ticket et j’ai réussi à le résoudre. Mais on pourrait dire que c’était un problème de compétence, c’était un problème de pare-feu.

  4. Kenneth Wallace · 2 weeks ago

    Je peux comprendre.
    J’ai géré environ 100 serveurs chez Hetzner ces 10 dernières années environ, et les EX101 sont un mystère. Les disques sont bons, la RAM est correcte, les températures sont bonnes, j’ai même demandé à Hetzner d’effectuer un contrôle matériel complet sur l’un d’eux, et il n’y a rien à signaler. En apparence, du moins. Sur le premier lot de 8 EX101 que j’ai commandé, 4 sont devenus totalement inutilisables en quelques mois.
    Des segfaults, des cœurs de CPU qui se bloquent, puis ils deviennent injoignables de manière aléatoire et je dois faire un reset forcé depuis le robot.
    Je vais tous les retirer du service et les remplacer par des AX102, j’en ai déjà pas mal et ils sont d’une fiabilité à toute épreuve.

    1. Jürgen Kruse · 1 week ago

      Merci de confirmer, donc je ne suis pas fou 😅
      Je pensais juste que leurs autres serveurs sont ultra fiables, donc ce n’était pas possible, j’avais dû faire une erreur.
      Je suis content de ne pas avoir déplacé mes applications de production chez eux, sinon cela aurait probablement tué l’entreprise 😆

      1. Emil Graf · 1 week ago

        On dirait qu’ils rencontrent les mêmes problèmes que ceux rencontrés par les Intel de 13e et 14e générations sur les systèmes de bureau.
        Je suis plutôt un adepte d’AMD à la maison, alors que j’ai surtout utilisé des Xeon au travail, je n’étais pas au courant du risque.
        Quoi qu’il en soit, j’ai déjà essayé de mettre à jour le BIOS sur ces EX101, cela n’a absolument rien changé.

        1. Jürgen Kruse · 1 week ago

          J’ai eu les deux variantes suivantes recommandées par un utilisateur sur ce fil, le Dell DX 182 et l’AX102 chez Hetzner. Il a dit qu’il était passé à ceux-ci et qu’ils semblaient stables.

  5. Elizabeth Riley · 2 weeks ago

    Au fil des années, j’ai eu près d’une centaine de serveurs ici, et très peu (peut-être 2 ou 3) ont initialement eu des problèmes de ce genre. Ils ont été remplacés assez rapidement et sans difficulté. Je tends cependant à choisir ceux d’AMD, principalement par préférence personnelle.

    1. Jürgen Kruse · 2 weeks ago

      Ouais moi aussi, j’utilise 5 EX44 depuis un bon moment maintenant et sans aucun problème, je pense que seul le EX101 avec l’Intel i9-13900 est concerné.

  6. Vivienne Jensen · 2 weeks ago

    Oui, nous avons eu 2 sur 2 qui ont échoué après plusieurs mois

    1. Jürgen Kruse · 2 weeks ago

      Heureux de savoir que je ne suis pas le seul. J’ai vraiment écarté une panne matérielle pendant des semaines parce que je me disais : « C’est pas possible, ça doit être moi qui ai merdé ». Du coup, j’ai réinstallé le système plusieurs fois. Parfois, je ne changeais même rien après une installation propre, juste pour vérifier si ça planterait, et ça a effectivement planté.

  7. Lia Sievers · 2 weeks ago

    Bonjour OP et les autres redditeurs, Si vous pensez qu’il y a un problème matériel de notre côté, veuillez le documenter avec le plus de détails possible et informer notre équipe des démarches de dépannage que vous avez effectuées en leur envoyant une demande de support via Robot. Vous pouvez également demander à l’équipe d’effectuer une vérification matérielle complète, et bien entendu, s’il y a un problème, notre équipe remplacera le matériel dès que possible. –Katie

    1. Jürgen Kruse · 2 weeks ago

      Merci pour votre réponse. Oui, j’ai fait cela, le support a été très utile et a remplacé le matériel rapidement sans poser de questions. Mais j’ai commencé cette discussion pour savoir si ce problème affecte toute la gamme EX101.

      Au fait, le support a effectué un contrôle matériel sur les deux serveurs et rien n’est ressorti.

  8. Megan Jackson · 1 week ago

    En général, cette génération de matériel Intel côté grand public a connu des problèmes d’instabilité et de dégradation (c’est bien pour ça que le matériel serveur existe, après tout). J’imagine que c’est bien pire pour un matériel qui est toujours sous tension.

    Personnellement, je déconseillerais à quiconque de les utiliser.

    Je ne pense pas qu’ils en aient beaucoup en circulation, étant donné que l’AX102 est un produit bien supérieur avec le double de mémoire vive, des performances CPU supérieures et une licence par cœur bien plus facile à gérer (je vous déteste, Microsoft), sans oublier le cache 3D qui, au pire, ne peut pas faire de mal.

  9. Eugénie Martins · 1 week ago

    Aussi : assurez-vous de le signaler lors de l’annulation, Hetzner a tendance à conserver des statistiques sur le matériel problématique.

    Ils ont récemment procédé à un remplacement majeur de cartes mères en raison de statistiques de défaillance.

    1. Jürgen Kruse · 1 week ago

      Bon à savoir ! Que veux-tu dire par « rapport » ? J’ai demandé un remplacement et je leur ai spécifiquement dit que c’était à cause d’un matériel défectueux et j’ai décrit le problème en détail.

      1. Quinn Jennings · 1 week ago

        Oui, c’est tout, juste pour qu’ils sachent quel serveur et pourquoi, et en général, ils vont examiner ça.

    2. Lincoln Reyes · 1 week ago

      Si je me souviens bien, les cartes mères défectueuses étaient les cartes Epyc d’ASRock. Les cartes Intel avaient-elles aussi des problèmes ?

      1. Amelia Brooks · 1 week ago

        Pas celles d’Intel, mais certaines cartes AMD d’entrée de gamme (AX41, je crois) ont également été remplacées récemment, si je me souviens bien.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *