**DERNIÈRE ÉDITION :** Dans mon cas, malheureusement, il n’y avait AUCUNE SOLUTION ni d’espoir pour ma 4090. J’ai fait examiner l’ensemble du PC et la GPU était défectueuse. Je l’ai renvoyée en garantie (RMA) et il n’y a plus eu aucun problème.
J’espère que ça pourra aider certains d’entre vous 🙂 **MISE À JOUR :** Ceci n’est pas une solution permanente, mais lorsque j’ai augmenté la taille du fichier d’échange (virtual memory paging file), désactivé le C-State pour le CPU et choisi le mode CPU Lite Load 15 dans le BIOS, les écrans bleus (BSOD) ont semblé disparaître. Cependant, les plantages de nvlddmkm.sys persistent, mais mettent un peu plus de temps à apparaître. Bonjour.
Je vis un véritable enfer avec ce problème depuis presque un mois maintenant. Je me suis fait une nouvelle configuration il y a environ un mois. Pendant les 2-3 premières semaines, tout fonctionnait parfaitement : jeux en paramètres ultras, pas de saccades, pas de lag, et surtout, pas de plantages.
Puis, un jour, j’ai eu un écran bleu (BSOD) pour DPC_WATCHDOG_VIOLATION au bout de 5 minutes dans un jeu. Et jusqu’à aujourd’hui, je ne peux plus lancer aucun jeu de façon stable plus de 10 minutes. La même chose se produit quand j’essaie d’exporter une vidéo.
Dans l’Observateur d’événements, je reçois des erreurs concernant nvlddmkm, notamment les ID d’événement 0, 14 et 153, que je détaillerai plus bas. La configuration du système est la suivante : | Composant | Modèle |
| :— | :— |
| CPU | Intel Core i9-14900k |
| GPU | ZOTAC RTX 4090 AMP Extreme Airo |
| RAM | 32 GB DDR5-4800, Kingston KF552C40-32 + 32 GB DDR5-4800, Kingston KF552C40-32 (64 GB RAM au total) |
| SSD | CT2000P5PSSD8, 1863.02 GB |
| Refroidissement CPU | All-in-One Cooler |
| Alimentation | bequiet! Pure Power 12M 1000W |
| Carte mère | MSI PRO B760M-P |
| OS | Windows 11, 24H2 |
| Moniteur | Dell S2419HGF, 1920×1080, 144Hz | J’ai remarqué que ce problème était souvent signalé, surtout pour la 4090.
Voici tout ce que j’ai essayé jusqu’à présent : 1. Activé et désactivé le XMP dans le BIOS (le problème persiste) ;
2. Désactivé et réactivé l’Hyperthreading et les réglages Turbo pour le CPU (aucune différence) ;
3.
Utilisé DDU pour désinstaller le pilote en mode sans échec et installé une version plus ancienne [537.58] (Cela a rendu certains jeux plus stables, mais d’autres continuaient à planter avec l’ID d’événement 0) ;
4. Modifié les permissions du fichier nvlddmkm.sys pour donner un contrôle total aux utilisateurs (le problème reste) ;
5. Activé le Mode Débogage dans le Nvidia Control Panel ;
6.
Passé sur « Préférence pour les performances maximales » dans le Nvidia Control Panel (aucune différence) ;
7. Désactivé la « Planification GPU matérielle » dans les paramètres Windows (Plus de BSOD, mais les crashes restent) ;
8. Utilisé MSI Afterburner pour sous-volter le cœur et la mémoire du GPU d’environ -52 MHz (aucune différence) ;
9.
Changé le mode PCIe dans le BIOS en 4.0 et 3.0 (aucune différence) ;
10. Désinstallé des programmes comme G-Hub et Wallpaper Engine, désactivé HAGS pour les autres programmes qui le supportaient (aucune différence) ;
11. Désactivé la GPU intégrée dans le Gestionnaire de périphériques (le problème persiste) ;
12.
Désinstallé NVIDIA HD Audio dans le Gestionnaire de périphériques (toujours aucune différence) ;
13. Désactivé le High Precision Event Timer (d’autres disaient que c’était la seule solution, mais rien n’a changé). J’ai aussi essayé de désinstaller avec DDU même les derniers pilotes, sans résultat.
J’ai vu que le pilote 566.36 était réputé être le plus stable pour la 4090, mais ça n’a rien changé non plus. Concernant les erreurs dans l’Observateur d’événements, je reçois ces 3-4 erreurs spécifiques de la source nvlddmkm : > La description de l’ID d’événement 153 de la source nvlddmkm est introuvable. Soit le composant qui déclenche cet événement n’est pas installé sur l’ordinateur local, soit l’installation est corrompue.
Vous pouvez installer ou réparer le composant sur l’ordinateur local.
>
> Si l’événement provient d’un autre ordinateur, les informations d’affichage ont dû être enregistrées avec l’événement.
>
> Les informations suivantes ont été incluses avec l’événement :
>
> \Device\Video3
> Error occurred on GPUID: 100
>
> La ressource de message est présente, mais le message est introuvable dans la table des messages.
> La description de l’ID d’événement 14 de la source nvlddmkm est introuvable. Soit le composant qui déclenche cet événement n’est pas installé sur l’ordinateur local, soit l’installation est corrompue. Vous pouvez installer ou réparer le composant sur l’ordinateur local.
>
> Si l’événement provient d’un autre ordinateur, les informations d’affichage ont dû être enregistrées avec l’événement.
>
> Les informations suivantes ont été incluses avec l’événement :
>
> \Device\Video3
> badfbadf(badfbadf) 00000000 00000000
>
> La ressource de message est présente, mais le message est introuvable dans la table des messages. > La description de l’ID d’événement 0 de la source nvlddmkm est introuvable.
Soit le composant qui déclenche cet événement n’est pas installé sur l’ordinateur local, soit l’installation est corrompue. Vous pouvez installer ou réparer le composant sur l’ordinateur local.
>
> Si l’événement provient d’un autre ordinateur, les informations d’affichage ont dû être enregistrées avec l’événement.
>
> Les informations suivantes ont été incluses avec l’événement :
>
> \Device\Video3
> Error occurred on GPUID: 100 Pour les BSOD, l’erreur de bugcheck dans l’Observateur d’événements est : > L’ordinateur a redémarré après un bugcheck. Le bugcheck était : 0x00000133 (0x0000000000000001, 0x0000000000001e00, 0xfffff80784dc43b0, 0x0000000000000000). À noter que je n’obtenais l’erreur d’ID 153 qu’avec les derniers pilotes.
Quoi qu’il en soit, je me suis arraché les cheveux à chercher une solution. Mes derniers espoirs pour vérifier si le problème est logiciel sont de réinstaller Windows 11 en version 23H2 au lieu de la 24H2 qui était préinstallée, et de mettre à jour le VBIOS de ma GPU, mais je ne suis pas sûr que cela règle le problème. Bref !
Si quelqu’un a vécu cette galère et a une idée pour la résoudre, toute aide serait grandement appréciée ! Merci pour votre temps
J’ai eu le même problème avec mon i9-14900k. J’ai essayé quelques paramètres dans le BIOS, ça a aidé un peu. Mais rien ne vaut un remplacement si la carte graphique est défectueuse.
Hey! Thank you for letting me know! Yeah, what you said makes total sense. Hopefully Microsoft can bring an actual good update for once. I did actually try all of those workarounds: 1. Disabled HAGS, which made the BSODs drop in frequency but the nvlddmkm.sys remain. 2. TDRDelay only made the freezes delay more but didn’t initially solve anything. 3. Disabled Overlay for steam, yet the crashes still remain. I was actually curious to try Windows 10 and see if that would make any difference. Not so sure though. Again, thanks for the help!
Upgrade to the (largest) and highest quality power supply you can afford, check or replace your GPU power cables, check the power cable connector and inspect for degradation, be sure the power cables are well connected and verify 12V at the GPU 12VHPWR Voltage (or similar GPU Rail Power/PCIe Power Voltage) in HWiNFO. When the GPU is under full load, how much does that voltage droop from the « ideal » 12.0-12.1 V seen at idle? For really high-end cards pulling 450W+, a droop down to around 11.65 to 11.7 or lower is likely to cause this error.. If your voltage droop is more than that, you might even get an occasional black screen and then a message « Windows had reset your graphics driver and recovered », or it may not recover (just stays a black screen). You may also get a TDR Timeout and VIDEO\_TDR\_FAILURE 0x116 BSOD. Reinstalling drivers via DDU, setting the adapter to Performance Mode, disabling HAGS or MPO, or changing TDR timeout settings etc. will have zero long-term effect on solving your issue (IMO). CHECK VOLTAGE under load and do whatever it takes to get minimal vdroop using a clean, low transient voltage at the GPU.
I returned the card back and it turned out that it was faulty
Did you get this figured out? I am having the same issues
Thank you for your reply. I don’t have any overclock, undervolt, XMP, or any boost setting on. The issues will still remain no matter if they are enabled or disabled. As for the CPU, it’s completely brand new, and I did update the bios as soon as I built the system. I did run heavy tests on each component using OCCT. CPU, perfectly fine. RAM, perfectly fine. PSU, no issues. GPU, fine. VRAM was what made the system crash into a BSOD in under 40 seconds (specifically DPC_WATCHDOG_VIOLATION). It kind of surprised me at first because I did run some really extreme Raytracing benchmark tests for the GPU using another program, and it ran completely flawlessly. Only when I target VRAM specifically, the crashes occur. So unfortunately, I am starting to believe that it’s either a motherboard issue, the GPU is hardware faulty, or there is some sort of cable issue for the PSU and GPU, but I think that it’s pretty unlikely in this situation.