Reboots en plein vol


#1

Salut les amis,

Depuis mes derniers essais de paramétrage d’affichage, je constate un trouble désagréable : le reboot du PC intempestif.
Ma configuration est un I5 3570, 12 Go de Ram, une CG Radeon GTX 670 4Go (Gygabite GV-N670OC-4GD) et un affichage 1920x800 sur connecteur DVI.

Au début, je me suis dis que j’avais laissé l’overclocking du CPU actif, mais non, il tourne à sa fréquence d’origine, voltage usine.
Après cela, j’ai désinstallé le logiciel GEForce Experience, le pilote PhysX, le pilote de la carte, nettoyé le système et le registre avec DDU de Guru3D, et installé un pilote stable et éprouvé, à savoir le 347.88, sans GEForce Experience et sans le PhysX. Pas d’amélioration.
J’ai testé la RAM avec MemTest. Ce dernier ne signale aucune erreur.
Ensuite, je me suis dis que le processeur ou la carte graphique surchauffaient.
J’ai donc soumis le CPU à un test de stress intensif avec CPU Burner. Le test maintient les 4 coeurs à 104°/105°C pendant plusieurs minutes sans que le PC ne redémarre. En surveillant les températures d’une session normal de vol, le processeur CPU ne dépasse pas les 90°C, donc ce n’est je pense pas la cause.
J’ai réalisé le même test sur la carte graphique avec FurMark. La température monte à 79°C/80°C au bout de 2 à 3 minutes lorsque j’effectue un test en Dynamic Background et Burn In, du calcul intensif donc.
Le test FurMark provoque effectivement le reboot violent du PC. Pourtant, la température de la carte n’est pas à un niveau critique je crois.
Je n’ai trouvé nulle part un paramètre de sécurité, dans l’OS, le Bios ou le configurateur de carte, stipulant une température maximum et pouvant provoquer une aussi violente mise en sécurité.
Le test FurMark dynamic Camera ne provoque lui aucun redémarrage de la mort.

Pour tenter de cerner le problème, j’ai donc réduit le nombre d’objets affichés par le simulateur du niveau 5 (maximum), au niveau 4. Et là, effectivement, le vol de test a pu s’achever.
Le problème me paraît donc lié à la charge de calcul, c’est clair. Mais pas à la température selon moi.
Un problème de pilote de carte provoquerait plutôt un plantage de X-Plane avec retour au bureau, ou un écran bleu, je suppose. Et il ne se produirait pas avec la même fréquence sous deux versions différentes du pilote (encore que).
Une surcharge des mémoires, Ram ou Vidéo, provoquerait les mêmes symptômes, mais pas un reboot violent je crois.
Je me demandais si le problème pouvait venir de l’alimentation.

La carte est alimentée par un Molex 6 et un Molex 8. L’alimentation est un boitier de 565 Watts de chez HKC. Une copie de ses caractéristiques ci-dessous.


Même si ce boitier a un rendement de 75%, je le pensais en capacité à fournir la puissance nécessaire à l’équipement. Fais-je une erreur sur ce point ? Sur les rails 12V, il fournit du 20A, pour alimenter la carte graphique et 2 disques durs. J’imaginais cela suffisant.

Qu’en pensez-vous ?


(Richard) #2

Salut,
Tu devrais jeter un oeil sur l’observateur d’évènements windows lors des derniers instants avant le crash.
Aussi le code fourni à l’écran bleu est souvent un bon indice


#3

Salut Richard,

j’ai dépouillé les journaux d’événements, mais l’arrêt n’est précédé d’aucune erreur enregistrée.
Et comme c’est une extinction soudaine et un redémarrage, il n’y a même pas d’écran bleu.
Le test que j’ai fait ce matin, à froid, avec FurMark, a redémarré le système en moins de 30 secondes alors que la carte CGU était à moins de 50°C et le CPU à 40°C. Clairement, ce n’est pas une histoire de température.
Sur ta suggestion, je vois qu’aucun événement n’est enregistré donc j’écarte encore un peu plus un défaut de pilote graphique.
FurMark n’exploite pas la RAM, donc ce ne sont pas les barrettes mémoires.

Je vais changer le bloc d’alimentation je pense, mais pas tout de suite et pas sans comprendre les paramètres importants à prendre en compte. Si j’ai bien compris, la puissance n’est pas l’unique critère à prendre en compte.
Il y a aussi une histoire de “rails” et d’ampérage.
L’un de vous est-il en mesure de m’expliquer quoi regarder et quoi rechercher parmi ces caractéristiques ?


(Richard) #4

Oui sur un bloc d’alim, il y a souvent plusieurs branches et il vaut mieux répartir la charge au maximum.
Pour le choix, vaut mieux opter pour le label Gold


#5

Salut,

J’ai eu ce genre de problème à cause de 1. la carte graphique ou 2. overclocking CPU.
Jamais à cause d’une réchauffe processeurs ou alimentation.


#6

Je profite de faire un tour sur mes anciens sujets :mag: pour apporter la conclusion de cette histoire. :end:
L’origine du reboot était une surchauffe d’un composant de la carte mère, :hotsprings: pas très loin du processeur.
L’installation d’un ventirad (beaucoup) :astonished: plus puissant que le précédent a résolu le problème. C’est un Noctua NH-D14. :peace::+1::grin:

Merci pour vos informations.


#7

Merci pour le suivi.
Comment as tu finalement su isoler ce composant?


#8

En fait, je ne l’ai pas isolé, j’ai listé par priorité les composants à renouveler, en fonction de la sensibilité, de l’impact et du prix. Le ventirad était le premier sur la liste.
Les stress-tests puis les vols d’essai qui ont suivis son installation ont démontrés que c’était la température le problème.
:mask: