[NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Reconnaissance et configuration du matériel / kernel linux
Répondre
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

[NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

Le pb de mon DELL M1210 n'est pas nouveau (depuis Debian où j'étais bloqué en 2.6.32-trunk). En passant à Arch, il y a quelques mois, la température du gpu NVIDIA Geforce 7400 était redescendue à 74°C (gnome+compiz). C'était toujours trop chaud mais plus raisonnable que les 93°C sous Sid si j'avais suivi les màj de noyaux.

Hier, la mise à jour du noyau .35 -> .36 et du driver Nvidia proprio m'a instantanément fait prendre 20-30°C de plus, soit 95°C (actuellement alors que j'écris sur firefox, sans rien d'autre derrière). En navigation (scroll avec le pad), j'atteinds facilement les 110°C :shock: ***j'ai peur***

Depuis, j'ai commenté tout mon xorg.conf -> pas d'amélioration
j'ai désactivé compiz -> rien de mieux

Avant de tester des options exotiques (et souvent nébuleuses) dans xorg.conf/device, j'aimerais comprendre ce qui se passe, comme par exemple monitorer l'activité du gpu (equivalent ps ou top pour le cpu), et pouvoir ainsi mettre le doigt sur les raisons de cette surchauffe permanente.

PS. le cpu est tranquille: 44-45°C à l'heure qu'il est
Avatar de l’utilisateur
benjarobin
Maître du Kyudo
Messages : 17625
Inscription : sam. 30 mai 2009, 15:48
Localisation : Lyon

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par benjarobin »

Tu m'as fait un peu peur, j'ai vérifié les températures de mon PC, tout est bon :D
Sinon, comme tu possède un ordinateur portable et que les 2 puces (cpu et gpu) n'ont pas la même température, cela laisse 2 possibilités :
- Tu possède un problème hardware (patte thermique ou autre...), car généralement les 2 puces sont reliés par un même caloduc et refroidis par un même ventilateur.
- Il y a 2 systèmes de refroidissements séparés, et il y en a un qui est éteint : le GPU... Cela n'as pas grand chose à voir avec la charge GPU je crains...

Vu la structure interne http://ahwee.com/how-to-disassemble-lap ... -xps-m1210
http://www.clouddump.com:8080/showItem/ ... 48680.html
Image
Je pencherai vers la solution 1 mais il dois bien y avoir aussi une part de software (driver), mais comme même avoir un delta de 50 degré sur 10 cm de cuivre cela me semble vraiment bizarre (patte thermique surement foutue)
Zsh | KDE | PC fixe : AMD Ryzen 9900X, Radeon RX 7700 XT
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

Merci benjarobin, je suis dans le cas n°1 (un seul ventilo pour les 2 proc - comme sur la photo)
Je n'y ai pas encore ouvert le ventre pour refaire la pate thermique mais je privilégie d'abord le coté soft en raison des écarts constatés après les divers updates.
Drexya
archer de cavalerie
Messages : 161
Inscription : sam. 20 juin 2009, 15:00

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par Drexya »

Tu as vérifié que le pilote contrôle la vitesse du ventilo comme sur la capture ? :

Image

PS : il y a aussi moyen de surveiller avec la ligne de commande mais je ne me souviens plus comment faire.

edit : Hum, je pense avoir dit une connerie, si tu n'as qu'un ventilo il doit être controlé par la cm, mais toujours est-il que le pilote gère la fréquence du gpu en fonction de "l'activité graphique", ça doit être là que ça foire. C'est "l'onglet" juste en dessous celui qui est sélectionné sur la capture (powermizer).
Avatar de l’utilisateur
benjarobin
Maître du Kyudo
Messages : 17625
Inscription : sam. 30 mai 2009, 15:48
Localisation : Lyon

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par benjarobin »

le pilote gère la fréquence du gpu en fonction de "l'activité graphique", ça doit être là que ça foire. C'est "l'onglet" juste en dessous celui qui est sélectionné sur la capture (powermizer).
En effet c'est une des explications que j'ai pu trouvé, que le driver fait tourner la carte un "peu" vite : le seul moyen de vérification tu l'as donné (ou avec la ligne de commande qui est expliqué dans le wiki)

Mais je viens de penser à une autre explication : Si le kernel / acpi se base sur la température du processeur et non de la carte graphique, alors il se peut qu'il ne fasse pas assez tourner le ventilateur... Mais comme même 50 degré de delta sur moins de 10 cm de cuivre, je ne sais pas si c'est possible si le contact est bien réel...
Zsh | KDE | PC fixe : AMD Ryzen 9900X, Radeon RX 7700 XT
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

Merci pour vos conseils; c'est sympa d'essayer de me montrer des pistes...

Enfin, celle que j'entrevois consiste à déboulonner le bazard pour lui refaire sa pate thermique et espérer mieux étaler les 50°C d'écart entre le cpu et le gpu.

Pour répondre à la question du ventilo (1 seul évidemment), il ne tourne ni au ralenti ni à fond. Il semble piloté par la température du cpu (un poil haut: 50-52°C, d'où la vitesse intermédiaire)

Le powermixer fonctionne bien (variation suivant l'usage; ex: scrolling).

Mais j'ose encore insister: comment voir ce qui fait cavaler le gpu; je veux dire quel genre de truc boucle en interne au gpu pour le faire chauffer?
Dernière modification par feNNec le mar. 30 nov. 2010, 00:35, modifié 1 fois.
Avatar de l’utilisateur
benjarobin
Maître du Kyudo
Messages : 17625
Inscription : sam. 30 mai 2009, 15:48
Localisation : Lyon

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par benjarobin »

Pourrais tu comme même vérifier que donne la sortie de powermizer comme l'a montré Drexya
Sinon avec mon script donné ici dans un sujet similaire : http://forums.archlinux.fr/topic4497.html?start=20

Pour le top de xorg, je crois qu'il y a un outils, mais je ne le retrouve pas... :(
Zsh | KDE | PC fixe : AMD Ryzen 9900X, Radeon RX 7700 XT
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

Powermixer vérifié: ça marche correctement

Image

Bon temporairement et pour ne pas tout cramer avant de trouver une solution, je suis repassé en .35; et le gpu a perdu 20°C d'un coup (->83°C)!
Avatar de l’utilisateur
benjarobin
Maître du Kyudo
Messages : 17625
Inscription : sam. 30 mai 2009, 15:48
Localisation : Lyon

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par benjarobin »

Tu as du je pense aussi downgradé, le driver nvidia, non ?
Sinon ce serait bien de savoir si powermizer fonctionne avec la mise à jour (Si tu t'y prend bien cela le laisse moins de 2 minutes en "surchauffe").

Car comme nvidia est "lié" au kernel c'est difficile de savoir où se situe le problème
Zsh | KDE | PC fixe : AMD Ryzen 9900X, Radeon RX 7700 XT
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

Oui, j'ai aussi downgradé le driver; sinon ça ne marcherait pas (dommqge d'ailleurs de devoir lier la version du driver à celle du noyau)
L'impression-écran du dessus correspond au noyau .36 (soit après la mise à jour); Powermixer fonctionne bien dans les 2 configurations
D'autres idées coté noyau??
Drexya
archer de cavalerie
Messages : 161
Inscription : sam. 20 juin 2009, 15:00

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par Drexya »

Je ne sais pas si c'est normal (je n'ai pas de portable), mais on dirait que tu ne peux pas régler le mode comme ci-dessous, de plus il est fixé à "maximum performance" alors que tu es sur batterie !? :

Image
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

Oui, ça serait normal car le processeur Geforce Go 7400 ne supporterait pas d'autre mode; mais rien n'est sûr...
feNNec
newbie
Messages : 7
Inscription : dim. 28 nov. 2010, 21:09

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2

Message par feNNec »

:up: Est-ce qu'il aurait qqu'un d'un peu pointu dans notre communauté pour me guider à régler ce problème de noyau (j'imagine que ça vient du noyau?), à petits pas si nécessaire.

Sinon, je me retrouve dans la même situation qu'avec Debian Sid il y a 3-4 mois, bloqué à une version de noyau/driver Nvidia qui deviendra obsolète...
Répondre