Page 1 sur 1
[NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : dim. 28 nov. 2010, 21:53
par feNNec
Le pb de mon DELL M1210 n'est pas nouveau (depuis Debian où j'étais bloqué en 2.6.32-trunk). En passant à Arch, il y a quelques mois, la température du gpu NVIDIA Geforce 7400 était redescendue à 74°C (gnome+compiz). C'était toujours trop chaud mais plus raisonnable que les 93°C sous Sid si j'avais suivi les màj de noyaux.
Hier, la mise à jour du noyau .35 -> .36 et du driver Nvidia proprio m'a instantanément fait prendre 20-30°C de plus, soit 95°C (actuellement alors que j'écris sur firefox, sans rien d'autre derrière). En navigation (scroll avec le pad), j'atteinds facilement les 110°C

***j'ai peur***
Depuis, j'ai commenté tout mon xorg.conf -> pas d'amélioration
j'ai désactivé compiz -> rien de mieux
Avant de tester des options exotiques (et souvent nébuleuses) dans xorg.conf/device, j'aimerais comprendre ce qui se passe, comme par exemple monitorer l'activité du gpu (equivalent ps ou top pour le cpu), et pouvoir ainsi mettre le doigt sur les raisons de cette surchauffe permanente.
PS. le cpu est tranquille: 44-45°C à l'heure qu'il est
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : dim. 28 nov. 2010, 23:01
par benjarobin
Tu m'as fait un peu peur, j'ai vérifié les températures de mon PC, tout est bon
Sinon, comme tu possède un ordinateur portable et que les 2 puces (cpu et gpu) n'ont pas la même température, cela laisse 2 possibilités :
- Tu possède un problème hardware (patte thermique ou autre...), car généralement les 2 puces sont reliés par un même caloduc et refroidis par un même ventilateur.
- Il y a 2 systèmes de refroidissements séparés, et il y en a un qui est éteint : le GPU... Cela n'as pas grand chose à voir avec la charge GPU je crains...
Vu la structure interne
http://ahwee.com/how-to-disassemble-lap ... -xps-m1210
http://www.clouddump.com:8080/showItem/ ... 48680.html

Je pencherai vers la solution 1 mais il dois bien y avoir aussi une part de software (driver), mais comme même avoir un delta de 50 degré sur 10 cm de cuivre cela me semble vraiment bizarre (patte thermique surement foutue)
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : lun. 29 nov. 2010, 08:40
par feNNec
Merci benjarobin, je suis dans le cas n°1 (un seul ventilo pour les 2 proc - comme sur la photo)
Je n'y ai pas encore ouvert le ventre pour refaire la pate thermique mais je privilégie d'abord le coté soft en raison des écarts constatés après les divers updates.
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : lun. 29 nov. 2010, 16:42
par Drexya
Tu as vérifié que le pilote contrôle la vitesse du ventilo comme sur la capture ? :
PS : il y a aussi moyen de surveiller avec la ligne de commande mais je ne me souviens plus comment faire.
edit : Hum, je pense avoir dit une connerie, si tu n'as qu'un ventilo il doit être controlé par la cm, mais toujours est-il que le pilote gère la fréquence du gpu en fonction de "l'activité graphique", ça doit être là que ça foire. C'est "l'onglet" juste en dessous celui qui est sélectionné sur la capture (powermizer).
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : lun. 29 nov. 2010, 18:43
par benjarobin
le pilote gère la fréquence du gpu en fonction de "l'activité graphique", ça doit être là que ça foire. C'est "l'onglet" juste en dessous celui qui est sélectionné sur la capture (powermizer).
En effet c'est une des explications que j'ai pu trouvé, que le driver fait tourner la carte un "peu" vite : le seul moyen de vérification tu l'as donné (ou avec la ligne de commande qui est expliqué dans le wiki)
Mais je viens de penser à une autre explication : Si le kernel / acpi se base sur la température du processeur et non de la carte graphique, alors il se peut qu'il ne fasse pas assez tourner le ventilateur... Mais comme même 50 degré de delta sur moins de 10 cm de cuivre, je ne sais pas si c'est possible si le contact est bien réel...
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : lun. 29 nov. 2010, 23:22
par feNNec
Merci pour vos conseils; c'est sympa d'essayer de me montrer des pistes...
Enfin, celle que j'entrevois consiste à déboulonner le bazard pour lui refaire sa pate thermique et espérer mieux étaler les 50°C d'écart entre le cpu et le gpu.
Pour répondre à la question du ventilo (1 seul évidemment), il ne tourne ni au ralenti ni à fond. Il semble piloté par la température du cpu (un poil haut: 50-52°C, d'où la vitesse intermédiaire)
Le powermixer fonctionne bien (variation suivant l'usage; ex: scrolling).
Mais j'ose encore insister: comment voir ce qui fait cavaler le gpu; je veux dire quel genre de truc boucle en interne au gpu pour le faire chauffer?
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : mar. 30 nov. 2010, 00:01
par benjarobin
Pourrais tu comme même vérifier que donne la sortie de powermizer comme l'a montré Drexya
Sinon avec mon script donné ici dans un sujet similaire :
http://forums.archlinux.fr/topic4497.html?start=20
Pour le top de xorg, je crois qu'il y a un outils, mais je ne le retrouve pas...

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : mar. 30 nov. 2010, 00:38
par feNNec
Powermixer vérifié: ça marche correctement
Bon temporairement et pour ne pas tout cramer avant de trouver une solution, je suis repassé en .35; et le gpu a perdu 20°C d'un coup (->83°C)!
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : mar. 30 nov. 2010, 09:33
par benjarobin
Tu as du je pense aussi downgradé, le driver nvidia, non ?
Sinon ce serait bien de savoir si powermizer fonctionne avec la mise à jour (Si tu t'y prend bien cela le laisse moins de 2 minutes en "surchauffe").
Car comme nvidia est "lié" au kernel c'est difficile de savoir où se situe le problème
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : mar. 30 nov. 2010, 16:19
par feNNec
Oui, j'ai aussi downgradé le driver; sinon ça ne marcherait pas (dommqge d'ailleurs de devoir lier la version du driver à celle du noyau)
L'impression-écran du dessus correspond au noyau .36 (soit après la mise à jour); Powermixer fonctionne bien dans les 2 configurations
D'autres idées coté noyau??
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : mer. 01 déc. 2010, 09:17
par Drexya
Je ne sais pas si c'est normal (je n'ai pas de portable), mais on dirait que tu ne peux pas régler le mode comme ci-dessous, de plus il est fixé à "maximum performance" alors que tu es sur batterie !? :

Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : mer. 01 déc. 2010, 18:29
par feNNec
Oui, ça serait normal car le processeur Geforce Go 7400 ne supporterait pas d'autre mode; mais rien n'est sûr...
Re: [NVIDIA] surchauffe depuis màj vers 2.6.36/260.19.21-2
Publié : sam. 04 déc. 2010, 12:57
par feNNec

Est-ce qu'il aurait qqu'un d'un peu pointu dans notre communauté pour me guider à régler ce problème de noyau (j'imagine que ça vient du noyau?), à petits pas si nécessaire.
Sinon, je me retrouve dans la même situation qu'avec Debian Sid il y a 3-4 mois, bloqué à une version de noyau/driver Nvidia qui deviendra obsolète...