Page 1 sur 1

Instabilité du PC : carte graphique ??

Publié : mar. 04 mars 2008, 14:02
par Vincent Valentine
Salut,

j'ai un petit problème matériel : une grosse instabilité du PC.
Mon PC est neuf (acheter y a un mois), sauf la carte graphique (8800GTX) acheter d'occaz sur ebay.

Config : E8400, 8800GTX, 2 Go G.skill PC6400 HK, Gigabyte P35-DS4, alim Coolermaster 850w.

Tempature global 39° à l'intérieur du boitier.

Voici les problème rencontrés : ça freez sans raison et seul le bouton reset (ou power) permet de redémarrer le pc. Sous Linux (Arch et Xubuntu) je ne peux pas laisser un download sur bitorrent la nuit : le matin, lorsque je rallume l'écan, y a plus de signal comme si la CG n'envoyer plus rien. De plus, ça freez régulièrement au bout de plusieur 10 de minutes... ou ça freez pas, c'est aléatoire. Avec Compiz-fusion, ça tourne nickel, mais parfois, l'écran ne se rafraichit pas. Voilà pour Linux.

Sous XP, je ne fais que de jouer. Or, Oblivion freez au moins une fois par partie (je joue tous les soirs). J'ai pas rencontré d'autre problème sous XP, mais bon si je joue beaucoup, ça freez plusieur fois par jour tout de même !

Vu que ça freez, aussi bien sous Win que sous Linux j'ai éliminé d'office les problèmes softwares.
Je me demandais si j'était pas tombé sur un CG défectueuse (le vendeur l'avait acheter le 12/06).

Comment puis-je savoir ? Existe-il des soft pour tester QUE la ram de la carte graphique, ou la carte elle même ?

Dès que j'ai le temps, je lancerai un memtest86 au cas ou...


Merci beaucoup.

Publié : mar. 04 mars 2008, 23:14
par mélodie
Tu peux aussi essayer le torture test de gimp (mersenne) mais je ne sais pas quelle version conviendrait à ta machine : le dernier peut-être ?

On peut le trouver sur le site de mersenne, ou sur le CD Ultimate Boot CD.

Autrement, as-tu regardé si il ne te fallait pas mettre à jour le BIOS ?

Publié : mar. 04 mars 2008, 23:33
par Vincent Valentine
Merci pour l'idée.
Memtest = pas de pb après 2 pass complètes.

Pour le bios, je ne vois pas pourquoi la panne serait en grande partie aléatoire. En générale, lorsque ça vient du bios, ça marche ou pas. (Enfin, de mon expérience)

C'est quoi le test de gimp ?

Publié : mer. 05 mars 2008, 00:57
par mélodie
Vincent Valentine a écrit :Merci pour l'idée.
Memtest = pas de pb après 2 pass complètes.

Pour le bios, je ne vois pas pourquoi la panne serait en grande partie aléatoire. En générale, lorsque ça vient du bios, ça marche ou pas. (Enfin, de mon expérience)
Sur ma première carte mère, un reboot minimum par jour sous Windows XP, et quelques mois après quand j'ai su installer Mandrake, une extinction soudaine par semaine en moyenne. Une fois que j'ai eu passé 6 mois sous GNU's Linuxes, et fait le tour de toutes les causes de panne possibles, et appris des notions de base en même temps, j'ai pu enfin accéder à la compréhension de la doc relative à la mise à jour de BIOS. En attendant même un live CD ne tenait pas le coup durant une session complète (tout fichait le camp pendant que je postais au sujet des problèmes).
C'est quoi le test de gimp ?
C'est une fonction accessoire d'un programme qui est utilisé pour chercher des nombres prime. Il s'agit de le lancer, de dire 'non' à l'option voulez-vous participer ? et de sélectionner 'torture test'. Ensuite il va tester la mémoire, le cpu et autre, on peut laisser tourner longtemps, des heures : on m'a eu dit que si ça doit faire planter la machine c'est assez rapide, genre maximum 15 minutes.

le site :
http://www.mersenne.org/

la page des téléchargements :
http://www.mersenne.org/freesoft.htm

Pour le bios, une bonne idée serait que tu regardes sur le site du constructeur de ta carte mère s'il existe une mise à jour, et si oui, ce qu'elle corrige (si toutefois l'information est disponible).

PS: tiens, sur mon PIII c'est cette version de mprime qui fonctionne:
ftp://mersenne.org/gimps
[FILE] mprime239.tar.gz . . . . . . . . Sep 16 2004 413K [DOWNLOAD]

:)

Publié : lun. 10 mars 2008, 13:40
par Vincent Valentine
slt,
j'ai regardé les MAJs du BIOS : rien qui correspond à mon problème hormis une mise à jour concernant des problèmes de I/O. Les autres son des MAJs qui sont toutes destinées au support de nouveau processeur Intel.

Sinon mon problème sous Linux éxiste toujours : écran qui fige n'importe quand... Et sous win aussi : Oblivion qui fige également (avec le son qui bugg : les derniers instants de musique ce répète indéfiniment comme ça : tatataaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa...).

J'ai trouvé un point commun entre mes 2 OS : ça ne fige pas lorsque je viens d'allumer le PC, mais au bout d'un certain temps : 1 à 2 heures minimum... Plutôt 1 heure en jouant à Oblivion et plutôt 2 à 3 heures sous Linux. A noté que les freezz sous Linux ne sont pas automatiques et beaucoup moins fréquents tandis que sous Windaube ça fige automatiquement au bout d'une heure de jeux.

Je me suis donc dit qu'un problème de température pouvait être la cause du pb : Everest sous XP m'indique 65° en charge pour ma carte graphique, ce qui est tout à fait normal pour une 8800GTX.
Pour les 2 OS : le processeur ne monte pas au dessu de 40° en charge, la carte mère reste en dessou des 45°... Donc le côté "chauffe" me parait peux probable.

J'ai fai un memtest86+ : 2 pass et 0 erreurs.
J'ai aussi fait 2 "burn it" avec Sandra lite XII pendant 2 heures. Pas de plantage et rien dans le rapport (à noté que burn it stress tout les composants sauf la carte graphique, ou du moins la stress de manière limité)

J'ai aussi fait tourné 3D mark 06 pendant plus d'un heure sans plantage.

J'ai pas encore tester l'ultimate CD, je vais peut-être le faire...
Et je vais peut être flasher le BIOS , on ne sait jamais... Même si j'aime pas le faire.

Publié : lun. 10 mars 2008, 18:16
par mélodie
Vincent Valentine a écrit : J'ai pas encore tester l'ultimate CD, je vais peut-être le faire...
Et je vais peut être flasher le BIOS , on ne sait jamais... Même si j'aime pas le faire.
Les I/O ça peut être bien de les considérer. Il se trouve que je rencontre des problèmes identiques à ceux que tu présentes, j'ai maintenant deux distributions avec des noyaux identiques, et une carte graphique nvidia 8400GS.

Je trouve les mêmes plantages et les mêmes interruptions sur l'accessibilité au réseau, dans les deux distributions (tiens donc !)

L'interface nvidia-settings présente 58 à 59°, donc normal aussi. Et puis de temps en temps, sous Archlinux comme sous Zenwalk je rencontre aussi une déconnexion de l'Adsl. Je ne peux même pas pinguer la passerelle.

J'ai une carte mère Asus A8V SE avec processeur AMD Athlon 64 3700+ et une alimentation 480 watts.

Me semble que le bios était à jour, que la connexion internet foirait déjà dessus depuis un petit moment, occasionnellement et sans prévenir, et me semble que depuis que j'ai installé la carte nvidia je rencontre en plus les plantages (freeze total comme chez toi, donc) identiques.

Ces freeze sont imparables et tels que rien, ni clavier, aucun raccourci, ne fonctionne plus.

Les logs ne me parlent pas tellement, j'ai juste remarqué en revenant d'une absence prolongée que l'internet n'était plus joignable et que une console user et une console root me disaient que le kernel avec désactivé l'irq 21 .

Vincent, quelle carte mère as-tu quand à toi ?

Quelqu'un (quelques-uns ? ) sauraient-ils nous aider, nous proposer une piste ?

Publié : lun. 10 mars 2008, 21:31
par Vincent Valentine
Moi j'ai une carte mère Gigabyte P35-DS4 avec un processeur Intel E8400.. Donc rien avoir avec ton matos.

Dans les événement windows je n'ai pas d'erreur sauf celle-ci dans les logs application :

Code : Tout sélectionner

Type de l'événement :	Erreur
Source de l'événement :	Application Error
Catégorie de l'événement :	Aucun
ID de l'événement :	1000
Date :		27/02/2008
Heure :		23:15:21
Utilisateur :	N/A
Ordinateur :	METATRON
Description :
Application défaillante oblivion.exe, version 1.2.0.416, module défaillant oblivion.exe, version 1.2.0.416, adresse de défaillance 0x0033a5e8.
Je me suis moi aussi demandé si cela ne venait pas des pilote graphique Nvidia ou d'une coïncidence : sous Win Oblivion crash pour une raison inconnu (pilote graphique, directX, etc) et sous Xubuntu (je n'ai pu Arch actuellement) se serait lié à un problème de mise en veille ou un pilote quelconque....

Enfin voilà tout...

Publié : lun. 10 mars 2008, 23:10
par mélodie
Je n'ai pas l'usage de la mise en veille, sur le desktop, et j'ai déjà plusieurs fois mis nv à la place de nvidia dans xorg.conf, ça semble aider à tenir plus longtemps. Là il y avait une mise à jour de bios disponible, je viens de le mettre à jour, mais ça n'a pas l'air de faire autre chose que de planter encore plus vite. (avec nvidia activé dans xorg.conf, pour l'instant).

À suivre donc.

Publié : mar. 11 mars 2008, 23:19
par warnaud
Essaie de laisser ton boîtier ouvert pour voir si c'est la chaleur (oui c'est à la rache™).
Ensuite au niveau du BIOS, essaie de faire un reset des valeurs par défaut (au cas où).
Si tu peux avoir une autre carte pour tester (même une daube).
Après perso je désactiverais la carte son, l'usb pour voir d'où ça vient.

Bonne chance

Publié : mer. 12 mars 2008, 22:44
par mélodie
Chez moi ça semble réglé : flashage du bios, plus mise à jour kernel et driver nvidia. Entre les deux tout a été démonté dépoussiéré et remonté. Il n'y a plus eu de plantage depuis.

Entre temps j'ai reçu des suggestions pour voir au niveau d'éventuelles "masses" sur l'alimentation ou sur la carte graphique. Chez moi ce ne sera pas utile donc. Vincent Valentine, peux-tu essayer ou faire essayer ta carte graphique sur une autre machine ? Et trouver une autre alimentation juste le temps de faire un essai sur ta machine ?

Publié : mer. 12 mars 2008, 22:55
par Vincent Valentine
Merci du conseil mais pour le moent, ça ne sera pas la peine.

Sous XP, j'ai modifier le .ini d'Oblivion en fixant la valeur maximale de la mémoire vive utiliser par le jeux et depuis ça n'a pas planter :D

Donc, comme je n'ai plus que Nunux qui plantouille de temps à autre, je vais regarder du côté des drivers Nvidia.

De plus, ça fait 2 nuit que je le laisse tourner sous Nunux et qui ne plante pas (téléchargement avec Amule) :roll:

Wait and see.

Et merci pour les réponses :wink:

Publié : mar. 25 mars 2008, 12:08
par mélodie
En fait, j'ai à nouveau subi plusieurs blocages, même après mise à jour du BIOS. Puis, il m'a été suggéré d'installer "BlinkBlink-desktop" pour forcer la carte graphique à bosser, et donc allez Compiz : et ça ne plante plus que... une fois par jour ?
Il y a eu ensuite la désactivation dans le BIOS du plug and play, de l'acpi2 (?) et ça ne change pas trop. Argh si : je n'ai pas retrouvé les "salades d'irq" de l'autre fois. Un exemple:
Mar 15 23:50:04 squirrel Pid: 7051, comm: X Tainted: P 2.6.24-ARCH #1
Mar 15 23:50:04 squirrel [<c015c244>] __report_bad_irq+0x24/0x80
Mar 15 23:50:04 squirrel [<f9857e1c>] nv_kern_isr+0x6c/0xd0 [nvidia]
Mar 15 23:50:04 squirrel [<c015c52b>] note_interrupt+0x28b/0x2d0
Mar 15 23:50:04 squirrel [<c015b740>] handle_IRQ_event+0x30/0x60
Mar 15 23:50:04 squirrel [<c015cc57>] handle_fasteoi_irq+0x87/0xe0
Mar 15 23:50:04 squirrel [<c01083bb>] do_IRQ+0x3b/0x70
Mar 15 23:50:04 squirrel [<c01454d0>] hrtimer_get_res+0x0/0x30
Mar 15 23:50:04 squirrel [<c0105f47>] common_interrupt+0x23/0x28
Mar 15 23:50:04 squirrel [<c01454d0>] hrtimer_get_res+0x0/0x30
Mar 15 23:50:04 squirrel [<c02d3057>] acpi_pm_read+0x7/0x10
Mar 15 23:50:04 squirrel [<c0148374>] getnstimeofday+0x34/0xf0
Mar 15 23:50:04 squirrel [<c01454d0>] hrtimer_get_res+0x0/0x30
Mar 15 23:50:04 squirrel [<c0145d6e>] ktime_get_ts+0x1e/0x60
Mar 15 23:50:04 squirrel [<c0140f70>] posix_ktime_get_ts+0x0/0x10
Mar 15 23:50:04 squirrel [<c01454d0>] hrtimer_get_res+0x0/0x30
Mar 15 23:50:04 squirrel [<c0140f77>] posix_ktime_get_ts+0x7/0x10
Mar 15 23:50:04 squirrel [<c0141947>] sys_clock_gettime+0x87/0xa0
Mar 15 23:50:04 squirrel [<c010555a>] syscall_call+0x7/0xb
Juste après cette partie du log, ça a été le reboot.

Je commence à numéroter et nommer les parties de logs que je récupère à mesure des problèmes : la fois d'après, c'est la souris qui a bloqué.
Là, j'ai pu rebooter par le clavier si je me souviens bien.
Mar 17 12:40:53 squirrel NET: Registered protocol family 10
Mar 17 12:40:53 squirrel lo: Disabled Privacy Extensions
Mar 17 12:44:59 squirrel hda-intel: Invalid position buffer, using LPIB read method instead.
Mar 17 14:29:05 squirrel usb 1-2: USB disconnect, address 5
Mar 17 14:29:12 squirrel usb 1-2: new low speed USB device using uhci_hcd and address 6
Mar 17 14:29:12 squirrel usb 1-2: configuration #1 chosen from 1 choice
Mar 17 14:29:12 squirrel input: Logitech USB-PS/2 Optical Mouse as /devices/pci0000:00/0000:00:10.0/usb1/1-2/1-2:1.0/input/input8
Mar 17 14:29:12 squirrel input,hidraw2: USB HID v1.10 Mouse [Logitech USB-PS/2 Optical Mouse] on usb-0000:00:10.0-2
Mar 17 14:29:40 squirrel shutdown[7867]: shutting down for system reboot
Tout à l'heure, j'ai eu un nouveau freeze, la souris "bougeait" encore, mais plus rien ne répondait sur le desktop ni au clavier.

J'ai cherché sur le web pour le message suivant qui revient toujours dans les logs:
Clocksource tsc unstable

Comme c'est powernowd qui est utilisé et non cpufreq, je tente de mettre 'notsc' sur la ligne de kernel.

Avez-vous un avis ? En rapport ou pas en rapport avec des instabilités ?

Toute aide bienvenue.

Pour pouvoir continuer d'en parler, je dois ouvrir un fil à la section "environnements graphiques". :?

Allez go !

Publié : mar. 25 mars 2008, 13:04
par tuxce
ou dans support matériel :)
j'ai pas de solutions garanties mais déjà pour le problème du blocage avec juste la souris qui bouge, tu peux éviter un reset matériel en activant l'option sysrq dans /etc/sysctl.conf:

Code : Tout sélectionner

kernel.sysrq = 1
pour la prise en compte sans redemarrage:

Code : Tout sélectionner

echo 1 > /proc/sys/kernel/sysrq
puis lors d'un blocage: shift+alt+sysrq+r passe le évenements clavier directement au noyau et un ctrl+alt+f1 devient possible.

ensuite peut etre une solution pour le blocage, sur une carte nvidia, j'avais eu des blocages récurrents faisant suite à l'écran qui flashe (ou un truc du genre), l'ajout de la ligne suivante:

Code : Tout sélectionner

options nvidia NVreg_RegistryDwords="PerfLevelSrc=0x2222"
dans /etc/modprobe.conf avait résolu le problème.
de ce que j'avais compris, c'etait un problème du à la difficulté de réajuster la fréquence de la carte pour le driver linux, et cette ligne la rendait fixe.

Publié : mar. 25 mars 2008, 14:10
par mélodie
tuxce a écrit :ou dans support matériel :)
J'ai ouvert un nouveau fil là:
[Compiz] segfault

Le problème ressemble mais le message d'erreur change du tout au tout, alors...
puis lors d'un blocage: shift+alt+sysrq+r passe le évenements clavier directement au noyau et un ctrl+alt+f1 devient possible.
Ok, c'est fait, et la commande notée, merci bien.
ensuite peut etre une solution pour le blocage, sur une carte nvidia, j'avais eu des blocages récurrents faisant suite à l'écran qui flashe (ou un truc du genre), l'ajout de la ligne suivante:

Code : Tout sélectionner

options nvidia NVreg_RegistryDwords="PerfLevelSrc=0x2222"
dans /etc/modprobe.conf avait résolu le problème.
de ce que j'avais compris, c'etait un problème du à la difficulté de réajuster la fréquence de la carte pour le driver linux, et cette ligne la rendait fixe.
Je ne sais pas par quelles voies tu as trouvé cette solution, mais cette ligne d'options est abondamment citée sur le web. Alors, j'ai retenu ce post,

Image

et de ce qu'il en dit, j'ai retenu en plus que: il ne faut pas activer l'option vsync dans opengl (et elle n'est pas activée), qu'il faudrait activer "XV sync to vblank", et je n'ai rien trouvé qui ressemble à ça dans nvidia-settings, par contre saurais-tu si l'option 'Allow flipping' qu'on peut voir dans les settings serait mieux activée ou désactivée, au vu de la ligne de configuration que tu me conseille ? (Double emploi, contradictoire ou rien à voir ?)

Encore merci.

Publié : mar. 25 mars 2008, 14:24
par tuxce
du coup je sais plus sur quel fil je vais répondre :P, vu qu'il y a des liens sur les 2, je vais continuer sur celui la pour l'instant vu que les données sont ici.
pour l'endroit où j'ai trouver la ligne, c'était bien dans le forums nvnews, mais le post par contre, je l'ai plus en lien...
c'était à la suite d'une recherche sur "compiz screen flicker"

pour les options, la ligne seul avait suffit pour moi, le "allow flipping" était activé, de même que "sync to vblank"

au cas où, c'était une nvidia 7400 go

Publié : mar. 25 mars 2008, 14:47
par mélodie
tuxce a écrit :pour l'endroit où j'ai trouver la ligne, c'était bien dans le forums nvnews, mais le post par contre, je l'ai plus en lien...
c'était à la suite d'une recherche sur "compiz screen flicker"

Ok. Et ci-dessus c'est le lien direct vers le post que j'ai surligné en vert sur la capture.
pour les options, la ligne seul avait suffit pour moi, le "allow flipping" était activé, de même que "sync to vblank"

au cas où, c'était une nvidia 7400 go
Vu ! C'est bien activé dans l'interface de configuration de Nvidia, en effet.

J'ai une question en rapport avec le tuto "Installation des pilotes NVidia (non libres)" sur le wiki :

le tuto propose d'explorer des options possibles en recherchant les informations d'un fichier:
FastWrite / SBA

Bon maintenant faisons cracher ses tripes à la carte vidéo LOL
Vérifications

Votre carte supporte-t-elle une de ces 2 options ou les 2 ?
ATTENTION : cela ne fonctionne qu'avec des Geforces et pas toutes

cat /proc/driver/nvidia/agp/card
Ce n'est pas que j'aie besoin de performances en plus, mais curiosité :
$cat /proc/driver/nvidia/agp/card
cat: /proc/driver/nvidia/agp/card: Aucun fichier ou répertoire de ce type
Et ls
$ ls /proc/driver/nvidia/
cards registry version warnings
À tout hasard aussi, c'est une 8400GS. Le driver (169.12-1 )est arrivé avec yaourt.

Publié : mar. 25 mars 2008, 15:15
par tuxce
ta carte doit etre en pci-e et non en agp:

Code : Tout sélectionner

cat /proc/driver/nvidia/registry

Publié : mar. 25 mars 2008, 15:40
par mélodie
tuxce a écrit :ta carte doit etre en pci-e et non en agp:

Code : Tout sélectionner

cat /proc/driver/nvidia/registry
Voilà qui est bien dit (je me sens bête... :oops: )
$ cat /proc/driver/nvidia/registry
EnableVia4x: 0
EnableALiAGP: 0
NvAGP: 3
ReqAGPRate: 15
EnableAGPSBA: 0
EnableAGPFW: 0
Mobile: 4294967295
ResmanDebugLevel: 4294967295
RmLogonRC: 1
ModifyDeviceFiles: 1
DeviceFileUID: 0
DeviceFileGID: 0
DeviceFileMode: 438
RemapLimit: 0
UseCPA: 4294967295
UseVBios: 1
RMEdgeIntrCheck: 1
Il faut que je retourne comparer avec les options expliquées dans le howto, et aussi que je surveille l'uptime et le nombre des sessions sans reboot forcé, à partir de maintenant : la config n'a qu'à bien se tenir avec sa nouvelle option dans le modprobe.conf. (ça me semble prendre bonne tournure)

:)