Page 1 sur 2
[Freezes de X] avec salades d'IRQ (+ ou - Résolu)
Publié : ven. 28 mars 2008, 18:51
par mélodie
Bonjour,
Cela continue, alors je reviens poster.
Aujourd'hui, je suis partie un petit moment et quand je suis revenue plus rien ne répondait.
la pendule Orage était bloquée sur 16:16:53 et dans le log ça donne ça:
http://pastebin.archlinux.fr/54781
et puis il y a aussi souvent le message curieux, dont je ne sais pas s'il est impliqué dans le freeze ou pas du tout :
hda-intel: Invalid position buffer, using LPIB read method instead.
(j'ai cherché sur le web, mais rien vu où ce message soit impliqué dans des freeze de X).
J'ai en carte mère une asustek
description: Motherboard
product: A8V-VM SE
vendor: ASUSTeK Computer INC.
Une carte graphique Nvidia 8400GS, avec des améliorations récentes proposées par tuxce:
http://forums.archlinux.fr/topic1624.html?highlight=
le BIOS aussi mis à jour il y a peu, selon l'indication de tuxce sur le chan, jai vérifié que l'irq utilisée par Nvidia n'est pas prise par un autre programme,
http://pastebin.archlinux.fr/54823
je ne sais pas où chercher ensuite.
Auriez-vous quelque idée à me suggérer ?
Merci par avance.
Publié : ven. 28 mars 2008, 21:00
par wain
Est-ce que tu pourrais te connecter en ssh depuis un autre PC pendant le crash pour voir si c'est X qui est planté, ou si c'est le kernel ?
Publié : ven. 28 mars 2008, 22:16
par mélodie
wain a écrit :Est-ce que tu pourrais te connecter en ssh depuis un autre PC pendant le crash pour voir si c'est X qui est planté, ou si c'est le kernel ?
Eh bien quand j'essaie, ça donne:
"no route to host". Et c'est tout !

(J'ai déjà essayé régulièrement lors de chaque freeze, ces derniers mois).
Alors est-ce que c'est le kernel qui est planté ?

Publié : ven. 28 mars 2008, 23:29
par wain
on dirait oui. C'est plus grave qu'un plantage de X
Publié : ven. 28 mars 2008, 23:41
par mélodie
Faudrait-il que j'envoie un mail à nvidia, aux développeurs du kernel, aux deux ? Autrement quelles autres solutions, pistes, pourrait-il y avoir ? (Recompiler le noyau ?)
Publié : ven. 28 mars 2008, 23:57
par wain
mélodie a écrit :Faudrait-il que j'envoie un mail à nvidia, aux développeurs du kernel, aux deux ? Autrement quelles autres solutions, pistes, pourrait-il y avoir ? (Recompiler le noyau ?)
t'as le problème depuis quand exactement ? une mise à jour du kernel ou d'autre chose ?
Publié : sam. 29 mars 2008, 00:52
par mélodie
wain a écrit :mélodie a écrit :Faudrait-il que j'envoie un mail à nvidia, aux développeurs du kernel, aux deux ? Autrement quelles autres solutions, pistes, pourrait-il y avoir ? (Recompiler le noyau ?)
t'as le problème depuis quand exactement ? une mise à jour du kernel ou d'autre chose ?
Depuis que j'ai installé la carte graphique Nvidia, en janvier. Je pense que j'ai dû passer du noyau 2.6.23 au 2.6.24 à cette occasion.
Sur cette carte mère, la carte graphique est une k8M890 Chrome9, ce qui veut dire que le seul driver qui la fasse tourner est openchrome, et même openchrome-svn : autant dire la misère, pas d'effets, pas de jeux, même un petit frozen-bubble prend "la journée" pour démarrer, et l'aspect d'une vidéo : piteux.
Tout ce que je peux faire, c'est retenter avec cette carte et ce driver, pour voir si le 2.6.24 est en cause, à moins que je ne trouve plus d'infos sur le web sur ce topic ? Ce que je dois faire pour régler ça ne me semble pas facile à cerner pour l'instant.
Publié : sam. 29 mars 2008, 01:40
par tuxce
tu as essayé le driver fourni par xorg (nv)? tu n'as pas l'acceleration 3D complète mais juste pour voir si ca plante pareil histoire de valider l'implication du driver proprio (ou le contraire).
Publié : sam. 29 mars 2008, 08:22
par mélodie
Oui, maintenant que tu le dis, j'ai essayé, et ça plantait aussi.
Je peux toujours essayer à nouveau, et lancer juste openbox au lieu de xfce4+Compiz.
Je vais faire ça en suivant, disons au plus tart à partir de lundi, (Libre en fête près de chez nous donc la machine va moins tourner) et j'essaierai de revenir avec les logs.
Les idées suivantes : réinstaller le pilote openchrome pour voir comment ça se comporte avec le noyau actuel, et installer en double-boot une distribution dotée d'un noyau moins récent (je pense à Edubuntu LTS qui est une Dapper 6.04), sur laquelle je tournerais deux ou trois jours de suite.
Nouveau plantage : mode veille.
Publié : sam. 29 mars 2008, 09:08
par mélodie
J'étais en train de récupérer un fichier sur le web (direct par le navigateur), et quand le téléchargement s'est lancé mon écran s'est mis en veille sans demander mon avis. Plus de réponse au clavier non plus, comme d'autres fois.
Cette fois, le log semble mettre Gconf en cause:
Mar 29 07:56:38 squirrel acpid: 1 client rule loaded
Mar 29 07:56:40 squirrel acpid: client connected from 3806[0:100]
Mar 29 07:56:40 squirrel acpid: 1 client rule loaded
Mar 29 08:01:18 gconfd (melodie-3921): démarrage (version 2.20.1), pid 3921 utilisateur « melodie »
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readonly:/etc/gconf/gconf.xml.mandatory » résolue vers une source de configuration en lecture seule à la position 0
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readwrite:/home/melodie/.gconf » résolue vers une source de configuration accessible en écriture à la position 1
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 2
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 3
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 4
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 5
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readwrite:/home/melodie/.gconf » résolue vers une source de configuration accessible en écriture à la position 6
Mar 29 08:01:18 gconfd (melodie-3921): Adresse « xml:readonly:/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 7
Mar 29 08:01:23 squirrel NET: Registered protocol family 10
Mar 29 08:01:23 squirrel lo: Disabled Privacy Extensions
Mar 29 08:35:48 gconfd (melodie-3921): Le serveur GConf n'est pas en cours d'utilisation, arrêt.
Mar 29 08:35:48 gconfd (melodie-3921): Sortie
Mar 29 08:35:57 squirrel shutdown[4468]: shutting down for system reboot
Mar 29 08:35:57 squirrel init: Switching to runlevel: 6
Mar 29 08:35:58 squirrel squid[3705]: Preparing for shutdown after 1056 requests
Mar 29 08:35:58 squirrel squid[3705]: Waiting 30 seconds for active connections to finish
Mar 29 08:35:58 squirrel squid[3705]: FD 11 Closing HTTP connection
Mar 29 08:35:58 squirrel squid[3705]: Shutting down...
Mar 29 08:35:58 squirrel squid[3705]: FD 12 Closing ICP connection
Mar 29 08:35:58 squirrel squid[3705]: FD 13 Closing HTCP socket
Mar 29 08:35:58 squirrel squid[3705]: Closing unlinkd pipe on FD 9
Mar 29 08:35:58 squirrel squid[3705]: storeDirWriteCleanLogs: Starting...
Mar 29 08:35:58 squirrel squid[3705]: 65536 entries written so far.
Mar 29 08:35:58 squirrel squid[3705]: Finished. Wrote 107426 entries.
Mar 29 08:35:58 squirrel squid[3705]: Took 0.1 seconds (1305694.3 entries/sec).
Mar 29 08:35:58 squirrel squid[3705]: Squid Cache (Version 2.6.STABLE12): Exiting normally.
Mar 29 08:35:58 squirrel squid[3703]: Squid Parent: child process 3705 exited with status 0
Mar 29 08:35:58 squirrel shutdown[4541]: shutting down for system reboot
"Preparing shutdown after 1056 request" : il est zinzin ? J'ai juste fait 'ctrl+alt+backspace' quand j'ai vu que je ne pouvais rien faire d'autre ?
À tout hasard, au cas où ça puisse être utile de comparer, je mets la suite du log, à partir du reboot,
sur pastebin. Je remarque toujours ces messages à propos de gconf,
"Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position (numéro de position)"
je ne sais pas si ça joue sur le problème.
Publié : sam. 29 mars 2008, 09:39
par mélodie
En regardant le contenu du log de démarrage, sur la page de pastebin, j'ai remarqué des warnings sur l'Acpi.
Mar 29 08:37:45 squirrel ACPI: Looking for DSDT in initramfs... error, file /DSDT.aml not found.
Je trouve aussi que c'est curieux, et j'ai fait des recherches là-dessus. BIOS foireux ? Carte inadaptée pour recevoir un Nvidia ? Pourtant le bus pci-e (x16) est bien prévu pour une CG.
J'ai trouvé quelques liens sur le sujet sur le web,
que je mets de côté pour approfondir plus tard, en attendant d'essayer ce que j'ai dit un peu plus tôt.
Par exemple,
http://www.mail-archive.com/linux@acpi@ ... 11772.html
http://acpi.sourceforge.net/dsdt/
http://gaugusch.at/kernel.shtml
Errors are often caused by vendors testing their hardware only with Windows or because there is code which is executed only on a specific OS with a specific version and Linux hasn't been considered during the development.
C'est bien hirsute.

Publié : sam. 29 mars 2008, 11:41
par tuxce
mélodie a écrit :Oui, maintenant que tu le dis, j'ai essayé, et ça plantait aussi.
Je peux toujours essayer à nouveau, et lancer juste openbox au lieu de xfce4+Compiz.
le pilote libre "nv" ne peut pas faire fonctionner compiz...
tu as testé la ram? parce qu'une machine qui plante sans cesse avec de messages différents, ca peut aussi venir de la

Publié : sam. 29 mars 2008, 13:03
par mélodie
tuxce a écrit :mélodie a écrit :Oui, maintenant que tu le dis, j'ai essayé, et ça plantait aussi.
Je peux toujours essayer à nouveau, et lancer juste openbox au lieu de xfce4+Compiz.
le pilote libre "nv" ne peut pas faire fonctionner compiz...
Pour ça que je démarrerai ma sessions sous Openbox et non sous xfce4 configuré avec Compiz.
tu as testé la ram? parce qu'une machine qui plante sans cesse avec de messages différents, ca peut aussi venir de la

Pas tout récemment, je peux en effet ajouter ça dans la todo en tête de liste.
Merci.
Publié : dim. 30 mars 2008, 13:32
par mélodie
Bonjour,
J'ai testé la ram hier, (un passage et un peu plus) pas d'erreur. Je passe à l'essai avec nv+openbox-session.
Nouveau plantage
Publié : lun. 31 mars 2008, 11:04
par mélodie
Comme prévu j'ai tourné depuis hier avec le driver nv au lieu de nvidia, et openbox pour tout environnement de bureau (avec fbpanel tout de même, et
les menus dynamiques de mimas, c'est plus agréable).
J'étais tranquillement en train de visiter une page sur le web, scrollant doucement. J'ai un petit souci avec Firefox3 bêta : ce sont les feuilles de styles, et aussi les photos qui sont noires, et comme pour ce que je cherche ça a son importance, j'ai lancé le tout nouveau Swiftweasel 2.0.0.13 pour athlon xp, et c'est peu après que tout a gelé.
En applis lancées j'avais Sylpheed, cmus, pcman pour naviguer dans les répertoires, (des applis légères) et puis en lourd, un lecteur pdf, deux navigateurs avec une demi-douzaine d'onglets chacun. Pour une machine dotée de 1 go de ram etc... rien d'inouï je pense.
Le log avant gel ne dit rien, puisque de 7H34 à 10H39 quand j'ai essayé de reprendre le contrôle de
cette bête sauvage, rien n'est inscrit:
Mar 31 07:34:50 squirrel -- MARK --
Mar 31 10:39:20 squirrel SysRq : Keyboard mode set to system default
Mar 31 10:39:43 squirrel shutdown[4243]: shutting down for system reboot
Mar 31 10:39:44 squirrel init: Switching to runlevel: 6
Mar 31 10:39:45 squirrel shutdown[4249]: shutting down for system reboot
Mar 31 10:39:45 squirrel shutdown[4251]: shutting down for system reboot
Mar 31 10:39:45 squirrel shutdown[4253]: shutting down for system reboot
Mar 31 10:39:45 squirrel shutdown[4256]: shutting down for system reboot
Mar 31 10:39:45 squirrel shutdown[4263]: shutting down for system reboot
Mar 31 10:39:45 squirrel shutdown[4267]: shutting down for system reboot
Mar 31 10:39:45 squirrel shutdown[4275]: shutting down for system reboot
Mar 31 10:39:45 squirrel pcmanfm[4024]: segfault at 00000008 eip 4051ef24 esp bfea49a0 error 4
Mar 31 10:39:45 squirrel shutdown[4282]: shutting down for system reboot
Mar 31 10:39:46 squirrel shutdown[4287]: shutting down for system reboot
Mar 31 10:39:46 squirrel shutdown[4300]: shutting down for system reboot
Mar 31 10:39:46 squirrel shutdown[4304]: shutting down for system reboot
Mar 31 10:39:46 squirrel shutdown[4314]: shutting down for system reboot
Mar 31 10:39:46 squirrel squid[3672]: Preparing for shutdown after 3138 requests
Mar 31 10:39:46 squirrel squid[3672]: Waiting 30 seconds for active connections to finish
Mar 31 10:39:46 squirrel squid[3672]: FD 11 Closing HTTP connection
Mar 31 10:39:46 squirrel squid[3672]: Shutting down...
Mar 31 10:39:46 squirrel squid[3672]: FD 12 Closing ICP connection
Mar 31 10:39:46 squirrel squid[3672]: FD 13 Closing HTCP socket
Mar 31 10:39:46 squirrel squid[3672]: Closing unlinkd pipe on FD 9
Mar 31 10:39:46 squirrel squid[3672]: storeDirWriteCleanLogs: Starting...
Mar 31 10:39:46 squirrel squid[3672]: 65536 entries written so far.
Mar 31 10:39:46 squirrel squid[3672]: Finished. Wrote 108885 entries.
Mar 31 10:39:46 squirrel squid[3672]: Took 0.1 seconds (1330429.4 entries/sec).
Mar 31 10:39:46 squirrel squid[3672]: Squid Cache (Version 2.6.STABLE12): Exiting normally.
Mar 31 10:39:46 squirrel squid[3670]: Squid Parent: child process 3672 exited with status 0
Mar 31 10:42:43 squirrel Linux version 2.6.24-ARCH (root@T-POWA-LX) (gcc version 4.2.3) #1 SMP PREEMPT Wed Mar 5 12:07:52 UTC 2008
Par contre, dans le log juste après boot, il y a un message relatif à l'acpi:
Mar 31 10:42:43 squirrel ACPI: PCI Interrupt Link [LNKA] (IRQs 3 4 *5 6 7 10 11 12 14 15)
(...)
Mar 31 10:42:43 squirrel ACPI: PCI Interrupt Link [LNKH] (IRQs 3 4 5 6 7 *10 11 12 14 15)
Mar 31 10:42:43 squirrel ACPI Warning (tbutils-0217): Incorrect checksum in table [OEMB] - 5D, should be 55 [20070126]
Je tente de mettre le paramètre 'noacpi'.

Publié : lun. 31 mars 2008, 12:08
par mélodie
Avec l'option noacpi ça ne change rien non plus. Gel total clavier+souris : Swiftweasel est souvent associé au gel, et Firefox 3 a un rendu défectueux sur plus d'un site.
Le dernier log, noacpi toujours avec nv et openbox:
Mar 31 11:35:06 gconfd (melodie-4030): Adresse « xml:readwrite:/home/melodie/.gconf » résolue vers une source de configuration accessible en écriture à la position 6
Mar 31 11:35:06 gconfd (melodie-4030): Adresse « xml:readonly:/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 7
Mar 31 11:56:51 squirrel SysRq : Keyboard mode set to system default
Mar 31 11:57:29 squirrel shutdown[4116]: shutting down for system reboot
Mar 31 11:57:30 squirrel init: Switching to runlevel: 6
Mar 31 11:57:31 squirrel shutdown[4122]: shutting down for system reboot
Mar 31 11:57:31 squirrel shutdown[4124]: shutting down for system reboot
Mar 31 11:57:31 squirrel shutdown[4126]: shutting down for system reboot
Mar 31 11:57:31 squirrel shutdown[4129]: shutting down for system reboot
Mar 31 11:57:31 squirrel pcmanfm[4055]: segfault at 00000008 eip 4051ef24 esp bfbe9a90 error 4
Mar 31 11:57:32 squirrel shutdown[4148]: shutting down for system reboot
Mar 31 11:57:32 squirrel shutdown[4172]: shutting down for system reboot
Mar 31 11:57:33 squirrel squid[3715]: Preparing for shutdown after 1604 requests
Mar 31 11:57:33 squirrel squid[3715]: Waiting 30 seconds for active connections to finish
Mar 31 11:57:33 squirrel squid[3715]: FD 11 Closing HTTP connection
Mar 31 11:57:33 squirrel squid[3715]: Shutting down...
Mar 31 11:57:33 squirrel squid[3715]: FD 12 Closing ICP connection
Mar 31 11:57:33 squirrel squid[3715]: FD 13 Closing HTCP socket
Mar 31 11:57:33 squirrel squid[3715]: Closing unlinkd pipe on FD 9
Mar 31 11:57:33 squirrel squid[3715]: storeDirWriteCleanLogs: Starting...
Mar 31 11:57:33 squirrel squid[3715]: 65536 entries written so far.
Mar 31 11:57:33 squirrel squid[3715]: Finished. Wrote 109119 entries.
Mar 31 11:57:33 squirrel squid[3715]: Took 0.1 seconds (1593722.6 entries/sec).
Mar 31 11:57:33 squirrel squid[3715]: Squid Cache (Version 2.6.STABLE12): Exiting normally.
Mar 31 11:57:33 squirrel squid[3713]: Squid Parent: child process 3715 exited with status 0
Mar 31 11:58:17 squirrel Linux version 2.6.24-ARCH (root@T-POWA-LX) (gcc version 4.2.3) #1 SMP PREEMPT Wed Mar 5 12:07:52 UTC 2008
Donc, pour l'instant je ne vois pas de lien direct avec le driver nvidia, ni avec l'acpi... ni la mémoire... qu'est-ce qui reste ? Le kernel ?
Publié : lun. 31 mars 2008, 12:42
par tuxce
je vois à chaque fois dans tes logs la ligne:
c.a.d que le système ne gèle pas complétement, tu arrives quand meme à faire quelque chose, tu redemarres normalement, c'est ca?
sinon, pour le souci, c'est peut etre tout simplement une défaillance matérielle qui causerait le problème, la carte doit etre mauvaise!
Publié : lun. 31 mars 2008, 13:15
par mélodie
tuxce a écrit :je vois à chaque fois dans tes logs la ligne:
c.a.d que le système ne gèle pas complétement, tu arrives quand meme à faire quelque chose, tu redemarres normalement, c'est ca?
Malheureusement non, ce n'est pas ça. Il enregistre bien le message de SysRq comme tu l'as noté, mais le clavier ne répond pas quand même.
Je viens à nouveau d'avoir un gel complet, je n'ai rien pu faire même pas ctrl+alt+backspace ni +suppr, j'ai dû éteindre au bouton.
Parfois j'ai pu avoir au moins un reboot, en maintenant ctrl+alt+backspace, mais pas mieux. (pas de tty toujours)
sinon, pour le souci, c'est peut etre tout simplement une défaillance matérielle qui causerait le problème, la carte doit etre mauvaise!
Et peut-être, ou encore une incompatibilité avec la CG. Il me reste à ôter la CG Nvidia et réinstaller openchrome pour m'en assurer. :/
Pour l'instant, retour vers l'utilisation du driver nvidia + compiz, puisque ça ne change rien.
L'option noacpi que j'ai mise dans la ligne de boot aussi, je me demande pour quoi faire.
Publié : lun. 31 mars 2008, 14:01
par tuxce
en fait le clavier répond mais l'affichage doit pas suivre, c'est ce qui me pousse à croire à une carte défectueuse.
d'ailleurs le shutdown avec ctrl+alt+del a l'air de bien de se passer:
Code : Tout sélectionner
Mar 31 11:57:29 squirrel shutdown[4116]: shutting down for system reboot
Mar 31 11:57:30 squirrel init: Switching to runlevel: 6
sinon, tu peux toujours essayer l'une des autres touches sysRq:
http://wiki.archlinux.fr/howto:kernel:sysrq
la "e" ou "i" par exemple qui tue tous les process sauf init, si celle ci ne fonctionne pas et que tu as quand meme l'entrée dans le log, c'est clairement un souci d'affichage!
Publié : lun. 31 mars 2008, 15:15
par mélodie
tuxce a écrit :en fait le clavier répond mais l'affichage doit pas suivre, c'est ce qui me pousse à croire à une carte défectueuse.
d'ailleurs le shutdown avec ctrl+alt+del a l'air de bien de se passer:
Code : Tout sélectionner
Mar 31 11:57:29 squirrel shutdown[4116]: shutting down for system reboot
Mar 31 11:57:30 squirrel init: Switching to runlevel: 6
Comme j'ai dit sur le post précédent, des fois, oui, des fois non (la toute dernière je n'ai pas remis d'extrait de log, mais c'était non).
sinon, tu peux toujours essayer l'une des autres touches sysRq:
http://wiki.archlinux.fr/howto:kernel:sysrq
la "e" ou "i" par exemple qui tue tous les process sauf init, si celle ci ne fonctionne pas et que tu as quand meme l'entrée dans le log, c'est clairement un souci d'affichage!
Quand tu penses carte défectueuse, tu parles de la carte graphique. ah.
J'ai fait tester cette carte dans un magasin d'info, il l'a mise sur une machine outillée avec Vista, il a installé les drivers et l'a faite tourner plus d'une heure sur un soft de benchmark, quand je suis revenue il l'a déclarée bonne. Il m'a dit que la carte est impeccable.
Pfff... à suivre.

J'essaierai plus d'options SysRq, le e d'abord et le i ensuite, le tout précédé du r quand même, des fois que.
Merci tuxce.