[Freezes de X] avec salades d'IRQ (+ ou - Résolu)

Reconnaissance et configuration du matériel / kernel linux
_alexmyself
Chu Ko Nu
Messages : 405
Inscription : lun. 18 sept. 2006, 16:21
Localisation : france, yvelines 78

Message par _alexmyself »

je sait meme plus a quoi ca servait mais quand j'avait des problèmes de gel ca été resolu avec 'noapic' au boot.
cela dit ca fait un bail que je n'en ai plus besoin.
_alexmyself
Chu Ko Nu
Messages : 405
Inscription : lun. 18 sept. 2006, 16:21
Localisation : france, yvelines 78

Message par _alexmyself »

et j'ai les memes erreurs 'gconfd', et ca fait longtemps...
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Message par mélodie »

_alexmyself a écrit :je sait meme plus a quoi ca servait mais quand j'avait des problèmes de gel ca été resolu avec 'noapic' au boot.
cela dit ca fait un bail que je n'en ai plus besoin.
Ah. :idea:
http://www.c-sait.net/cours/demarrage.php
noapic L'APIC permet à plusieurs périphériques de partager des ressources communes (les IRQ). Avec cette option, on peut désactiver ce mécanisme qui peut engendrer des problèmes avec certains matériels.
Je vais essayer. Merci pour l'idée.
et j'ai les memes erreurs 'gconfd', et ca fait longtemps...
apparamment ça semble courant en effet, et ça ne gène pas.

J'espère juste que le noapic ne va pas induire d'autres effets de bord, parce que :

http://kerneltrap.org/mailarchive/linux ... 9/5/168070
...Passing the noapic option fixes all that, but it
then gets 1000 spurious interrupts per second on IRQ7 (which
only shows ehci using it.) Kernel version is 2.6.22.
J'ai le 2.6.24-ARCH, alors à voir.
Avatar de l’utilisateur
Skunnyk
Maître du Kyudo
Messages : 1137
Inscription : mer. 06 sept. 2006, 21:31
Localisation : IRC
Contact :

Message par Skunnyk »

Et quand ca plante, est ce que un alt+printscreen+b fait quelque chose ? (sysRQ qui tue le kernel...) ?
Sinon il y a peut être une incompatibilité entre ta CG et ta carte mère/ram, je sais pas trop ...
Bref, au point ou tu en est, retest avec ton openchrome :)
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Message par mélodie »

Skunnyk a écrit :Et quand ca plante, est ce que un alt+printscreen+b fait quelque chose ? (sysRQ qui tue le kernel...) ?
Je ne sais pas encore, je n'ai pas exploré cette option.
Sinon il y a peut être une incompatibilité entre ta CG et ta carte mère/ram, je sais pas trop ...
Pour l'instant je suis plus sur la piste du apic buggué. J'ai trouvé assez de messages sur le web pour confirmer que c'est un motif de gel connu sur les machines *nix, en particulier sur les cartes mères Asus.
Bref, au point ou tu en est, retest avec ton openchrome :)
En fait je considère ça comme une solution extrême, la punition.

Comme j'ai lu que le problème pouvait ne pas apparaître avec une version amd64 à cause des cycles d'interruption différents de ceux d'un autre cpu, (j'ai lu "time count interrups", que je me permet de traduire tel que je l'ai compris) je vais essayer une version Arch 64, et aussi l'option noapic au boot, sur ma version i686 courante.

Merci Skunnyk.
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Message par mélodie »

Coucou,

Ça fait trois jours que j'ai ajouté noapic au boot, selon le conseil de _alexmyself, et... rien, pas un gel depuis.

Je n'ose pas encore crier "victoire" et inscrire (Résolu). Si ça tient encore quelques jours comme ça, disons le temps d'arriver à une semaine complète, ce sera bon ! ^^
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Message par mélodie »

up, hop hop !

Cela s'est bien calmé en effet, mais ces deux derniers jours, deux plantages et deux ou trois au total ces derniers jours en réalité.

Voici le log du plantage que j'ai eu tout à l'heure, encore une fois un gel complet de l'interface. La seule différence d'avec avant que je n'ajoute "noapic" au boot, est que maintenant, je peux rebooter avec "Ctrl+Alt+backspace", mais je ne peux toujours pas reprendre le contrôle avec SysRq, bien que j'essaie, j'essaie...

Voici une belle salade d'IRQ's, au moment du plantage (je laisse quelques lignes avant, et quelques lignes après au moment du reboot, pour situer le contexte du log):

extrait d'un '#tail -n 800 /var/log/messages.log':
Apr 14 14:53:14 gconfd (melodie-4986): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 5
Apr 14 14:53:14 gconfd (melodie-4986): Adresse « xml:readwrite:/home/melodie/.gconf » résolue vers une source de configuration accessible en écriture à la position 6
Apr 14 14:53:14 gconfd (melodie-4986): Adresse « xml:readonly:/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 7
Apr 14 18:28:55 squirrel Pid: 5118, comm: xmms Tainted: P 2.6.24-ARCH #1
Apr 14 18:28:55 squirrel [<c015c244>] __report_bad_irq+0x24/0x80
Apr 14 18:28:55 squirrel [<f988fe1c>] nv_kern_isr+0x6c/0xd0 [nvidia]
Apr 14 18:28:55 squirrel [<c015c52b>] note_interrupt+0x28b/0x2d0
Apr 14 18:28:55 squirrel [<c015b740>] handle_IRQ_event+0x30/0x60
Apr 14 18:28:55 squirrel [<c015d102>] handle_level_irq+0x92/0xf0
Apr 14 18:28:55 squirrel [<c01083bb>] do_IRQ+0x3b/0x70
Apr 14 18:28:55 squirrel [<c01334eb>] irq_exit+0x5b/0x90
Apr 14 18:28:55 squirrel [<c011cfe5>] smp_apic_timer_interrupt+0x55/0x80
Apr 14 18:28:55 squirrel [<c0105f47>] common_interrupt+0x23/0x28

Apr 14 18:28:55 squirrel =======================
Apr 14 18:29:28 squirrel SysRq : Keyboard mode set to system default
Apr 14 18:30:47 squirrel SysRq : Terminate All Tasks
Apr 14 19:07:27 squirrel Linux version 2.6.24-ARCH (root@T-POWA-LX) (gcc version 4.2.3) #1 SMP PREEMPT Wed Mar 5 12:07:52 UTC 2008
Apr 14 19:07:27 squirrel BIOS-provided physical RAM map:
Apr 14 19:07:27 squirrel BIOS-e820: 0000000000000000 - 000000000009fc00 (usable)
Apr 14 19:07:27 squirrel BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
Apr 14 19:07:27 squirrel BIOS-e820: 00000000000e4000 - 0000000000100000 (reserved)
Donc le problème n'est pas encore réglé. :(
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Message par mélodie »

Je peux dire que c'est quasiment résolu, et pour ça j'ai ajouté les deux options 'noapic' et 'nolapic' sur la ligne de kernel.

Pourtant de temps en temps il peut encore se produire un freeze, mais c'est devenu assez rare et la configuration des SysRq que tuxce m'a fait faire m'aident bien à rebooter logiciellement et non par le bouton.

Il y a aussi le plugin Mister Wong, avec ses messages au sujet de Javascript, dans les lignes de log (messages log) qui m'inquiétaient, j'ai donc supprimé ce plugin, dans le doute.

Je vais écrire (+ ou - résolu) (dans le doute).
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Message par mélodie »

Bonjour,

Ça a recommancé, et ça m'agace.

Le message que je trouve après reboot, pour la partie du moment qui précède le freeze est plein de "trucs kernel".
Jul 8 08:35:00 squirrel acpid: 1 client rule loaded
Jul 8 08:35:00 squirrel squid[5023]: storeLateRelease: released 0 objects
Jul 8 08:35:19 squirrel acpid: client connected from 5145[0:100]
Jul 8 08:35:19 squirrel acpid: 1 client rule loaded
Jul 8 08:35:21 squirrel acpid: client connected from 5145[0:100]
Jul 8 08:35:21 squirrel acpid: 1 client rule loaded
Jul 8 08:35:43 gconfd (melodie-5198): démarrage (version 2.22.0), pid 5198 utilisateur « melodie »
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readonly:/etc/gconf/gconf.xml.mandatory » résolue vers une source de configuration en lecture seule à la position 0
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readwrite:/home/melodie/.gconf » résolue vers une source de configuration accessible en écriture à la position 1
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 2
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 3
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 4
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readonly:/opt/gnome/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 5
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readwrite:/home/melodie/.gconf » résolue vers une source de configuration accessible en écriture à la position 6
Jul 8 08:35:43 gconfd (melodie-5198): Adresse « xml:readonly:/etc/gconf/gconf.xml.defaults » résolue vers une source de configuration en lecture seule à la position 7
Jul 8 08:35:50 squirrel NET: Registered protocol family 10
Jul 8 08:35:50 squirrel lo: Disabled Privacy Extensions
Jul 8 13:15:20 squirrel Pid: 5553, comm: xchat Tainted: P 2.6.24-ARCH #1
Jul 8 13:15:20 squirrel [<c015f424>] __report_bad_irq+0x24/0x90
Jul 8 13:15:20 squirrel [<f98876fd>] nv_kern_isr+0x6d/0xd0 [nvidia]
Jul 8 13:15:20 squirrel [<c015f70b>] note_interrupt+0x27b/0x2c0
Jul 8 13:15:20 squirrel [<c02efedc>] skb_queue_tail+0x1c/0x50
Jul 8 13:15:20 squirrel [<c015eb50>] handle_IRQ_event+0x30/0x60
Jul 8 13:15:20 squirrel [<c015ff83>] handle_level_irq+0xd3/0x100
Jul 8 13:15:20 squirrel [<c01084eb>] do_IRQ+0x3b/0x70
Jul 8 13:15:20 squirrel [<c0105fe7>] common_interrupt+0x23/0x28
Jul 8 13:15:20 squirrel [<c03850b0>] __mutex_lock_slowpath+0x210/0x2e0
Jul 8 13:15:20 squirrel [<f97d6aa7>] _nv004178rm+0x19/0x1d [nvidia]
Jul 8 13:15:20 squirrel [<c018fc9d>] pipe_write+0x5d/0x530
Jul 8 13:15:20 squirrel [<f97ee444>] rm_isr+0x9c/0xef [nvidia]
Jul 8 13:15:20 squirrel [<f98876fd>] nv_kern_isr+0x6d/0xd0 [nvidia]
Jul 8 13:15:20 squirrel [<c0188d85>] do_sync_write+0xd5/0x120
Jul 8 13:15:20 squirrel [<c0109e0d>] enable_8259A_irq+0xd/0x50
Jul 8 13:15:20 squirrel [<c01441b0>] autoremove_wake_function+0x0/0x50
Jul 8 13:15:20 squirrel [<c0188f24>] rw_verify_area+0x34/0xb0
Jul 8 13:15:20 squirrel [<c0188cb0>] do_sync_write+0x0/0x120
Jul 8 13:15:20 squirrel [<c01897d4>] vfs_write+0xb4/0x150
Jul 8 13:15:20 squirrel [<c0189941>] sys_write+0x41/0x80
Jul 8 13:15:20 squirrel [<c0105582>] sysenter_past_esp+0x6b/0xa1
Jul 8 13:15:20 squirrel =======================
Toujours personne ayant une idée sur la question ?
Avatar de l’utilisateur
tuxce
Maître du Kyudo
Messages : 6677
Inscription : mer. 12 sept. 2007, 16:03

Message par tuxce »

je vois que tu utilises le 2.6.24 (du coup, un driver nvidia pas à jour), met à jour (on sait jamais)
Répondre