[crashs] plantages aléatoires (résolu)

Reconnaissance et configuration du matériel / kernel linux
Répondre
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

[crashs] plantages aléatoires (résolu)

Message par Le Limule »

bonjour,

j'ai un pb de crashs sur mon PC; depuis plusieurs jours/semaines il plante aléatoirement.
au début ça se produisait surtout qd je regardai une vidéo sur youtube par exemple (avec ou sans flash).
ça pouvait planter jusqu'à plusieurs fois en une journée, ou pas du tout.
soit l'écran est figé, soit l'écran est noir dû à une perte de signal. dans tout les cas rien ne répond et il faut éteindre et rallumer le PC.
je n'avais pas ces pbs avant et je pense n'avoir rien changé au PC.
j'ai testé la mémoire au boot avec memtest86+; c'est ok.

j'étais en linux [... correction: 3.17.6-1 - je remarque aussi que j'ai linux-api-headers 3.18.1-1 installé mais pas linux-headers 3.17.6-1] et je suis passé en 3.14.27-1-lts [edit: + headers] pour tenter de résoudre le pb.
(j'ai aussi modifié un paramètre du BIOS: "MaxCPUID Value Limit (disabled for WinXP)" je l'ai passé de disabled à enabled (?).
ça semble moins planter (c'est subjectif) mais ça plante qd même; j'ai eu 2 plantages sur une ou deux semaines (1 pendant que j'écrivai un mail ds thunderbird, le 2eme pendant que je déroulai un pdf avec Evince).

ma carte mère est une Zotac ION ITX (mini-ITX tout intégrée avec ATOM 330 en refroidissement passif (aucun ventilo - c'est prévu comme ça)).

je n'ai pas trouvé de log montrant le pb. où regarder?

avez-vous des idées?
Dernière modification par Le Limule le jeu. 20 juil. 2017, 11:53, modifié 1 fois.
Avatar de l’utilisateur
mélodie
Maître du Kyudo
Messages : 2784
Inscription : lun. 30 oct. 2006, 02:06
Localisation : Pyrénées

Re: [crashs] plantages aléatoires

Message par mélodie »

Salut,

Après le prochain plantage + reboot, sors les infos de dmesg, "dmesg > dmesg.txt" envoie le contenu sur pastebin. On pourra toujours regarder les erreurs, et les avertissements. À part ça, des infos sur le hardware ?
au début ça se produisait surtout qd je regardai une vidéo sur youtube par exemple (avec ou sans flash).
perso ça me faisait des choses semblables, j'ai viré Flash, installé Pepperflash et je ne regarde plus les vidéos ou animation Flash que dans Chromium, si j'en ai vraiment besoin.
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

Re: [crashs] plantages aléatoires

Message par Le Limule »

salut,

je n'avais pas vu ta réponse.
entre temps, fin mars, j'ai upgradé tout mon système au 29 janvier 2015 (linux 3.18.4-1 + headers).
le 31 mars j'ai eu un crash qui s'est figé sur un écran texte de trace. je n'ai pu prendre qu'une photo de l'écran:
http://ti1ca.com/1kohbxxz-2015-03-31-co ... h.JPG.html

c'est donc après que j'ai vu ta réponse. merci pour celle-ci d'ailleurs.

aujourd'hui je viens d'avoir un nouveau crash (thunderbird + firefox + leafpad + libreoffice writer étaient ouverts (mais pas de vidéo, rien à voir avec flash donc)). comme "souvent" l'écran est devenu complètement noir, plus rien ne répondait.
j'ai donc éteint puis rallumé, et fais un "dmesg -e":
http://pastebin.archlinux.fr/903334
(bien que je ne vois pas l'intérêt puisqu'il trace à partir du dernier démarrage, donc après le crash)

pour les infos sur le hardware, je ne sais pas si un "lspci -vvv" te convient(?):
http://pastebin.archlinux.fr/903335

je crains que ce soit un pb matériel.

si vous avez des idées...
Avatar de l’utilisateur
benjarobin
Maître du Kyudo
Messages : 17224
Inscription : sam. 30 mai 2009, 15:48
Localisation : Lyon

Re: [crashs] plantages aléatoires

Message par benjarobin »

Ce n'est pas forcément un problème matériel, c'est possible que ce soit un bug dans le module nouveau. Tu as bien une carte nvidia avec le driver nouveau
Zsh | KDE | PC fixe : core i7, carte nvidia
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

Re: [crashs] plantages aléatoires

Message par Le Limule »

puisque tu parles de nouveau, il se trouve que je viens de faire un dmesg à tout hazard, et tout à la fin il m'affiche une ligne que je n'avais jamais vu concernant nouveau:

Code : Tout sélectionner

...
[  +0,105027] mousedev: PS/2 mouse device common for all mice
[avril 3 16:34] perf interrupt took too long (2547 > 2495), lowering kernel.perf_event_max_sample_rate to 50100
[avril 3 16:57] perf interrupt took too long (5031 > 4960), lowering kernel.perf_event_max_sample_rate to 25200
[avril 3 18:51] nouveau E[   PFIFO][0000:03:00.0] still angry after 101 spins, halt
[guigui@guigui-ordi ~]$ 
je n'ai pas eu de plantage, cela n'a peut-être rien à voir, mais je le signale en passant...
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

Re: [crashs] plantages aléatoires

Message par Le Limule »

bonjour,

j'ai eu un nouveau crash ce matin (reboot inopiné alors que seul firefox était ouvert - je suis à peu près sûr d'avoir eu des crashs antérieurs sans que firefox ne soit ouvert).

cette fois-ci j'ai compris comment voir le journal jusqu'au crash. voici donc le log complet de la session (démarrage à 7h36, crash après 7h56m54s - "longtemps" après ou pas, je ne sais pas). "journalctl --since 07:00":
https://bpaste.net/show/f6c7271dc4ab

ds ce log, les messages de plus haute priorité sont des warnings (4). je les ai isolés. "journalctl --since 07:00 -p 4":

Code : Tout sélectionner

-- Logs begin at lun. 2014-12-29 17:39:35 UTC, end at mar. 2015-04-07 08:40:25 UTC. --
avril 07 07:36:43 guigui-ordi kernel: ACPI: RSDP 0x00000000000FA810 000014 (v00 ACPIAM)
avril 07 07:36:43 guigui-ordi kernel: ACPI: RSDT 0x000000006FFA0000 000040 (v01 050809 RSDT1106 20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: FACP 0x000000006FFA0200 000084 (v01 050809 FACP1106 20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: DSDT 0x000000006FFA04A0 0070E9 (v01 A108P  A108PD08 00000D08 INTL 20051117)
avril 07 07:36:43 guigui-ordi kernel: ACPI: FACS 0x000000006FFAE000 000040
avril 07 07:36:43 guigui-ordi kernel: ACPI: APIC 0x000000006FFA0390 000080 (v01 050809 APIC1106 20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: MCFG 0x000000006FFA0410 00003C (v01 050809 OEMMCFG  20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: WDRT 0x000000006FFA0450 000047 (v01 050809 NV-WDRT  20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: OEMB 0x000000006FFAE040 000079 (v01 050809 OEMB1106 20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: HPET 0x000000006FFAA4A0 000038 (v01 050809 OEMHPET0 20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: ACPI: NVHD 0x000000006FFAE0C0 000284 (v01 050809 NVHDCP   20090508 MSFT 00000097)
avril 07 07:36:43 guigui-ordi kernel: Zone ranges:
avril 07 07:36:43 guigui-ordi kernel:   DMA      [mem 0x00001000-0x00ffffff]
avril 07 07:36:43 guigui-ordi kernel:   DMA32    [mem 0x01000000-0xffffffff]
avril 07 07:36:43 guigui-ordi kernel:   Normal   empty
avril 07 07:36:43 guigui-ordi kernel: Movable zone start for each node
avril 07 07:36:43 guigui-ordi kernel: Early memory node ranges
avril 07 07:36:43 guigui-ordi kernel:   node   0: [mem 0x00001000-0x0009dfff]
avril 07 07:36:43 guigui-ordi kernel:   node   0: [mem 0x00100000-0x6ff9ffff]
avril 07 07:36:43 guigui-ordi kernel: Built 1 zonelists in Node order, mobility grouping on.  Total pages: 451369
avril 07 07:36:43 guigui-ordi kernel: Policy zone: DMA32
avril 07 07:36:43 guigui-ordi kernel: Memory: 1789920K/1834228K available (5479K kernel code, 908K rwdata, 1720K rodata, 1160K init, 1184K bss, 44308K reserved)
avril 07 07:36:43 guigui-ordi kernel: ACPI: All ACPI Tables successfully acquired
avril 07 07:36:43 guigui-ordi kernel: ACPI: Executed 1 blocks of module-level executable AML code
avril 07 07:36:43 guigui-ordi kernel: ACPI Exception: AE_NOT_FOUND, While evaluating Sleep State [\_S2_] (20140926/hwxface-580)
avril 07 07:36:43 guigui-ordi kernel: ACPI Exception: AE_NOT_FOUND, While evaluating Sleep State [\_S3_] (20140926/hwxface-580)
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LUB0] enabled at IRQ 23
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LUB2] enabled at IRQ 22
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [UB11] enabled at IRQ 21
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [UB12] enabled at IRQ 20
avril 07 07:36:43 guigui-ordi kernel: pci 0000:00:06.1: EHCI: BIOS handoff failed (BIOS bug?) 01010001
avril 07 07:36:43 guigui-ordi kernel: Dquot-cache hash table entries: 512 (order 0, 4096 bytes)
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LRP0] enabled at IRQ 23
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LRP3] enabled at IRQ 22
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LRP4] enabled at IRQ 21
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LRP5] enabled at IRQ 20
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LRP6] enabled at IRQ 23
avril 07 07:36:43 guigui-ordi kernel: i8042: PNP: PS/2 appears to have AUX port disabled, if this is incorrect please boot with i8042.nopnp
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LSA0] enabled at IRQ 22
avril 07 07:36:43 guigui-ordi systemd[1]: Cannot add dependency job for unit display-manager.service, ignoring: Unit display-manager.service failed to load: No such file or dire
avril 07 07:36:44 guigui-ordi kernel: ACPI Warning: SystemIO range 0x0000000000004e00-0x0000000000004e3f conflicts with OpRegion 0x0000000000004e00-0x0000000000004e3f (\_SB_.PCI
avril 07 07:36:44 guigui-ordi kernel: ACPI: PCI Interrupt Link [LMAC] enabled at IRQ 21
avril 07 07:36:44 guigui-ordi kernel: ACPI: PCI Interrupt Link [LAZA] enabled at IRQ 20
avril 07 07:36:44 guigui-ordi kernel: ACPI: PCI Interrupt Link [SGRU] enabled at IRQ 23
avril 07 07:36:48 guigui-ordi avahi-daemon[325]: WARNING: No NSS support for mDNS detected, consider installing nss-mdns!
avril 07 07:36:55 guigui-ordi org.a11y.Bus[346]: Activating service name='org.a11y.atspi.Registry'
avril 07 07:36:55 guigui-ordi org.a11y.Bus[346]: Successfully activated service 'org.a11y.atspi.Registry'
avril 07 07:46:10 guigui-ordi kernel: perf interrupt took too long (2511 > 2495), lowering kernel.perf_event_max_sample_rate to 50100
avril 07 07:56:54 guigui-ordi kernel: perf interrupt took too long (5056 > 4960), lowering kernel.perf_event_max_sample_rate to 25200
-- Reboot --
parmi ces warnings, certains m'interpellent (à tord ou à raison). je les ai remis ds leur contexte:
avril 07 07:36:43 guigui-ordi kernel: PCI: Using configuration type 1 for base access
avril 07 07:36:43 guigui-ordi kernel: ACPI: Added _OSI(Module Device)
avril 07 07:36:43 guigui-ordi kernel: ACPI: Added _OSI(Processor Device)
avril 07 07:36:43 guigui-ordi kernel: ACPI: Added _OSI(3.0 _SCP Extensions)
avril 07 07:36:43 guigui-ordi kernel: ACPI: Added _OSI(Processor Aggregator Device)
avril 07 07:36:43 guigui-ordi kernel: ACPI: Executed 1 blocks of module-level executable AML code
avril 07 07:36:43 guigui-ordi kernel: ACPI: Interpreter enabled
avril 07 07:36:43 guigui-ordi kernel: ACPI Exception: AE_NOT_FOUND, While evaluating Sleep State [\_S2_] (20140926/hwxface-580)
avril 07 07:36:43 guigui-ordi kernel: ACPI Exception: AE_NOT_FOUND, While evaluating Sleep State [\_S3_] (20140926/hwxface-580)
avril 07 07:36:43 guigui-ordi kernel: ACPI: (supports S0 S1 S4 S5)
avril 07 07:36:43 guigui-ordi kernel: ACPI: Using IOAPIC for interrupt routing
avril 07 07:36:43 guigui-ordi kernel: PCI: MMCONFIG for domain 0000 [bus 00-1f] at [mem 0xfc000000-0xfdffffff] (base 0xfc000000)

...

avril 07 07:36:43 guigui-ordi kernel: NET: Registered protocol family 1
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LUB0] enabled at IRQ 23
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [LUB2] enabled at IRQ 22
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [UB11] enabled at IRQ 21
avril 07 07:36:43 guigui-ordi kernel: ACPI: PCI Interrupt Link [UB12] enabled at IRQ 20
avril 07 07:36:43 guigui-ordi kernel: pci 0000:00:06.1: EHCI: BIOS handoff failed (BIOS bug?) 01010001
avril 07 07:36:43 guigui-ordi kernel: pci 0000:03:00.0: Video device with shadowed ROM
avril 07 07:36:43 guigui-ordi kernel: PCI: CLS 64 bytes, default 64
avril 07 07:36:43 guigui-ordi kernel: Unpacking initramfs...

...

avril 07 07:36:43 guigui-ordi systemd[1]: systemd 218 running in system mode. (+PAM -AUDIT -SELINUX -IMA -APPARMOR +SMACK -SYSVINIT +UTMP +LIBCRYPTSETUP +GCRYPT +GNUTLS +ACL +XZ
avril 07 07:36:43 guigui-ordi systemd[1]: Detected architecture 'x86-64'.
avril 07 07:36:43 guigui-ordi systemd[1]: Set hostname to <guigui-ordi>.
avril 07 07:36:43 guigui-ordi kernel: usb 1-5: new full-speed USB device number 3 using ohci-pci
avril 07 07:36:43 guigui-ordi systemd[1]: Cannot add dependency job for unit display-manager.service, ignoring: Unit display-manager.service failed to load: No such file or directory.
avril 07 07:36:43 guigui-ordi systemd[1]: Starting Root Slice.
avril 07 07:36:43 guigui-ordi systemd[1]: Created slice Root Slice.

...

avril 07 07:36:43 guigui-ordi kernel: input: Power Button as /devices/LNXSYSTM:00/LNXSYBUS:00/PNP0C0C:00/input/input1
avril 07 07:36:43 guigui-ordi kernel: ACPI: Power Button [PWRB]
avril 07 07:36:43 guigui-ordi kernel: input: Power Button as /devices/LNXSYSTM:00/LNXPWRBN:00/input/input2
avril 07 07:36:43 guigui-ordi kernel: ACPI: Power Button [PWRF]
avril 07 07:36:43 guigui-ordi kernel: wmi: Mapper loaded
avril 07 07:36:44 guigui-ordi kernel: i2c i2c-0: nForce2 SMBus adapter at 0x4d00
avril 07 07:36:44 guigui-ordi kernel: ACPI Warning: SystemIO range 0x0000000000004e00-0x0000000000004e3f conflicts with OpRegion 0x0000000000004e00-0x0000000000004e3f (\_SB_.PCI0.SM00) (20140926/utaddress-258)
avril 07 07:36:44 guigui-ordi kernel: ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
avril 07 07:36:44 guigui-ordi kernel: forcedeth: Reverse Engineered nForce ethernet driver. Version 0.64.
avril 07 07:36:44 guigui-ordi kernel: ACPI: PCI Interrupt Link [LMAC] enabled at IRQ 21

...

avril 07 07:46:10 guigui-ordi kernel: perf interrupt took too long (2511 > 2495), lowering kernel.perf_event_max_sample_rate to 50100
avril 07 07:51:47 guigui-ordi systemd[1]: Starting Cleanup of Temporary Directories...
avril 07 07:51:47 guigui-ordi systemd[1]: Started Cleanup of Temporary Directories.
avril 07 07:56:54 guigui-ordi kernel: perf interrupt took too long (5056 > 4960), lowering kernel.perf_event_max_sample_rate to 25200
-- Reboot --
vous avez des idées?...
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

Re: [crashs] plantages aléatoires

Message par Le Limule »

j'ai mieux cerné mon pb:

ça plante souvent entre 3 et 50mn après la mise en route du PC, et s'il était éteint depuis plusieurs heures. une fois que ça a planté (puis que j'ai redémarré, donc), ou une fois qu'une cinquantaine de minutes est passée, ça ne plante plus.
ça plante que je sois en session graphique ou non (donc même sans xorg). par contre j'ai attendu ds le BIOS et ça n'a jamais planté là.
Avatar de l’utilisateur
Xorg
Maître du Kyudo
Messages : 1933
Inscription : dim. 22 janv. 2012, 19:25
Localisation : Entre le clavier et la chaise.

Re: [crashs] plantages aléatoires

Message par Xorg »

Pour les perf interrupt, ça serait juste à titre informatif si j'en crois ce topic (le reste, c'est mineur, ça arrive et ça ne cause pas de problème).

Je t'aurais bien proposé de vérifier les températures et tensions avec Lm-sensors, mais si le problème se produit jamais avec 50mn, je ne sais pas trop quoi dire.
Après, la théorie d'un problème matériel n'est pas à écarter.
Arch Linux x86_64 - Sway
AMD Ryzen 5 3600X - 32 Go de DDR4 - SSD NVMe 1 To + SSD SATA 250 Go - Sapphire NITRO+ Radeon RX 580
Image AUR___Image Wiki___Image GitHub
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

Re: [crashs] plantages aléatoires

Message par Le Limule »

mise à jour: j'ai remarqué depuis la dernière fois que ça pouvait aussi planter qd j'attends dans le BIOS. ça ne semble donc pas un pb linux.
Avatar de l’utilisateur
Xorg
Maître du Kyudo
Messages : 1933
Inscription : dim. 22 janv. 2012, 19:25
Localisation : Entre le clavier et la chaise.

Re: [crashs] plantages aléatoires

Message par Xorg »

Si ça plante dans le BIOS, c'est un problème matériel. Ça peut être tout à ce stade (CPU, CG, RAM, CM, PSU). Bonne chance. :chinois:
Moi, par exemple, j'avais des freezes sévères aussi ces derniers temps. Quand j'ai commencé à avoir des artifacts, j'ai su que c'était la CG. Je tourne sur mon iGPU depuis, et j'ai plus de soucis. :?
Arch Linux x86_64 - Sway
AMD Ryzen 5 3600X - 32 Go de DDR4 - SSD NVMe 1 To + SSD SATA 250 Go - Sapphire NITRO+ Radeon RX 580
Image AUR___Image Wiki___Image GitHub
Le Limule
Hankyu
Messages : 35
Inscription : jeu. 02 août 2012, 20:42

Re: [crashs] plantages aléatoires

Message par Le Limule »

je n'avais pas pensé conclure ce sujet: c'était un pb d'alim.

un jour le PC n'a même plus voulu démarrer.
j'ai changé l'alim, et tous mes pbs ont disparu.
Répondre