Page 1 sur 2

[ré-installer] Est-ce utile ?

Publié : ven. 09 nov. 2012, 20:57
par djipey
Bonsoir.

Depuis quelques temps mon Archlinux a quelques ratés. Thunderbird est inlançable, et virtualBox ne marche tout simplement pas (voire les topics sur les forums). J'ai utilisé cette distribution pendant plus de 2 ans sans jamais aucun souci, la trouvant même plus stable que Debian et Ubuntu, que j'ai longuement utilisées. Mon installation sur mon laptop date de 6 mois, et je me demande si ré-installer est la bonne solution. Ça a des fois marché, des fois non.

Votre avis ?

Bien à vous.

Re: [ré-installer] Est-ce utile ?

Publié : ven. 09 nov. 2012, 21:11
par hopimet
Salut,

Peut être qu'en lançant thunderbird et virtualbox en console tu pourrais nous fournir des messages d'erreurs informatifs ?

Re: [ré-installer] Est-ce utile ?

Publié : ven. 09 nov. 2012, 21:25
par djipey
Et c'est bien là tout le problème, c'est la chose que j'ai essayée de faire en premier, pour savoir quoi chercher. Mais quand je lance l'un ou l'autre en console, rien, pas un message d'erreur, à part seulement :

Code : Tout sélectionner

Fontconfig warning: "/etc/fonts/conf.d/50-user.conf", line 9: reading configurations from ~/.fonts.conf is deprecated.
Mais j'ai ça pour n'importe quelle application en gui que je lance.

Après j'ai essayé de fouiller les logs de virtualBox, mais ils sont illisibles, et il n'y a rien de marquant comme "FATAL ERROR". Pour les logs de Thunderbird, je n'en ai pas trouvé à proprement parlé.

Voici les liens des topics sur le forum si tu veux:
http://forums.archlinux.fr/topic12215.html
http://forums.archlinux.fr/topic11763.html

Je sais, c'est démoralisant. Et franchement, ces deux applications sont essentielles.

Re: [ré-installer] Est-ce utile ?

Publié : ven. 09 nov. 2012, 21:33
par hopimet
Déjà pour le warning de fontconfig il y a ça : https://www.archlinux.org/news/fontconf ... -required/

Sinon, tu as peut être une piste ici : https://bugs.archlinux.org/task/32025 et là : http://lists.freedesktop.org/archives/i ... 21327.html

Re: [ré-installer] Est-ce utile ?

Publié : ven. 09 nov. 2012, 22:17
par djipey
Ok, et pour la question de la ré-install, ça peut aider ?

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 00:06
par djipey
Et pour tes pistes, oui la description du bug peut coller. Mon laptop chauffe un peu (~70°C) juste en étant allumé. J'ai fait quelques tests:

- j'ai essayé quelques vieux noyaux, mais aucun n'a résolu un des 2 bugs
- j'ai essayé virtualbox sous ubuntu en live cd, même problème. Par contre thunderbird marche normalement dans ce cas. Donc je pense que le problème de thunderbird est dû à autre chose que le noyau (mais bon ça tombe sous le sens ça). https://bbs.archlinux.org/viewtopic.php ... 3#p1188053 j'ai aussi posté sur le forum anglophone, et une personne souligne le même problème, depuis l'upgrade pour gnome 3.6.

MAIS, je sais qu'un des noyaux depuis septembre m'a permis de faire fonctionner virtualbox normalement. Très exactement, celui qui était en usage le 8 septembre. Mais je ne sais pas comment retrouver la version du noyau avec juste cette date.

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 00:43
par Eikichi
Salut,
MAIS, je sais qu'un des noyaux depuis septembre m'a permis de faire fonctionner virtualbox normalement. Très exactement, celui qui était en usage le 8 septembre. Mais je ne sais pas comment retrouver la version du noyau avec juste cette date.
ici -> http://arm.konnichi.com/2012/09/08/

Sinon y a aussi le linux-lts.

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 10:44
par djipey
Le kernel du 8 septembre était le 3.5.3-1, et en effet, il est un peu mieux. Mon ventilateur tourne moins, j'ai pas l'impression d'être dans une soufflerie. Ça m'a permis d'aller un peu plus dans l'installation d'une ubuntu virtuelle par exemple. Mais dés que ça chauffe un peu trop, dés que je lance un programme en parallèle, ça plante. Du coup je pense vraiment que quelque chose ne va pas au niveau du noyau. J'aimerais bien essayer le lts, mais la dernière fois que j'ai tenté l'expérience, ça freeze dés que j'arrive sur le bureau.

Par contre, j'aimerais savoir s'il est possible d'obtenir les températures de fonctionnement normal de mon laptop, pour voir si mon matériel est complètement pris en charge. C'est un Clevo W270HSQ, avec un Intel(R) Core(TM) i5-2520M CPU @ 2.50GHz.

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 10:54
par benjarobin
Le noyau n'est pas le souci ici, c'est juste ton PC qui n'arrive pas à évacuer la chaleur => Ton radiateur est surement plus totalement en contact avec le processeur...
Ou alors c'est le kernel qui lit une mauvaise température (il lit 100° alors qu'il y a seulement 60°) et ce dernier coupe l'alimentation par sécurité : Voir les logs du kernel.

Si le ventilateur tourne c'est un très bon signe (ou pas différent point de vu), car très souvent le problème est logiciel (le ventilateur ne se déclenche pas). Donc tu as 2 choix :
- Problème matériel assez grave => SAV
- Mauvaise lecture de la température (regarde celle-ci avec différent outil tel que acpi, lm_sensor...)
Par exemple pour moi

Code : Tout sélectionner

$sensors
acpitz-virtual-0
Adapter: Virtual device
temp1:        +43.0°C  (crit = +93.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Core 0:       +36.0°C  (high = +105.0°C, crit = +105.0°C)
Core 1:       +40.0°C  (high = +105.0°C, crit = +105.0°C)

$acpi -t
Thermal 0: ok, 45.0 degrees C

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 11:27
par djipey
Hum...à part une incohérence au niveau d'une sonde, rien de bien méchant. En plus je suis l'évolution de la température en temps réel grâce à conky (une commande comme ça génère la température: cat /sys/devices/platform/coretemp.0/temp1_input).

Mais voici:

Code : Tout sélectionner

djipey-laptop:11:20:12:~$ sensors
acpitz-virtual-0
Adapter: Virtual device
temp1:       -273.2°C  (crit = +149.8°C)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +66.0°C  (high = +86.0°C, crit = +100.0°C)
Core 0:         +66.0°C  (high = +86.0°C, crit = +100.0°C)
Core 1:         +64.0°C  (high = +86.0°C, crit = +100.0°C)

nouveau-pci-0100
Adapter: PCI adapter
temp1:        +58.0°C  (high = +100.0°C, crit = +110.0°C)

Code : Tout sélectionner

djipey-laptop:11:20:05:~$ cat /sys/devices/platform/coretemp.0/temp1_input; cat /sys/devices/platform/coretemp.0/temp2_input 
65000
66000

Code : Tout sélectionner

djipey-laptop:11:21:49:~$ acpi -V
Battery 0: Full, 100%
Battery 0: design capacity 4400 mAh, last full capacity 4183 mAh = 95%
Adapter 0: on-line
Thermal 0: ok, -273.2 degrees C
Thermal 0: trip point 0 switches to mode critical at temperature 149.8 degrees C
Cooling 0: LCD 2 of 7
Cooling 1: Processor 0 of 3
Cooling 2: Processor 0 of 3
Cooling 3: Processor 0 of 3
Cooling 4: Processor 0 of 3
Est-ce que tu vois quelque chose d'anormal ? (à part le zéro absolu d'une sonde ?)

En ce qui concerne les logs du système, j'ai un message qui revient toutes les 10 secondes:

Code : Tout sélectionner

Nov 10 11:36:57 djipey-laptop kernel: [ 2774.886634] ACPI Error: [^^^PEG0.PEGP.DGON] Namespace lookup failure, AE_NOT_FOUND (20120320/psargs-359)
Nov 10 11:36:57 djipey-laptop kernel: [ 2774.886641] ACPI Error: Method parse/execution failed [\_SB_.PCI0.LPCB.EC__.ADJP] (Node ffff880129a4d988), AE_NOT_FOUND (20120320/psparse-536)
Et un autre, que je n'ai eu qu'une seule fois:

Code : Tout sélectionner

Nov 10 11:05:36 djipey-laptop kernel: [  896.153867] ACPI: EC: GPE storm detected, transactions will use polling mode

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 12:48
par benjarobin
Il faudrait regarder la température juste avant que cela crash. Est elle élevé as ce moment là ?
Sinon pour les logs je parlai de quelque chose ne rapport avec la température

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 13:50
par djipey
Elle ne me semble pas élevée (~ 70-75 degrés). Selon les indications de mon conky.

Sinon:

Code : Tout sélectionner

djipey-laptop:13:48:30:~$ cat /var/log/kernel.log | grep "temp"
Nov  4 16:29:40 djipey-laptop kernel: [   22.987525] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PRAMIN
Nov  4 16:29:40 djipey-laptop kernel: [   22.997251] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PROM
Nov  4 16:29:40 djipey-laptop kernel: [   22.997261] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PCIROM
Nov  4 16:29:40 djipey-laptop kernel: [   23.007169] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from ACPI
Nov  4 16:29:55 djipey-laptop kernel: [   38.606742]  [<ffffffffa0492c70>] ? nouveau_temp_probe_i2c+0xf0/0xf0 [nouveau]
Nov  4 16:29:55 djipey-laptop kernel: [   38.608769]  [<ffffffffa0492c60>] nouveau_temp_probe_i2c+0xe0/0xf0 [nouveau]
Nov  4 16:29:55 djipey-laptop kernel: [   38.609443]  [<ffffffffa0492f5d>] nouveau_temp_init+0x2d/0x3d0 [nouveau]
Nov  4 16:31:01 djipey-laptop kernel: [   22.577375] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PRAMIN
Nov  4 16:31:01 djipey-laptop kernel: [   22.587109] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PROM
Nov  4 16:31:01 djipey-laptop kernel: [   22.587118] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PCIROM
Nov  4 16:31:01 djipey-laptop kernel: [   22.597030] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from ACPI
Nov  4 16:31:16 djipey-laptop kernel: [   37.567059]  [<ffffffffa049ec70>] ? nouveau_temp_probe_i2c+0xf0/0xf0 [nouveau]
Nov  4 16:31:16 djipey-laptop kernel: [   37.567087]  [<ffffffffa049ec60>] nouveau_temp_probe_i2c+0xe0/0xf0 [nouveau]
Nov  4 16:31:16 djipey-laptop kernel: [   37.567096]  [<ffffffffa049ef5d>] nouveau_temp_init+0x2d/0x3d0 [nouveau]
Nov  4 16:55:09 djipey-laptop kernel: [   23.312726] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PRAMIN
Nov  4 16:55:09 djipey-laptop kernel: [   23.322437] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PROM
Nov  4 16:55:09 djipey-laptop kernel: [   23.322447] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from PCIROM
Nov  4 16:55:09 djipey-laptop kernel: [   23.332359] [drm] nouveau 0000:01:00.0: Attempting to load BIOS image from ACPI
Nov  4 16:55:28 djipey-laptop kernel: [   42.541460]  [<ffffffffa04cdc70>] ? nouveau_temp_probe_i2c+0xf0/0xf0 [nouveau]
Nov  4 16:55:28 djipey-laptop kernel: [   42.543487]  [<ffffffffa04cdc60>] nouveau_temp_probe_i2c+0xe0/0xf0 [nouveau]
Nov  4 16:55:28 djipey-laptop kernel: [   42.544159]  [<ffffffffa04cdf5d>] nouveau_temp_init+0x2d/0x3d0 [nouveau]
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.622743] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.622744] CPU2: Core temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.622747] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.622750] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.622776] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.622778] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.623772] CPU0: Core temperature/speed normal
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.623773] CPU2: Core temperature/speed normal
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.623774] CPU1: Package temperature/speed normal
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.623775] CPU3: Package temperature/speed normal
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.623776] CPU2: Package temperature/speed normal
Nov  6 18:16:20 djipey-laptop kernel: [ 1965.623780] CPU0: Package temperature/speed normal
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.807709] CPU3: Core temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.807711] CPU2: Package temperature above threshold, cpu clock throttled (total events = 4)
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.807712] CPU1: Core temperature above threshold, cpu clock throttled (total events = 1)
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.807713] CPU0: Package temperature above threshold, cpu clock throttled (total events = 4)
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.807716] CPU1: Package temperature above threshold, cpu clock throttled (total events = 4)
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.807721] CPU3: Package temperature above threshold, cpu clock throttled (total events = 4)
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.809716] CPU1: Core temperature/speed normal
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.809717] CPU3: Core temperature/speed normal
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.809719] CPU0: Package temperature/speed normal
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.809720] CPU2: Package temperature/speed normal
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.809721] CPU3: Package temperature/speed normal
Nov  6 18:22:39 djipey-laptop kernel: [ 2344.809726] CPU1: Package temperature/speed normal
Mais rien pour aujourd'hui si je grep sur "temp"

Re: [ré-installer] Est-ce utile ?

Publié : sam. 10 nov. 2012, 20:05
par GuilouV
Un rapport ou pas avec ton bug, j'ai eu des extinctions intempestives de mon pc depuis le passage au noyau 3.6.3 malgré des températures de cpu normales (http://forums.archlinux.fr/topic12158-20.html).
Ma "solution" pour le moment est de désactiver le chargement des modules acpi_cpufreq et mperf. Depuis plus de plantage.

Re: [ré-installer] Est-ce utile ?

Publié : dim. 11 nov. 2012, 12:58
par djipey
Vous en voulez une bonne ? Virtualbox marche maintenant. Grâce (je pense) au script powerdown. J'ai débranché mon pc quelques minutes pour bouger dans mon appart, du coup le script s'active quand je suis sur batterie. J'ai fait quelques tests avec/sans powerdown, et une fois que je lance une des commandes powerdown/powerup, ça résout mon problème, je ne reboote pas quand je me sers d'une machine virtuelle. Je ne sais pas exactement ce que ce script fait, mais c'est utile.

Bon j'ai toujours mon problème avec thunderbird, mais j'ai au moins plus celui la.

Re: [ré-installer] Est-ce utile ?

Publié : dim. 11 nov. 2012, 16:33
par L_Indien
Au vu des températures, 70-75°C au repos. Je trouve ça plutôt elevé... Un nettoyage complet et -si tu es bien motivé- changement de la pate thermique ne serait pas un mal... Car si ton proc à 70-75°C, je serai curieux de connaitre la t° de ta CG...

Re: [ré-installer] Est-ce utile ?

Publié : dim. 11 nov. 2012, 17:10
par djipey
Mon laptop est neuf, et pour la carte graphique, j'ai un chipset intel hd 3000 et une nvidia, le tout géré par bumblebee. Mais je me sers jamais de la carte nvidia.

Re: [ré-installer] Est-ce utile ?

Publié : dim. 11 nov. 2012, 18:45
par Ypnose
75°C au repos est bien élevé (certainement trop).

Re: [ré-installer] Est-ce utile ?

Publié : dim. 11 nov. 2012, 18:50
par djipey
M*rde...Du coup il faut que je démonte et que je nettoie ?

EDIT:

Vous aviez raison, j'ai démonté, enlevé 2-3 peluches, j'ai perdu au moins 10°C. Je pensais pas que c'était à ce point.

Re: [ré-installer] Est-ce utile ?

Publié : sam. 17 nov. 2012, 00:09
par djipey
Ok j'ai démonté et tout et tout, mais j'ai oublié de vous dire que ça ne résout pas le problème. Par contre, la ligne :

opt /proc/sys/kernel/nmi_watchdog 0

du script powerdown, elle, résout mon problème. Le script powerup n'inverse pas ce que cette ligne fait. opt est juste une fonction du script pour écrire une valeur dans un fichier. La valeur par défaut du fichier /proc/sys/kernel/nmi_watchdog est 1. En la réglant à 0, ça résout mon problème. Pour de vrai, j'ai fait le test plusieurs fois et c'est reproductible. Voir ici : https://bbs.archlinux.org/viewtopic.php ... 9#p1194159, c'est le thread du script powerdown, j'y ai posté en dernier une description détaillée.

Par contre je ne suis pas sûr de comprendre l'explication en anglais qu'ils vont me donner. Qu'est ce que nmi_watchdog, simplement ?

Re: [ré-installer] Est-ce utile ?

Publié : dim. 18 nov. 2012, 20:57
par silmaa
djipey, tu as une NVidia gérée par bumblebee ? Vérifie bien la conf de bbswitch alors. En particulier, que donne

Code : Tout sélectionner

cat /proc/acpi/bbswitch  
?

Edit : pour répondre à ta première question, je pense que l'idéal c'est plutôt d'essayer de résoudre tes problèmes... C'est généralement pas grand-chose (même si c'est ch***t), et se taper une ré-install complète, c'est lourd.