[stockage] SSD d'un an plein d'erreurs

Questions et astuces concernant l'installation et la configuration d'archlinux
Répondre
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

[stockage] SSD d'un an plein d'erreurs

Message par romano2k »

Bonjour !

J'ai depuis plusieurs mois un serveur HP MicroServer qui me sert de NAS, de station de téléchargement, etc. Depuis quelques semaines je ne l'allume plus que lorsque j'en ai besoin, et l'éteins le reste du temps. Je lui fais donc faire bien plus de cycles d'allumage/extinction qu'auparavant.

Depuis son dernier allumage il m'est impossible de le ping. En y retranchant un écran je découvre qu'il se plaint d'un problème sur un des supports de stockage (1 SSD et 3 disques durs) et qu'il réclame le lancement d'un fsck manuel.

Image

Problème : le clavier, qui fonctionne sur le BIOS et sur grub ne fonctionne pas face avec l'invite de commande.

Que faire ? :-)
Dernière modification par romano2k le mar. 29 oct. 2013, 18:12, modifié 1 fois.
Avatar de l’utilisateur
benjarobin
Maître du Kyudo
Messages : 17247
Inscription : sam. 30 mai 2009, 15:48
Localisation : Lyon

Re: [boot] fsck réclamé mais clavier non reconnu

Message par benjarobin »

LiveCd ?
Zsh | KDE | PC fixe : core i7, carte nvidia
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [boot] fsck réclamé mais clavier non reconnu

Message par romano2k »

Lancer le fsck depuis un Live USB ? L'UUID sera le même ?
oktoberfest
Maître du Kyudo
Messages : 1855
Inscription : mer. 06 janv. 2010, 13:51
Localisation : Ried - Alsace - France

Re: [boot] fsck réclamé mais clavier non reconnu

Message par oktoberfest »

C'est un clavier usb ? Il te faut le hook keyboard dans ce cas.

Mais ça se sera après, pour l'instant il te faut effectivement un Live-CD. Et l'UUID dépend de la partition et est attribué au formatage, il ne changera pas si tu passes par un Live-CD.
La majorité des bugs se situe entre la chaise et le clavier...
Arrêtez de vous prendre la tête avec les partitions... passez au LVM
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [boot] fsck réclamé mais clavier non reconnu

Message par romano2k »

Est-ce que je peux ajouter le hook keyboard à mon initramfs depuis grub? Puisque je ne peux pas démarrer mon système pour le moment.

Autrement c'est noté pour l'UUID, je suis en train de créer un Live USB.

Merci !
oktoberfest
Maître du Kyudo
Messages : 1855
Inscription : mer. 06 janv. 2010, 13:51
Localisation : Ried - Alsace - France

Re: [boot] fsck réclamé mais clavier non reconnu

Message par oktoberfest »

Non tu ne peux pas ajouter de hook, car c'est du code qui est ajouté à l'initramfs lors de sa construction. Tout ce que tu peux faire c'est désactiver un hook qui tu avais inclus.
La majorité des bugs se situe entre la chaise et le clavier...
Arrêtez de vous prendre la tête avec les partitions... passez au LVM
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [boot] fsck réclamé mais clavier non reconnu

Message par romano2k »

Ok donc je vais devoir passer par un Live USB. Je m'en occupe un peu plus tard, je vous tiens informés, merci !
Avatar de l’utilisateur
Xorg
Maître du Kyudo
Messages : 1933
Inscription : dim. 22 janv. 2012, 19:25
Localisation : Entre le clavier et la chaise.

Re: [boot] fsck réclamé mais clavier non reconnu

Message par Xorg »

Ou sinon avec l'initramfs fallback, mais je n'y crois pas du tout. :mrgreen:
Personnellement, quand j'ai ce genre de message là, en général, c'est que le disque dur concerné n'est plus si jeune que ça (si tu vois où je veux en venir). Si tu en as l'envie, tu pourras jeter un coup d’œil à l'état SMART de chacun de tes disques durs et voir s'ils vont bien (ou s'ils risquent de lâcher). Car il vaut mieux prévenir que guérir, et guérir un disque dur, c'est... :P
Arch Linux x86_64 - Sway
AMD Ryzen 5 3600X - 32 Go de DDR4 - SSD NVMe 1 To + SSD SATA 250 Go - Sapphire NITRO+ Radeon RX 580
Image AUR___Image Wiki___Image GitHub
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [boot] fsck réclamé mais clavier non reconnu

Message par romano2k »

Je n'ai finalement pas eu le temps de m'en occuper aujourd'hui, mais je le fais demain à la première heure !

L'hypothèse la plus probable est que je n'ai pas pris les précautions nécessaires avec mon SSD et qu'il est déjà en très mauvaise santé, un an après son installation. J'espère tout de même pouvoir sauvegarder les fichiers qui vont bien pour pouvoir restaurer facilement mon RAID 5 sur un futur remplaçant.

Je vous tiens informé ! :-)
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [stockage] SSD d'un an plein d'erreurs

Message par romano2k »

J'ai donc démarré un Live USB pour creuser un peu la question, avec l'aide des membres du salon IRC.

On a eu la bonne idée de me suggérer de contrôler le SMART du SSD. Tout semble normal si ce n'est le "Wear_Leveling_Count" qui est à 127, je ne sais pas vraiment ce que je dois comprendre. Dans un second temps j'ai extrait le SSD et l'ai branché à un ordinateur Windows à l'aide d'un adaptateur Serial ATA/USB. CrystalDiskInfo estime pour sa part que le SSD est en bonne santé.

Image
Image

J'ai fini par lancer fsck et par accepter toutes les "réparations" qu'il m'a proposé, ce qui n'a pris que quelques secondes. Mais au redémarrage, au moment où j'aurais dû avoir le menu de sélection (syslinux ?), je n'avais plus qu'un curseur clignotant.

Image

Je n'ai pris aucune mesure particulière concernant ce SSD, je n'ai pas appliqué de configuration particulière type TRIM. J'ai appris entre temps qu'un paramètre "discard" dans le fstab permettait de limiter son usure, mais je n'avais rien fait de tout ça.

Pour autant, à part le système donc les mises à jour de paquets et les logs (ce qui représente peut-être beaucoup ?), ce SSD n'hébergeait pas grand chose. Mon /home et tous mes autres fichiers sont sur un RAID 5 de disques durs.

Dois-je comprendre que mon SSD est déjà mort ? Ou est-ce un bug passager et je peux le reformater et réinstaller un système et me relancer sans inquiétude ? Peut-être puis-je même essayer de ne réinstaller que syslinux ?
Avatar de l’utilisateur
Xorg
Maître du Kyudo
Messages : 1933
Inscription : dim. 22 janv. 2012, 19:25
Localisation : Entre le clavier et la chaise.

Re: [stockage] SSD d'un an plein d'erreurs

Message par Xorg »

Si le SMART est bon, c'est que ça devrait être bon, non ? :?

Dis-moi, vu que tu as effectué des "réparations", peut-être que des secteurs où Syslinux se trouve ont été affectés, non ? Tu peux peut-être essayer de simplement réinstaller Syslinux dans ton MBR. :)

PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commande setterm -dump 1 -file screen.dump.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
:D
Arch Linux x86_64 - Sway
AMD Ryzen 5 3600X - 32 Go de DDR4 - SSD NVMe 1 To + SSD SATA 250 Go - Sapphire NITRO+ Radeon RX 580
Image AUR___Image Wiki___Image GitHub
Avatar de l’utilisateur
Ypnose
Maître du Kyudo
Messages : 1363
Inscription : sam. 01 mai 2010, 13:17

Re: [stockage] SSD d'un an plein d'erreurs

Message par Ypnose »

J'ai jamais consulté les données SMART sur un SSD, mais certaines valeurs sont tout de même assez élevées (je pense surtout au 170 et 173). J'ignore ce que cela signifie.
gile
Daikyu
Messages : 80
Inscription : sam. 06 avr. 2013, 13:31
Localisation : Fribourg (Suisse)

Re: [stockage] SSD d'un an plein d'erreurs

Message par gile »

Xorg a écrit :PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commande setterm -dump 1 -file screen.dump.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
:D
Un super merci!!! Je ne connaissait pas du tout...
Gile Dey
Avatar de l’utilisateur
Xorg
Maître du Kyudo
Messages : 1933
Inscription : dim. 22 janv. 2012, 19:25
Localisation : Entre le clavier et la chaise.

Re: [stockage] SSD d'un an plein d'erreurs

Message par Xorg »

gile a écrit :
Xorg a écrit :PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commande setterm -dump 1 -file screen.dump.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
:D
Un super merci!!! Je ne connaissait pas du tout...
Je n'ai fait que pomper sur le Wiki ici... :copain:
Arch Linux x86_64 - Sway
AMD Ryzen 5 3600X - 32 Go de DDR4 - SSD NVMe 1 To + SSD SATA 250 Go - Sapphire NITRO+ Radeon RX 580
Image AUR___Image Wiki___Image GitHub
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [stockage] SSD d'un an plein d'erreurs

Message par romano2k »

Pour je ne sais quelle raison je n'ai pas reçu ou pas vu l'email de notification de réponse et ça m'est sorti de l'esprit, merci pour vos réponses et pardon pour le délai ! :-)
Xorg a écrit :Si le SMART est bon, c'est que ça devrait être bon, non ? :?

Dis-moi, vu que tu as effectué des "réparations", peut-être que des secteurs où Syslinux se trouve ont été affectés, non ? Tu peux peut-être essayer de simplement réinstaller Syslinux dans ton MBR. :)
J'y ai songé mais ta suggestion me conforte, je vais essayer, ce ne sera pas perdu de toute manière ! Mais pourquoi mon système s'est mis à ne plus démarrer un beau jour ? Ne vaut-il pas mieux me procurer un support de stockage neuf ?

Mais comment réinstaller syslinux sur un autre support de stockage que celui courant ? Je suppose qu'il faut ajouter un paramètre à "syslinux-install_update -iam" mais je ne trouve pas le man sur Internet.
Ypnose a écrit :J'ai jamais consulté les données SMART sur un SSD, mais certaines valeurs sont tout de même assez élevées (je pense surtout au 170 et 173). J'ignore ce que cela signifie.
Je vais essayer de consulter des connaisseurs sur le forum de Crucial ou sur un forum généraliste hardware.
Xorg a écrit :PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commande setterm -dump 1 -file screen.dump.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
:D
Je ne connaissais pas, merci ! Ce sera plus pratique au format texte la prochaine fois, c'est sûr ! ;-)
romano2k
Hankyu
Messages : 25
Inscription : sam. 04 mai 2013, 17:53

Re: [stockage] SSD d'un an plein d'erreurs

Message par romano2k »

Bonsoir !

Je déterre mon propre topic car j'ai à nouveau rencontré ce problème.

Il s'est de nouveau manifesté après un "pacman -Syu" effectué longtemps après le précédent. Comme la mise à jour comprenait un nouveau kernel, j'ai redémarré en utilisant la commande "reboot".

Mais alors qu'habituellement je peux accéder à nouveau à la machine après 1 ou 2 minutes seulement, elle n'avait toujours pas réclamé d'adresse IP à mon serveur DHCP. Comme il s'agit d'un serveur auquel aucun écran n'est relié, je n'ai eu d'autre choix que d'en forcer l'arrêt (pression longue sur le bouton), et de le redémarrer une fois rebranché sur mon bureau. Comme la fois précédente j'ai découvert fsck qui réclamait une vérification.

Le clavier n'étant pas pris en charge dans cet environnement rescue (il faudra que je règle ce point), j'ai re-redémarré sur le live USB d'Archlinux, exécuté fsck, accepté la réparation d'une centaine d'erreurs, réinstallé syslinux et redémarré avec succès. Rien à signaler depuis, j'ai même pu le redémarrer plusieurs fois.

Image

Quelqu'un a-t-il une idée de ce qu'il peut se passer ? De comment diagnostiquer ? Et de ce que je devrais faire ? :-) Car moi je sèche totalement !
Tucnacek
Chu Ko Nu
Messages : 332
Inscription : sam. 28 sept. 2013, 22:40

Re: [stockage] SSD d'un an plein d'erreurs

Message par Tucnacek »

romano2k a écrit :après un "pacman -Syu" effectué longtemps après le précédent
Combien de temps après ? Tout de même pas cinq mois et demi, non ?
Répondre