[stockage] SSD d'un an plein d'erreurs
[stockage] SSD d'un an plein d'erreurs
Bonjour !
J'ai depuis plusieurs mois un serveur HP MicroServer qui me sert de NAS, de station de téléchargement, etc. Depuis quelques semaines je ne l'allume plus que lorsque j'en ai besoin, et l'éteins le reste du temps. Je lui fais donc faire bien plus de cycles d'allumage/extinction qu'auparavant.
Depuis son dernier allumage il m'est impossible de le ping. En y retranchant un écran je découvre qu'il se plaint d'un problème sur un des supports de stockage (1 SSD et 3 disques durs) et qu'il réclame le lancement d'un fsck manuel.
Problème : le clavier, qui fonctionne sur le BIOS et sur grub ne fonctionne pas face avec l'invite de commande.
Que faire ?
J'ai depuis plusieurs mois un serveur HP MicroServer qui me sert de NAS, de station de téléchargement, etc. Depuis quelques semaines je ne l'allume plus que lorsque j'en ai besoin, et l'éteins le reste du temps. Je lui fais donc faire bien plus de cycles d'allumage/extinction qu'auparavant.
Depuis son dernier allumage il m'est impossible de le ping. En y retranchant un écran je découvre qu'il se plaint d'un problème sur un des supports de stockage (1 SSD et 3 disques durs) et qu'il réclame le lancement d'un fsck manuel.
Problème : le clavier, qui fonctionne sur le BIOS et sur grub ne fonctionne pas face avec l'invite de commande.
Que faire ?
Dernière modification par romano2k le mar. 29 oct. 2013, 18:12, modifié 1 fois.
- benjarobin
- Maître du Kyudo
- Messages : 17247
- Inscription : sam. 30 mai 2009, 15:48
- Localisation : Lyon
Re: [boot] fsck réclamé mais clavier non reconnu
LiveCd ?
Zsh | KDE | PC fixe : core i7, carte nvidia
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
Re: [boot] fsck réclamé mais clavier non reconnu
Lancer le fsck depuis un Live USB ? L'UUID sera le même ?
-
- Maître du Kyudo
- Messages : 1855
- Inscription : mer. 06 janv. 2010, 13:51
- Localisation : Ried - Alsace - France
Re: [boot] fsck réclamé mais clavier non reconnu
C'est un clavier usb ? Il te faut le hook keyboard dans ce cas.
Mais ça se sera après, pour l'instant il te faut effectivement un Live-CD. Et l'UUID dépend de la partition et est attribué au formatage, il ne changera pas si tu passes par un Live-CD.
Mais ça se sera après, pour l'instant il te faut effectivement un Live-CD. Et l'UUID dépend de la partition et est attribué au formatage, il ne changera pas si tu passes par un Live-CD.
La majorité des bugs se situe entre la chaise et le clavier...
Arrêtez de vous prendre la tête avec les partitions... passez au LVM
Arrêtez de vous prendre la tête avec les partitions... passez au LVM
Re: [boot] fsck réclamé mais clavier non reconnu
Est-ce que je peux ajouter le hook keyboard à mon initramfs depuis grub? Puisque je ne peux pas démarrer mon système pour le moment.
Autrement c'est noté pour l'UUID, je suis en train de créer un Live USB.
Merci !
Autrement c'est noté pour l'UUID, je suis en train de créer un Live USB.
Merci !
-
- Maître du Kyudo
- Messages : 1855
- Inscription : mer. 06 janv. 2010, 13:51
- Localisation : Ried - Alsace - France
Re: [boot] fsck réclamé mais clavier non reconnu
Non tu ne peux pas ajouter de hook, car c'est du code qui est ajouté à l'initramfs lors de sa construction. Tout ce que tu peux faire c'est désactiver un hook qui tu avais inclus.
La majorité des bugs se situe entre la chaise et le clavier...
Arrêtez de vous prendre la tête avec les partitions... passez au LVM
Arrêtez de vous prendre la tête avec les partitions... passez au LVM
Re: [boot] fsck réclamé mais clavier non reconnu
Ok donc je vais devoir passer par un Live USB. Je m'en occupe un peu plus tard, je vous tiens informés, merci !
- Xorg
- Maître du Kyudo
- Messages : 1933
- Inscription : dim. 22 janv. 2012, 19:25
- Localisation : Entre le clavier et la chaise.
Re: [boot] fsck réclamé mais clavier non reconnu
Ou sinon avec l'initramfs fallback, mais je n'y crois pas du tout.
Personnellement, quand j'ai ce genre de message là, en général, c'est que le disque dur concerné n'est plus si jeune que ça (si tu vois où je veux en venir). Si tu en as l'envie, tu pourras jeter un coup d’œil à l'état SMART de chacun de tes disques durs et voir s'ils vont bien (ou s'ils risquent de lâcher). Car il vaut mieux prévenir que guérir, et guérir un disque dur, c'est...
Personnellement, quand j'ai ce genre de message là, en général, c'est que le disque dur concerné n'est plus si jeune que ça (si tu vois où je veux en venir). Si tu en as l'envie, tu pourras jeter un coup d’œil à l'état SMART de chacun de tes disques durs et voir s'ils vont bien (ou s'ils risquent de lâcher). Car il vaut mieux prévenir que guérir, et guérir un disque dur, c'est...
Re: [boot] fsck réclamé mais clavier non reconnu
Je n'ai finalement pas eu le temps de m'en occuper aujourd'hui, mais je le fais demain à la première heure !
L'hypothèse la plus probable est que je n'ai pas pris les précautions nécessaires avec mon SSD et qu'il est déjà en très mauvaise santé, un an après son installation. J'espère tout de même pouvoir sauvegarder les fichiers qui vont bien pour pouvoir restaurer facilement mon RAID 5 sur un futur remplaçant.
Je vous tiens informé !
L'hypothèse la plus probable est que je n'ai pas pris les précautions nécessaires avec mon SSD et qu'il est déjà en très mauvaise santé, un an après son installation. J'espère tout de même pouvoir sauvegarder les fichiers qui vont bien pour pouvoir restaurer facilement mon RAID 5 sur un futur remplaçant.
Je vous tiens informé !
Re: [stockage] SSD d'un an plein d'erreurs
J'ai donc démarré un Live USB pour creuser un peu la question, avec l'aide des membres du salon IRC.
On a eu la bonne idée de me suggérer de contrôler le SMART du SSD. Tout semble normal si ce n'est le "Wear_Leveling_Count" qui est à 127, je ne sais pas vraiment ce que je dois comprendre. Dans un second temps j'ai extrait le SSD et l'ai branché à un ordinateur Windows à l'aide d'un adaptateur Serial ATA/USB. CrystalDiskInfo estime pour sa part que le SSD est en bonne santé.
J'ai fini par lancer fsck et par accepter toutes les "réparations" qu'il m'a proposé, ce qui n'a pris que quelques secondes. Mais au redémarrage, au moment où j'aurais dû avoir le menu de sélection (syslinux ?), je n'avais plus qu'un curseur clignotant.
Je n'ai pris aucune mesure particulière concernant ce SSD, je n'ai pas appliqué de configuration particulière type TRIM. J'ai appris entre temps qu'un paramètre "discard" dans le fstab permettait de limiter son usure, mais je n'avais rien fait de tout ça.
Pour autant, à part le système donc les mises à jour de paquets et les logs (ce qui représente peut-être beaucoup ?), ce SSD n'hébergeait pas grand chose. Mon /home et tous mes autres fichiers sont sur un RAID 5 de disques durs.
Dois-je comprendre que mon SSD est déjà mort ? Ou est-ce un bug passager et je peux le reformater et réinstaller un système et me relancer sans inquiétude ? Peut-être puis-je même essayer de ne réinstaller que syslinux ?
On a eu la bonne idée de me suggérer de contrôler le SMART du SSD. Tout semble normal si ce n'est le "Wear_Leveling_Count" qui est à 127, je ne sais pas vraiment ce que je dois comprendre. Dans un second temps j'ai extrait le SSD et l'ai branché à un ordinateur Windows à l'aide d'un adaptateur Serial ATA/USB. CrystalDiskInfo estime pour sa part que le SSD est en bonne santé.
J'ai fini par lancer fsck et par accepter toutes les "réparations" qu'il m'a proposé, ce qui n'a pris que quelques secondes. Mais au redémarrage, au moment où j'aurais dû avoir le menu de sélection (syslinux ?), je n'avais plus qu'un curseur clignotant.
Je n'ai pris aucune mesure particulière concernant ce SSD, je n'ai pas appliqué de configuration particulière type TRIM. J'ai appris entre temps qu'un paramètre "discard" dans le fstab permettait de limiter son usure, mais je n'avais rien fait de tout ça.
Pour autant, à part le système donc les mises à jour de paquets et les logs (ce qui représente peut-être beaucoup ?), ce SSD n'hébergeait pas grand chose. Mon /home et tous mes autres fichiers sont sur un RAID 5 de disques durs.
Dois-je comprendre que mon SSD est déjà mort ? Ou est-ce un bug passager et je peux le reformater et réinstaller un système et me relancer sans inquiétude ? Peut-être puis-je même essayer de ne réinstaller que syslinux ?
- Xorg
- Maître du Kyudo
- Messages : 1933
- Inscription : dim. 22 janv. 2012, 19:25
- Localisation : Entre le clavier et la chaise.
Re: [stockage] SSD d'un an plein d'erreurs
Si le SMART est bon, c'est que ça devrait être bon, non ?
Dis-moi, vu que tu as effectué des "réparations", peut-être que des secteurs où Syslinux se trouve ont été affectés, non ? Tu peux peut-être essayer de simplement réinstaller Syslinux dans ton MBR.
PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commande
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
Dis-moi, vu que tu as effectué des "réparations", peut-être que des secteurs où Syslinux se trouve ont été affectés, non ? Tu peux peut-être essayer de simplement réinstaller Syslinux dans ton MBR.
PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commande
setterm -dump 1 -file screen.dump
.-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
Re: [stockage] SSD d'un an plein d'erreurs
J'ai jamais consulté les données SMART sur un SSD, mais certaines valeurs sont tout de même assez élevées (je pense surtout au 170 et 173). J'ignore ce que cela signifie.
Re: [stockage] SSD d'un an plein d'erreurs
Un super merci!!! Je ne connaissait pas du tout...Xorg a écrit :PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commandesetterm -dump 1 -file screen.dump
.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
Gile Dey
- Xorg
- Maître du Kyudo
- Messages : 1933
- Inscription : dim. 22 janv. 2012, 19:25
- Localisation : Entre le clavier et la chaise.
Re: [stockage] SSD d'un an plein d'erreurs
Je n'ai fait que pomper sur le Wiki ici...gile a écrit :Un super merci!!! Je ne connaissait pas du tout...Xorg a écrit :PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commandesetterm -dump 1 -file screen.dump
.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
Re: [stockage] SSD d'un an plein d'erreurs
Pour je ne sais quelle raison je n'ai pas reçu ou pas vu l'email de notification de réponse et ça m'est sorti de l'esprit, merci pour vos réponses et pardon pour le délai !
Mais comment réinstaller syslinux sur un autre support de stockage que celui courant ? Je suppose qu'il faut ajouter un paramètre à "syslinux-install_update -iam" mais je ne trouve pas le man sur Internet.
J'y ai songé mais ta suggestion me conforte, je vais essayer, ce ne sera pas perdu de toute manière ! Mais pourquoi mon système s'est mis à ne plus démarrer un beau jour ? Ne vaut-il pas mieux me procurer un support de stockage neuf ?Xorg a écrit :Si le SMART est bon, c'est que ça devrait être bon, non ?
Dis-moi, vu que tu as effectué des "réparations", peut-être que des secteurs où Syslinux se trouve ont été affectés, non ? Tu peux peut-être essayer de simplement réinstaller Syslinux dans ton MBR.
Mais comment réinstaller syslinux sur un autre support de stockage que celui courant ? Je suppose qu'il faut ajouter un paramètre à "syslinux-install_update -iam" mais je ne trouve pas le man sur Internet.
Je vais essayer de consulter des connaisseurs sur le forum de Crucial ou sur un forum généraliste hardware.Ypnose a écrit :J'ai jamais consulté les données SMART sur un SSD, mais certaines valeurs sont tout de même assez élevées (je pense surtout au 170 et 173). J'ignore ce que cela signifie.
Je ne connaissais pas, merci ! Ce sera plus pratique au format texte la prochaine fois, c'est sûr !Xorg a écrit :PS : Vu que tu as l'air de beaucoup t'amuser pour prendre des screenshots de ta console, tu peux essayer la commandesetterm -dump 1 -file screen.dump
.
-dump 1 c'est la console dont tu veux le "screenshot", autrement dit tty1 là. Adapte si besoin.
-file screen.dump c'est le nom que tu donnes au fichier de sortie.
Re: [stockage] SSD d'un an plein d'erreurs
Bonsoir !
Je déterre mon propre topic car j'ai à nouveau rencontré ce problème.
Il s'est de nouveau manifesté après un "pacman -Syu" effectué longtemps après le précédent. Comme la mise à jour comprenait un nouveau kernel, j'ai redémarré en utilisant la commande "reboot".
Mais alors qu'habituellement je peux accéder à nouveau à la machine après 1 ou 2 minutes seulement, elle n'avait toujours pas réclamé d'adresse IP à mon serveur DHCP. Comme il s'agit d'un serveur auquel aucun écran n'est relié, je n'ai eu d'autre choix que d'en forcer l'arrêt (pression longue sur le bouton), et de le redémarrer une fois rebranché sur mon bureau. Comme la fois précédente j'ai découvert fsck qui réclamait une vérification.
Le clavier n'étant pas pris en charge dans cet environnement rescue (il faudra que je règle ce point), j'ai re-redémarré sur le live USB d'Archlinux, exécuté fsck, accepté la réparation d'une centaine d'erreurs, réinstallé syslinux et redémarré avec succès. Rien à signaler depuis, j'ai même pu le redémarrer plusieurs fois.
Quelqu'un a-t-il une idée de ce qu'il peut se passer ? De comment diagnostiquer ? Et de ce que je devrais faire ? Car moi je sèche totalement !
Je déterre mon propre topic car j'ai à nouveau rencontré ce problème.
Il s'est de nouveau manifesté après un "pacman -Syu" effectué longtemps après le précédent. Comme la mise à jour comprenait un nouveau kernel, j'ai redémarré en utilisant la commande "reboot".
Mais alors qu'habituellement je peux accéder à nouveau à la machine après 1 ou 2 minutes seulement, elle n'avait toujours pas réclamé d'adresse IP à mon serveur DHCP. Comme il s'agit d'un serveur auquel aucun écran n'est relié, je n'ai eu d'autre choix que d'en forcer l'arrêt (pression longue sur le bouton), et de le redémarrer une fois rebranché sur mon bureau. Comme la fois précédente j'ai découvert fsck qui réclamait une vérification.
Le clavier n'étant pas pris en charge dans cet environnement rescue (il faudra que je règle ce point), j'ai re-redémarré sur le live USB d'Archlinux, exécuté fsck, accepté la réparation d'une centaine d'erreurs, réinstallé syslinux et redémarré avec succès. Rien à signaler depuis, j'ai même pu le redémarrer plusieurs fois.
Quelqu'un a-t-il une idée de ce qu'il peut se passer ? De comment diagnostiquer ? Et de ce que je devrais faire ? Car moi je sèche totalement !
Re: [stockage] SSD d'un an plein d'erreurs
Combien de temps après ? Tout de même pas cinq mois et demi, non ?romano2k a écrit :après un "pacman -Syu" effectué longtemps après le précédent