[réseau] eth0 flapping à mort (résolu)
Publié : jeu. 24 nov. 2011, 00:26
Bonjour les loutres,
je vais commencer l'histoire par un truc qui n'a peut être rien à voir mais sait-on jamais!
Ma machine principal est toujours allumé et accessible en ssh depuis mon boulot.
Je m'y connecte régulièrement pour lancer un petit yaourt -Syu des familles.
La machine est up depuis plusieurs jours (faudrait que je scrute les logs pour déterminer si besoin) et lundi, mardi, par de soucis particulier.
Aujourd'hui, c'est la merde: problème d'écriture dans /tmp, monté en RO, blablabla...
Chelou !!!
Je lance un touch /tmp/macouille et en effet, c'est la merde.
Je teste dans mon home (partition séparé), idem.
Comme un nigaud, je reboot. Erreur
Ce soir, de retour chez moi, je constate qu'au reboot la machine n'a pas put monter ma partion /dev/sda3 (mon /).
Évidemment, le busybox disponible ne me fournis pas de fsck.
Un reboot sur un ctkarch plus tart, le fsck.ext4 me parle d'une feature "FEATURE_I15".
e2fsck me dit qu'il y trop vieux pour certaines feature du fs, blablabla...
Un coup de debugfs pour retirer cette feature et fsck est enfin d'accord pour le faire.
Évidemment, c'est la cata, le bordel, la misère. Bref, pleins d'erreurs (mais corrigé).
Reboot sur ma arch à moi, fsck des autres fs et me revoilà sur mon bureau.
Plus de peur que de mal mais va falloir que je creuse l'affaire.
Nous voilà maintenant à mon soucis du moment: le link sur ma connexion est très très versatile.
ping de l'ip d'eth0 ok mais ping de la passerelle KO.
une boucle de mii-tool eth0 avec un sleep à 0.1 me montre ceci: environ 0,8s de up puis environ 1,5s de down, en boucle.
lspci m'indique une carte realtek RTL8111/8168B (rev 03).
lsmod m'indique le module r8169.
un peu de google plus tard, je vois des posts du ce genre de problème et l'existence du module r8168. A là bonne heure!
Je le télécharge depuis un autre pc, et l'installe avec un pacman -U depuis une clef usb.
Je pense bien à blacklister le r8169 et plein d'espoir décharge le pourri, charge le nouveau, relance le daemon network. Pareil.
Pris d'un doute, je reboot. Pareil.
J'ai testé de forcer les vitesses/duplex avec ethtool mais ça reste foireux. Par exemple, en 10Mbit half duplex, le lien reste up mais je ne ping toujours pas ma passerelle ou d'autres machines du même lan.
Encore plus drôle, je dispose d'une mythtv box sous archlinux (en i686 par contre) qui dispose également du même contrôleur réseau, avec le noyau juste précédent (j'ai préféré ne pas prendre le risque pour le moment d'y lancer un yaourt -Syu...). Le module chargé est le r8169 et même si (très très) ponctuellement on retrouve des link down/link up dans les logs, pas de problème particulier.
J'ai tester un autre câble, les autres prise rj45 de ma vieille freebox v5, redémarré cette dernière, downgradé le kernel jusqu'à la version n-2 du moment, sans plus de succès.
A noter également qu'avec ctkarch en v0.7 et un noyau 2.6.37 (de mémoire), le problème de lien reste entier. J'ai également vu un option dans le bios pour tester le lien réseau durant la POST et même là, indépendamment de tout OS, ça foire.
Z'avez des idées ?
je vais commencer l'histoire par un truc qui n'a peut être rien à voir mais sait-on jamais!
Ma machine principal est toujours allumé et accessible en ssh depuis mon boulot.
Je m'y connecte régulièrement pour lancer un petit yaourt -Syu des familles.
La machine est up depuis plusieurs jours (faudrait que je scrute les logs pour déterminer si besoin) et lundi, mardi, par de soucis particulier.
Aujourd'hui, c'est la merde: problème d'écriture dans /tmp, monté en RO, blablabla...
Chelou !!!
Je lance un touch /tmp/macouille et en effet, c'est la merde.
Je teste dans mon home (partition séparé), idem.
Comme un nigaud, je reboot. Erreur
Ce soir, de retour chez moi, je constate qu'au reboot la machine n'a pas put monter ma partion /dev/sda3 (mon /).
Évidemment, le busybox disponible ne me fournis pas de fsck.
Un reboot sur un ctkarch plus tart, le fsck.ext4 me parle d'une feature "FEATURE_I15".
e2fsck me dit qu'il y trop vieux pour certaines feature du fs, blablabla...
Un coup de debugfs pour retirer cette feature et fsck est enfin d'accord pour le faire.
Évidemment, c'est la cata, le bordel, la misère. Bref, pleins d'erreurs (mais corrigé).
Reboot sur ma arch à moi, fsck des autres fs et me revoilà sur mon bureau.
Plus de peur que de mal mais va falloir que je creuse l'affaire.
Nous voilà maintenant à mon soucis du moment: le link sur ma connexion est très très versatile.
ping de l'ip d'eth0 ok mais ping de la passerelle KO.
une boucle de mii-tool eth0 avec un sleep à 0.1 me montre ceci: environ 0,8s de up puis environ 1,5s de down, en boucle.
lspci m'indique une carte realtek RTL8111/8168B (rev 03).
lsmod m'indique le module r8169.
un peu de google plus tard, je vois des posts du ce genre de problème et l'existence du module r8168. A là bonne heure!
Je le télécharge depuis un autre pc, et l'installe avec un pacman -U depuis une clef usb.
Je pense bien à blacklister le r8169 et plein d'espoir décharge le pourri, charge le nouveau, relance le daemon network. Pareil.
Pris d'un doute, je reboot. Pareil.
J'ai testé de forcer les vitesses/duplex avec ethtool mais ça reste foireux. Par exemple, en 10Mbit half duplex, le lien reste up mais je ne ping toujours pas ma passerelle ou d'autres machines du même lan.
Encore plus drôle, je dispose d'une mythtv box sous archlinux (en i686 par contre) qui dispose également du même contrôleur réseau, avec le noyau juste précédent (j'ai préféré ne pas prendre le risque pour le moment d'y lancer un yaourt -Syu...). Le module chargé est le r8169 et même si (très très) ponctuellement on retrouve des link down/link up dans les logs, pas de problème particulier.
J'ai tester un autre câble, les autres prise rj45 de ma vieille freebox v5, redémarré cette dernière, downgradé le kernel jusqu'à la version n-2 du moment, sans plus de succès.
A noter également qu'avec ctkarch en v0.7 et un noyau 2.6.37 (de mémoire), le problème de lien reste entier. J'ai également vu un option dans le bios pour tester le lien réseau durant la POST et même là, indépendamment de tout OS, ça foire.
Z'avez des idées ?