[charset] problème de noms de fichiers : accents (résolu)

Questions et astuces concernant l'installation et la configuration d'archlinux
Répondre
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

[charset] problème de noms de fichiers : accents (résolu)

Message par manouchk »

Bonjour,

j'ai un problèmes avec les noms de fichiers accentués. Dans un certain nombre de dossier, les caractères accentués des nom defichiers ne sont pas reconnus. Dans dolphin je n'arrive pas à manipuler ces fichiers, ou parfois des dossiers si le nom du dossier n'est pas bien reconu. Je ne sais pas bien quel est le problème ni comment le résoudre!

Exemple de ls -l dans un dossier avec ce problème (les caractères non reconnus apparaissent comme un point d'interrogation):

Code : Tout sélectionner

[09:34][manu@compal:~/Documents/Perso/Copa2006]$ ls -l                                                                    
total 8670                                                                                                                
-rw-r--r-- 1 manu 1001   89260 juil. 10  2006 Arr?ts_de_jeu.war                                                           
-rw-r--r-- 1 manu 1001  110797 juil. 10  2006 Droits_des_enfants.war
-rw-r--r-- 1 manu 1001   30529 juil. 10  2006 Le_Monde.fr_France_T?l?com,_l'obstruction_de_trop.war
-rw-r--r-- 1 manu 1001   33080 juil. 10  2006 Le_Monde.fr_L'Italie_brise_le_r?ve_des_Bleus.war
-rw-r--r-- 1 manu 1001   37886 juil. 10  2006 Le_Monde.fr_Zidane_son_douzi?me_et_dernier_carton_rouge.war
-rwxrwxrwx 1 manu 1001  247246 juil.  5  2006 Odia.jpg
-rw-r--r-- 1 manu 1001   29089 juil. 10  2006 Rheinsberger_Strasse_13.war
-rwxrwxrwx 1 manu 1001  147475 juil.  5  2006 S?bado ? dia de au revoir.jpg
-rwxrwxrwx 1 manu 1001   32225 juil.  7  2006 Zizou_Roberto_Carlos.jpeg
-rwxrwxrwx 1 manu 1001  148563 juil.  5  2006 jornal do brasil.JPG
-rwxrwxrwx 1 manu 1001  116526 juil.  5  2006 o globo - 1.jpg
-rwxrwxrwx 1 manu 1001   95768 juil.  5  2006 o globo - Notas da Fran?a.jpg
-rwxrwx[09:34][manu@compal:~/Documents/Perso/Copa2006]$ ls -l                                                                    
total 8670                                                                                                                
-rw-r--r-- 1 manu 1001   89260 juil. 10  2006 Arr?ts_de_jeu.war                                                           
-rw-r--r-- 1 manu 1001  110797 juil. 10  2006 Droits_des_enfants.war
-rw-r--r-- 1 manu 1001   30529 juil. 10  2006 Le_Monde.fr_France_T?l?com,_l'obstruction_de_trop.war
-rw-r--r-- 1 manu 1001   33080 juil. 10  2006 Le_Monde.fr_L'Italie_brise_le_r?ve_des_Bleus.war
-rw-r--r-- 1 manu 1001   37886 juil. 10  2006 Le_Monde.fr_Zidane_son_douzi?me_et_dernier_carton_rouge.war
-rwxrwxrwx 1 manu 1001  247246 juil.  5  2006 Odia.jpg
-rw-r--r-- 1 manu 1001   29089 juil. 10  2006 Rheinsberger_Strasse_13.war
-rwxrwxrwx 1 manu 1001  147475 juil.  5  2006 S?bado ? dia de au revoir.jpg
-rwxrwxrwx 1 manu 1001   32225 juil.  7  2006 Zizou_Roberto_Carlos.jpeg
-rwxrwxrwx 1 manu 1001  148563 juil.  5  2006 jornal do brasil.JPG
-rwxrwxrwx 1 manu 1001  116526 juil.  5  2006 o globo - 1.jpg
-rwxrwxrwx 1 manu 1001   95768 juil.  5  2006 o globo - Notas da Fran?a.jpg
-rwxrwxrwx 1 manu 1001  101817 juil.  5  2006 o globo - Notas da Sele??o.jpg
-rwxrwxrwx 1 manu 1001   83064 juil.  5  2006 o globo - esportes 1.jpg
-rwxrwxrwx 1 manu 1001  140848 juil.  5  2006 o globo - esportes 2.jpg
-rwxrwxrwx 1 manu 1001  299906 juil.  5  2006 zi_zou.JPG
-rwxrwxrwx 1 manu 1001 5149750 juil.  5  2006 zizou.mp3
-rwxrwxrwx 1 manu 1001 1932538 juil.  5  2006 zizou2.mp3
rwx 1 manu 1001  101817 juil.  5  2006 o globo - Notas da Sele??o.jpg
-rwxrwxrwx 1 manu 1001   83064 juil.  5  2006 o globo - esportes 1.jpg
-rwxrwxrwx 1 manu 1001  140848 juil.  5  2006 o globo - esportes 2.jpg
-rwxrwxrwx 1 manu 1001  299906 juil.  5  2006 zi_zou.JPG
-rwxrwxrwx 1 manu 1001 5149750 juil.  5  2006 zizou.mp3
-rwxrwxrwx 1 manu 1001 1932538 juil.  5  2006 zizou2.mp3
Un snapshot de dolphin du même dossier:
[img]
http://emmanuelfavrenicolin.free.fr/Pub ... oblem.jpeg
[/img]

Mes "locales":

Code : Tout sélectionner

locale
LANG=fr_FR.utf8
LC_CTYPE="fr_FR.utf8"
LC_NUMERIC="fr_FR.utf8"
LC_TIME="fr_FR.utf8"
LC_COLLATE=C
LC_MONETARY="fr_FR.utf8"
LC_MESSAGES="fr_FR.utf8"
LC_PAPER="fr_FR.utf8"
LC_NAME="fr_FR.utf8"
LC_ADDRESS="fr_FR.utf8"
LC_TELEPHONE="fr_FR.utf8"
LC_MEASUREMENT="fr_FR.utf8"
LC_IDENTIFICATION="fr_FR.utf8"
LC_ALL=
Dernière modification par manouchk le dim. 10 mai 2009, 20:59, modifié 1 fois.
Avatar de l’utilisateur
tuxce
Maître du Kyudo
Messages : 6677
Inscription : mer. 12 sept. 2007, 16:03

Re: [charset] problème avec les noms de fichiers avec accents

Message par tuxce »

c'est un souci d'option de montage, c'est quel fs ?
farvardin
Maître du Kyudo
Messages : 1084
Inscription : sam. 29 mars 2008, 22:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par farvardin »

tous les noms de fichiers sont très probablement en iso8859. J'ai résolu ce genre de problème en évitant d'utiliser des accents dans les titres de mes fichiers, mais on ne fait pas toujours ce qu'on veut.

Si tu veux les convertir en lettres sans accent, tu peux utiliser detox:

http://aur.archlinux.org/packages.php?ID=7130

(attention, soigne en profondeur : je crois que cela retire également les espaces pour les remplacer par des _)

Si tu préfères garder les accents mais les passer en utf8 pour que cela s'affiche correctement, utilise convmv :

Code : Tout sélectionner

convmv -r -f iso-8859-15 -t utf8 .
Cela affiche tout les changement qui vont être effectués et si c'est bon, on rajoute juste --notest pour le faire définitivement.
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par manouchk »

Detox correspond vraiment à ce que veux faire. Dans beaucoup de cas ça marche super mais certains fichiers donnent des résultats moins bons comme celui-ci:

/home/manu/Documents/Labo/LLN/Documents/Actu/Publicité -> /home/manu/Documents/Labo/LLN/Documents/Actu/PublicitA_copy_

Il a remplacé le "é" para "A_copy_" ?

Autres problèmes:

/home/manu/Documents/Labo/LLN/Documents/Actu/Gros_Graph_thèse -> /home/manu/Documents/Labo/LLN/Documents/Actu/Gros_Graph_thA_se

/home/manu/Documents/Labo/LLN/Documents/dea/TP magistère/TP MagistèreSTM.doc -> /home/manu/Documents/Labo/LLN/Documents/dea/TP magistère/TP_MagistA_reSTM.doc

Bon il faut que pense un peu! Peut-être est-ce que je dois écrire un script pour filtrer ces problèmes? (ça va pas être facile?)

En fait j'ai aussi quelques problème de noms de dossiers. Detox ne s'occupent pas d'eux?
farvardin
Maître du Kyudo
Messages : 1084
Inscription : sam. 29 mars 2008, 22:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par farvardin »

c'est bizarre, je n'ai pas eu ce problème, mais c'était surtout pour convertir des noms déjà en utf8. Juste une fois il a bloqué sur un fichier en iso8859 mais c'était parce qu'un fichier du même nom et sans l'accent existait déjà.

Il est possible de créer un fichier de configuration pour gérer les remplacements, par contre peut-être qu'il ne lit pas bien l'iso8859, peut-être peux-tu lancer en premier convmv et detox ensuite ?

Tu peux aussi utiliser --dry-run comme option à detox pour voir les actions qu'il projette de faire.
Avatar de l’utilisateur
tuxce
Maître du Kyudo
Messages : 6677
Inscription : mer. 12 sept. 2007, 16:03

Re: [charset] problème avec les noms de fichiers avec accents

Message par tuxce »

par curiosité, pourquoi vous ne montez pas tout simplement la partition avec le bon charset ?
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par manouchk »

Apparemment il y a un mélange d'iso8859 et d'UTF8, les deux charset que j'ai du utiliser! Je pense qu'il faut que je rentre dans le détail, que je regarde quels dossiers sont en UTF8 et les quels sont en iso8859. Ces données ont traversé plusieurs distributions de mandriva en passant par gentoo et maintenant archlinux.

Sinon avec convmv j'avais testé il y a quelques temps (1 ou 2 ans) mais ça ne m'avais pas beaucoup convaincu.

Sinon, si il n'y a quelques problèmes, je peux peut-être faire un script qui par exemple supprime les lignes avec les chaînes de caractère A_copy_ e A_ ou qui les filtrent pour traiter ensuite les faux positifs...?


Sinon j'ai des dossier dans lesquels j'ai apparemment de mélange ce qui est un peu bizarre car les fichiers ont été créés à la même époque!

Code : Tout sélectionner

/home/manu/Labo/Cefetes_Colatina/Carga_horaria/res_32_2008_carga_horária_docente_anexos.pdf -> /home/manu/Labo/Cefetes_Colatina/Carga_horaria/res_32_2008_carga_horA_ria_docente_anexos.pdf
/home/manu/Labo/Labo_CBPF/Amazon.com Checkout_ Place Your Order.jpg -> /home/manu/Labo/Labo_CBPF/Amazon.com_Checkout_Place_Your_Order.jpg
/home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas -> /home/manu/Labo/Labo_CBPF/Prestaccao_de_contas
/home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas/Fechamento_da_bolsa/Presta<E7>cao_de_contas -> /home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas/Fechamento_da_bolsa/Prestaccao_de_contas
/home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas/Fechamento_da_bolsa/Relatorio CNPq_Mauricio.doc -> /home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas/Fechamento_da_bolsa/Relatorio_CNPq_Mauricio.doc
/home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas/Fechamento_da_bolsa/Relatorio CNPq_Mauricio.pdf -> /home/manu/Labo/Labo_CBPF/Presta<E7>cao_de_contas/Fechamento_da_bolsa/Relatorio_CNPq_Mauricio.pdf
/home/manu/Labo/Labo_CBPF/indere<E7>os.txt -> /home/manu/Labo/Labo_CBPF/inderecos.txt
/home/manu/Labo/Labo_CBPF/indere<E7>os.txt~ -> /home/manu/Labo/Labo_CBPF/inderecos.txt~
/home/manu/Labo/Labo_CBPF/dados livraria da fisica.txt -> /home/manu/Labo/Labo_CBPF/dados_livraria_da_fisica.txt
/home/manu/Labo/Labo_CBPF/indereços.txt~ -> /home/manu/Labo/Labo_CBPF/indereA_os.txt~
/home/manu/Labo/Labo_CBPF/indereços.txt -> /home/manu/Labo/Labo_CBPF/indereA_os.txt
/home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas -> /home/manu/Labo/Labo_CBPF/PrestaA_cao_de_contas
/home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas/Fechamento_da_bolsa/Relatorio CNPq_Mauricio.doc -> /home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas/Fechamento_da_bolsa/Relatorio_CNPq_Mauricio.doc
/home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas/Fechamento_da_bolsa/Relatorio CNPq_Mauricio.pdf -> /home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas/Fechamento_da_bolsa/Relatorio_CNPq_Mauricio.pdf
/home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas/Fechamento_da_bolsa/Prestaçcao_de_contas -> /home/manu/Labo/Labo_CBPF/Prestaçcao_de_contas/Fechamento_da_bolsa/PrestaA_cao_de_contas
/home/manu/Labo/Labo_CBPF/Amazon.com - Order 103-1284432-7222263.jpg -> /home/manu/Labo/Labo_CBPF/Amazon.com-Order_103-1284432-7222263.jpg
/home/manu/Labo/Labo_UFES/Fax/Cópia de fax.odt.odp -> /home/manu/Labo/Labo_UFES/Fax/CA3pia_de_fax.odt.odp
/home/manu/Labo/Labo_UFES/Fax/C<F3>pia de fax.odt.odp -> /home/manu/Labo/Labo_UFES/Fax/Copia_de_fax.odt.odp
/home/manu/Labo/Labo_UFES/Inst/Lista de itens para adequação da Sala do ppms.doc -> /home/manu/Labo/Labo_UFES/Inst/Lista_de_itens_para_adequaA_A_pound_o_da_Sala_do_ppms.doc
/home/manu/Labo/Labo_UFES/Biblio/Apostilhas/Teoria Erros v3.pdf -> /home/manu/Labo/Labo_UFES/Biblio/Apostilhas/Teoria_Erros_v3.pdf
/home/manu/Labo/Labo_UFES/Biblio/Artigos/edx/EPMA%20Right&Wrong.pdf -> /home/manu/Labo/Labo_UFES/Biblio/Artigos/edx/EPMA%20Right_and_Wrong.pdf
/home/manu/Labo/Labo_UFES/Biblio/Artigos/edx/Principe du MEB et de la microanalyse par EDS _(cours d'Andr<E9> ....pdf -> /home/manu/Labo/Labo_UFES/Biblio/Artigos/edx/Principe_du_MEB_et_de_la_microanalyse_par_EDS-cours_d_Andre_....pdf
Avatar de l’utilisateur
NewMusicianGeek
Hankyu
Messages : 47
Inscription : lun. 06 avr. 2009, 09:39

Re: [charset] problème avec les noms de fichiers avec accents

Message par NewMusicianGeek »

manouchk a écrit :Detox correspond vraiment à ce que veux faire. Dans beaucoup de cas ça marche super mais certains fichiers donnent des résultats moins bons comme celui-ci:

/home/manu/Documents/Labo/LLN/Documents/Actu/Publicité -> /home/manu/Documents/Labo/LLN/Documents/Actu/PublicitA_copy_

Il a remplacé le "é" para "A_copy_" ?
Un "é" codé en ISO-8859 affiché en UTF-8 donne un "A" avec un "~" au-dessus suivi du signe copyright. Donc il a remplacé le "A tildé" par "A" et le signe copyright par "copy".
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par manouchk »

J'ai trouvé un dossier dans lequels je dois avoir des fichiers accentués encodés en UTF8 et iso8859. Ça permet de tester. J'ai réduit la taille des fichiers et fait une archive tar avec 18 fichiers pour faire des tests. Je l'ai même mise sur internet:

http://emmanuelfavrenicolin.free.fr/Pub ... x_test.tar

Je fais des tests avec covmv et detox...
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par manouchk »

Dans le dossier de test, je peux utiliser une option du type

convmv -f utf8 -t iso-8859-1 --fixdouble --notest -i *

Le problème est que j'ai des fichiers qui se renomment en d'autres fichiers déjà existant qui ont des dates différentes, convmv les reconnaît comme différent bien que leur md5sum soient identiques. Si je force j'obtient des fichiers en iso-8859 que je peut ensuite passer dans detox.

J'ai trouvé cette séquence qui semble fonctionner sur les fichiers de ce dossier:

convmv -f iso-8859-1 -t utf8 --replace --notest *
convmv -f utf8 -t iso-8859-1 --fixdouble --replace --notest *
detox -s utf_8 -r ../Detox_test/*

Ça peut ne pas marcher sur les autres!!

Il faudrait que je puisse tester sans modifier!!

Peut-être en recréant une arborescene de fichiers vides?? C'est possible de faire ça?
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par manouchk »

Bon j'ai fait un test sur mon disque de sauvegarde et apparemment pas d'accident. J'ai même l'impression que tout les noms defichiers sont corrects. Il faut juste que je fasse attention de ne pas toucher par exemple aux dossiers du type ~/.Mail. Apparemment detox peut aller faire des dégas dans ce dossier ! Je vais le sauvegarder avant!!
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème avec les noms de fichiers avec accents

Message par manouchk »

Bon ça a l'air d'avoir marché avec ces trois lignes

convmv -f iso-8859-1 -t utf8 --replace --notest Documents/*
convmv -f utf8 -t iso-8859-1 --fixdouble --replace --notest Documents/*
detox -s utf_8 -r Documents

J'ai appliquer les 3 programmes aux quelques dossiers se trouvant dans mon "home", principalement le dossier Documents pour éviter de toucher à des fichiers de configurations ou aux mails qui se trvent dans ~/.Mail

J'avais un problème d'accents (et doublons) dans les noms de fichiers et j'en ai profité pour suprimer tous les caractères pas gentils comme les espaces, j'ai gagné le bonus! :bravo:

:D
farvardin
Maître du Kyudo
Messages : 1084
Inscription : sam. 29 mars 2008, 22:56

Re: [charset] problème de noms de fichiers : accents (résolu)

Message par farvardin »

bon c'est bien alors !

Pour detox tu n'as peut être pas vu, mais il y a l'option --dry-run qui évite de tester avec des sauvegardes.
Avatar de l’utilisateur
manouchk
Daikyu
Messages : 96
Inscription : sam. 09 août 2008, 12:56

Re: [charset] problème de noms de fichiers : accents (résolu)

Message par manouchk »

Ah, je savais qu'il y avait une option dry-run mais j'avais quelques inquiétudes quand même et j'ai fait le test sur mon disque usb!! :mrgreen:

Sinon, c'est vrai super comme logiciel detox! Merci beaucoup !
Répondre