j'ai un problèmes avec les noms de fichiers accentués. Dans un certain nombre de dossier, les caractères accentués des nom defichiers ne sont pas reconnus. Dans dolphin je n'arrive pas à manipuler ces fichiers, ou parfois des dossiers si le nom du dossier n'est pas bien reconu. Je ne sais pas bien quel est le problème ni comment le résoudre!
Exemple de ls -l dans un dossier avec ce problème (les caractères non reconnus apparaissent comme un point d'interrogation):
tous les noms de fichiers sont très probablement en iso8859. J'ai résolu ce genre de problème en évitant d'utiliser des accents dans les titres de mes fichiers, mais on ne fait pas toujours ce qu'on veut.
Si tu veux les convertir en lettres sans accent, tu peux utiliser detox:
Detox correspond vraiment à ce que veux faire. Dans beaucoup de cas ça marche super mais certains fichiers donnent des résultats moins bons comme celui-ci:
c'est bizarre, je n'ai pas eu ce problème, mais c'était surtout pour convertir des noms déjà en utf8. Juste une fois il a bloqué sur un fichier en iso8859 mais c'était parce qu'un fichier du même nom et sans l'accent existait déjà.
Il est possible de créer un fichier de configuration pour gérer les remplacements, par contre peut-être qu'il ne lit pas bien l'iso8859, peut-être peux-tu lancer en premier convmv et detox ensuite ?
Tu peux aussi utiliser --dry-run comme option à detox pour voir les actions qu'il projette de faire.
Apparemment il y a un mélange d'iso8859 et d'UTF8, les deux charset que j'ai du utiliser! Je pense qu'il faut que je rentre dans le détail, que je regarde quels dossiers sont en UTF8 et les quels sont en iso8859. Ces données ont traversé plusieurs distributions de mandriva en passant par gentoo et maintenant archlinux.
Sinon avec convmv j'avais testé il y a quelques temps (1 ou 2 ans) mais ça ne m'avais pas beaucoup convaincu.
Sinon, si il n'y a quelques problèmes, je peux peut-être faire un script qui par exemple supprime les lignes avec les chaînes de caractère A_copy_ e A_ ou qui les filtrent pour traiter ensuite les faux positifs...?
Sinon j'ai des dossier dans lesquels j'ai apparemment de mélange ce qui est un peu bizarre car les fichiers ont été créés à la même époque!
manouchk a écrit :Detox correspond vraiment à ce que veux faire. Dans beaucoup de cas ça marche super mais certains fichiers donnent des résultats moins bons comme celui-ci:
Un "é" codé en ISO-8859 affiché en UTF-8 donne un "A" avec un "~" au-dessus suivi du signe copyright. Donc il a remplacé le "A tildé" par "A" et le signe copyright par "copy".
J'ai trouvé un dossier dans lequels je dois avoir des fichiers accentués encodés en UTF8 et iso8859. Ça permet de tester. J'ai réduit la taille des fichiers et fait une archive tar avec 18 fichiers pour faire des tests. Je l'ai même mise sur internet:
Le problème est que j'ai des fichiers qui se renomment en d'autres fichiers déjà existant qui ont des dates différentes, convmv les reconnaît comme différent bien que leur md5sum soient identiques. Si je force j'obtient des fichiers en iso-8859 que je peut ensuite passer dans detox.
J'ai trouvé cette séquence qui semble fonctionner sur les fichiers de ce dossier:
Bon j'ai fait un test sur mon disque de sauvegarde et apparemment pas d'accident. J'ai même l'impression que tout les noms defichiers sont corrects. Il faut juste que je fasse attention de ne pas toucher par exemple aux dossiers du type ~/.Mail. Apparemment detox peut aller faire des dégas dans ce dossier ! Je vais le sauvegarder avant!!
J'ai appliquer les 3 programmes aux quelques dossiers se trouvant dans mon "home", principalement le dossier Documents pour éviter de toucher à des fichiers de configurations ou aux mails qui se trvent dans ~/.Mail
J'avais un problème d'accents (et doublons) dans les noms de fichiers et j'en ai profité pour suprimer tous les caractères pas gentils comme les espaces, j'ai gagné le bonus!