[KDE] Problème encodage caractères (contourné)
- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
[KDE] Problème encodage caractères (contourné)
Bonjour
Depuis plusieurs mois, je rencontre un problème gênant sur KDE (pas de problèmes sur Gnome ou e17).
En effet, tout les fichiers créés "hors KDE" (Windows, Gnome ...) ne gèrent plus les caractères accentués une fois exportés sur KDE.
Par exemple, si j'extrais une archive contenant un fichier accentué, ce fichier sera illisible et comportera des caractères anormaux à la place des accents.
Même chose pour les fichiers que j'avais créé du temps ou j'utilisais Gnome.
Je rencontre ce problème dans toutes les applications KDE (Konsole, Gwenview, Dolphin, Konqueror ...). Pas de problème avec pcmanfm par exemple ...
Cela me semble différent de ce problème : http://forums.archlinux.fr/topic8877.ht ... t=virtuoso
Serait-ce un soucis d'encodage interne à KDE ?
Merci d'avance pour votre aide.
Depuis plusieurs mois, je rencontre un problème gênant sur KDE (pas de problèmes sur Gnome ou e17).
En effet, tout les fichiers créés "hors KDE" (Windows, Gnome ...) ne gèrent plus les caractères accentués une fois exportés sur KDE.
Par exemple, si j'extrais une archive contenant un fichier accentué, ce fichier sera illisible et comportera des caractères anormaux à la place des accents.
Même chose pour les fichiers que j'avais créé du temps ou j'utilisais Gnome.
Je rencontre ce problème dans toutes les applications KDE (Konsole, Gwenview, Dolphin, Konqueror ...). Pas de problème avec pcmanfm par exemple ...
Cela me semble différent de ce problème : http://forums.archlinux.fr/topic8877.ht ... t=virtuoso
Serait-ce un soucis d'encodage interne à KDE ?
Merci d'avance pour votre aide.
Dernière modification par Yamashita Ren le dim. 30 oct. 2011, 21:07, modifié 2 fois.
- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères
Tu parles bien des noms de fichiers, pas de leur contenu, si ?Yamashita Ren a écrit :Par exemple, si j'extrais une archive contenant un fichier accentué, ce fichier sera illisible et comportera des caractères anormaux à la place des accents.

As-tu vérifié la locale/l'encodage utilisé sous KDE (Konsole notamment) ?
«The following statement is not true. The previous statement is true.» 

- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
Re: [KDE] Problème encodage caractères
Je parle bien des noms de fichiers. C'est vrai que ça n'était pas très clair ...
L'encodage de Konsole (et probablement de tout KDE) est UTF8.
L'encodage de Konsole (et probablement de tout KDE) est UTF8.
- benjarobin
- Maître du Kyudo
- Messages : 17571
- Inscription : sam. 30 mai 2009, 15:48
- Localisation : Lyon
Re: [KDE] Problème encodage caractères
Le comportement que tu rencontre me semble normal...
Un nom de fichier n'est pas stocké en Unicode mais "binairement". KDE n'a aucun moyen de savoir quel est l'encodage du nom du fichier venant de Windows qui n'utilise pas UTF-8 (enfin jusqu’à XP je suis sûre)
Donc tu ne peux rien faire que je sache...
Un nom de fichier n'est pas stocké en Unicode mais "binairement". KDE n'a aucun moyen de savoir quel est l'encodage du nom du fichier venant de Windows qui n'utilise pas UTF-8 (enfin jusqu’à XP je suis sûre)
Donc tu ne peux rien faire que je sache...
Zsh | KDE | PC fixe : AMD Ryzen 9900X, Radeon RX 7700 XT
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
Titre d'un sujet : [Thème] Sujet (état) / Règles du forum
- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères
Si c'est du Seven, ça devrait être de l'unicode, il me semble. Antérieurement (xp et cie), ISO en effet.
Pour des fichiers que tu veux rapatrier dans ton home, tu peux toujours modifier l'encodage du nom avec convmv (c'est pour ça que je demandais si c'était le nom ou le contenu, sinon c'est iconv). Pour les autres, à part lancer l'application avec une autre locale (ou modification à la volée comme Konsole), rien à faire.
ou alors pcmanfm se lance avec un encodage différent ?! ... c'est une version d'Aur ou pas ? 
Pas du gnome actuel et peut-être pas sous Arch, donc ? (de mémoire, Ubuntu est resté très longtemps avec de l'ISO).Yamashita Ren a écrit :Même chose pour les fichiers que j'avais créé du temps ou j'utilisais Gnome.
Pour des fichiers que tu veux rapatrier dans ton home, tu peux toujours modifier l'encodage du nom avec convmv (c'est pour ça que je demandais si c'était le nom ou le contenu, sinon c'est iconv). Pour les autres, à part lancer l'application avec une autre locale (ou modification à la volée comme Konsole), rien à faire.
Par contre, ça, ça m'étonne...Yamashita Ren a écrit :Je rencontre ce problème dans toutes les applications KDE (Konsole, Gwenview, Dolphin, Konqueror ...). Pas de problème avec pcmanfm par exemple ...


«The following statement is not true. The previous statement is true.» 

- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
Re: [KDE] Problème encodage caractères
Merci pour convmv, ça fera l'affaire pour le moment ^^
Là ou c'est bizarre, c'est que j'ai commencé à avoir ce problème dès que je suis passé sur KDE sur Arch (il y a moins d'un an).
Pas de problèmes du temps ou j'utilisais Gnome sur Fedora, ni sur Arch (Nautilus).
Pas de problèmes non plus avec pcmanfm.
Ce sont des versions des dépots "officiels".
Donc ça me semble vraisemblablement être un problème de KDE ...
Là ou c'est bizarre, c'est que j'ai commencé à avoir ce problème dès que je suis passé sur KDE sur Arch (il y a moins d'un an).
Pas de problèmes du temps ou j'utilisais Gnome sur Fedora, ni sur Arch (Nautilus).
Pas de problèmes non plus avec pcmanfm.
Ce sont des versions des dépots "officiels".
Donc ça me semble vraisemblablement être un problème de KDE ...
- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères

«The following statement is not true. The previous statement is true.» 

- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
Re: [KDE] Problème encodage caractères
Bon alors je sais pas d’où je sors cette histoire de "ça marche sur nautilus et pas sur dolphin" parce que c'est pas du tout ça ...
Si le fichier est illisible, il l'est sur nautilus et dolphin.
En fait le problème est double :
1) Certains fichiers accentués pouvaient être lus sans problèmes sur Gnome-Nautilus. Je suis passé sur KDE, un jour je me suis rendu compte que ces fichiers étaient devenus illisibles. J'ai erré sur plusieurs DE, je suis revenu sur KDE, ces fichiers sont maintenant illisibles.
2) Aujourd'hui, j'ai une archive contenant des fichiers accentués. Si je l'extrais avec 7zip-fm pas de problème. Si je l'extrais avec Ark, les fichiers sont illisibles ...
Donc disons que si je parle du problème 1), c'est juste par curiosité parce que le coup du fichier lisible => illisible => lisible je trouve ça vraiment bizarre ...
Le problème 2) (probablement lié au problème 1) ), nous montre que manifestement KDE a un problème lors de la génération/conversion de fichiers accentués ...
edit : les sous titres UMplayer ne prennent pas non plus les caractères accentués ...
Pas de problème avec vlc. Soit j'y comprend rien, soit j'ai oublié de cocher une case quelque part ...
Si le fichier est illisible, il l'est sur nautilus et dolphin.
En fait le problème est double :
1) Certains fichiers accentués pouvaient être lus sans problèmes sur Gnome-Nautilus. Je suis passé sur KDE, un jour je me suis rendu compte que ces fichiers étaient devenus illisibles. J'ai erré sur plusieurs DE, je suis revenu sur KDE, ces fichiers sont maintenant illisibles.
2) Aujourd'hui, j'ai une archive contenant des fichiers accentués. Si je l'extrais avec 7zip-fm pas de problème. Si je l'extrais avec Ark, les fichiers sont illisibles ...
Donc disons que si je parle du problème 1), c'est juste par curiosité parce que le coup du fichier lisible => illisible => lisible je trouve ça vraiment bizarre ...
Le problème 2) (probablement lié au problème 1) ), nous montre que manifestement KDE a un problème lors de la génération/conversion de fichiers accentués ...
edit : les sous titres UMplayer ne prennent pas non plus les caractères accentués ...
Pas de problème avec vlc. Soit j'y comprend rien, soit j'ai oublié de cocher une case quelque part ...
- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères
Ça, ça paraît plus normal, déjà.Yamashita Ren a écrit :Si le fichier est illisible, il l'est sur nautilus et dolphin.

Sauf que Ark est à même de passer par les outils de p7zip si je ne me trompe pas (c'est d'ailleurs en dépendance optionnelle)...Yamashita Ren a écrit :Donc disons que si je parle du problème 1), c'est juste par curiosité parce que le coup du fichier lisible => illisible => lisible je trouve ça vraiment bizarre ...
Le problème 2) (probablement lié au problème 1) ), nous montre que manifestement KDE a un problème lors de la génération/conversion de fichiers accentués ...

Si le cœur t'en dit, tu peux toujours jeter un œil sur les rapports de bug, dès fois que: https://bugs.kde.org/buglist.cgi?quicksearch=ark ... de mon côté, ça n'est pas clair, on ne sait même pas de quel encodage tu pars, des circonstances exactes, etc.: peut-être avec un exemple d'archive à problème ?

Pour être bien sûr, aussi: à priori tu as les mêmes polices de caractères sous dolphin/nautilus (kde/gtk3) qu'avec 7zFM (attention gtk2 !) ? (c'est peu probable aujourd'hui, mais une police qui n'affiche pas les caractères exotiques de tes fichiers et on peut toujours courir côté encodage

Si je comprends bien, tu pars d'une certaine archive (pareil, faudrait savoir si c'est pour tout type ou non):
- si tu la décompresses par Ark, les noms de fichiers sont illisibles sous dolphin, nautilus, etc..
- si tu la décompresses par 7zFM, c'est lisible sous dolphin, nautilus, etc..
«The following statement is not true. The previous statement is true.» 

- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
Re: [KDE] Problème encodage caractères
C'est cela !FoolEcho a écrit :Si je comprends bien, tu pars d'une certaine archive (pareil, faudrait savoir si c'est pour tout type ou non):
- si tu la décompresses par Ark, les noms de fichiers sont illisibles sous dolphin, nautilus, etc..
- si tu la décompresses par 7zFM, c'est lisible sous dolphin, nautilus, etc..
Je viens de faire un test. J'ai lu une vidéo avec des un fichier .srt.
En UTF8 : caractères anormaux
En ISO8859 : aucun problème !
Je pense donc qu'il faut essayer de changer l'encodage de KDE. Mais où ?
Pour l'histoire du type d'archive, je pense réellement que ce n'est pas le problème. J'ai vraiment l'impression que c'est lors du passage par un composant KDE que l'encodage commence à cafouiller ...
Je ne peux malheureusement pas partager cette archive ...
- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères
Par ta locale.Yamashita Ren a écrit :Je pense donc qu'il faut essayer de changer l'encodage de KDE. Mais où ?
Mais je ferai l'inverse: je passerai le fichier en utf-8 (iconv) plutôt que kde ou le système en latin1.
Et puis là, tu nous parles du contenu du fichier et non du nom...

«The following statement is not true. The previous statement is true.» 

- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
Re: [KDE] Problème encodage caractères
Okay ...
Je comprends la nuance V_v
Je pense que "comme par hasard" UMplayer lit les srt en UTF8 alors que l'ISO8859 doit être la norme dans ce domaine (simple supposition). Et donc la similitude avec mon problème était troublante ...
Alors revenons en à nos oignons ...
Euh ...
On va réduire le problème à Ark !
Comment que ça se fait que Ark il m'extrait pas mon archive comme je le veux alors que File-Roller (je constate qu'ils ont enfin enlevé la dépendance à nautilus, très bien !) et 7zFM accomplissent héroïquement la tâche ?
C'est un problème interne à KDE ou à Ark ?
Je comprends la nuance V_v
Je pense que "comme par hasard" UMplayer lit les srt en UTF8 alors que l'ISO8859 doit être la norme dans ce domaine (simple supposition). Et donc la similitude avec mon problème était troublante ...
Alors revenons en à nos oignons ...
Euh ...
On va réduire le problème à Ark !
Comment que ça se fait que Ark il m'extrait pas mon archive comme je le veux alors que File-Roller (je constate qu'ils ont enfin enlevé la dépendance à nautilus, très bien !) et 7zFM accomplissent héroïquement la tâche ?
C'est un problème interne à KDE ou à Ark ?

- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères
D'une certaine manière, ça me rappelle ce sujet, mais le bug avait été fixé: http://forums.archlinux.fr/topic7199.html.
Pour revenir sur les archives, j'ai joué un peu.
En latin1: création d'un fichier avec du latin1 pour contenu et nom de fichier avec accent, puis direction archive (sans accents par contre sinon ark râle).
En utf-8, test de décompression: konqueror + ark mais aussi en ligne de commandes.
Si l'archive est faite avec 7zip (tar.gz), Ark ne s'en sort pas pour l'extraction. 7zip, si et convertit le nom en unicode.
En passant par tar (tar.gz) 7zip s'en sort. Ark extrait l'archive mais le nom n'est pas correctement restitué (comportement identique à tar en ligne de commandes).
Par contre, un .rar généré par rar... Là ark extrait correctement (comme unrar en ligne de commandes)... et convertit le nom (pas le contenu) en unicode, comme 7zip.
Parenthèse: ce qui est très fort, c'est que 7zip arrive toujours à faire la conversion latin1 vers unicode, même pour le rar (quand c'est lui qui compresse, ça ne me surprend pas: il peut très bien stocker l'info de l'encodage de départ quelque part, le fourbe
)...
C'est pour ça que j'accordais de l'importance au format de l'archive... Si problème il y a, je pense que ça vient de tar ou plus bas (je suppose que tar passe par gzip qui est dans base...): il faudrait tester avec d'autres archives de tar (xz, zip, etc.).
EDIT: test avec tar et .xz en sortie. Même comportement que pour le tar.gz: Ark extrait l'archive mais le nom reste en ISO, là où 7zip le convertit.
Au fond, je rejoins l'avis de benjarobin au début, ce comportement me paraît normal: à l'extraction, le système ne connaît pas l'encodage initial de l'archive...
Maintenant, 7zip y arrive dans tous les cas de figure... J'ignore pourquoi. Tente-t-il de déterminer l'encodage initial ou est-ce stocké dans l'archive ? Dans le second cas, c'est effectivement un peu bête si ark/tar n'exploite pas cela... mais je penche pour la première hypothèse.
À voir...

Je ne pense pas: passe ton fichier par iconv de latin1 à unicode. Tu peux aussi indiquer à mplayer l'encodage à utiliser (à vérifier, ça doit être:Yamashita Ren a écrit :Je pense que "comme par hasard" UMplayer lit les srt en UTF8 alors que l'ISO8859 doit être la norme dans ce domaine (simple supposition). Et donc la similitude avec mon problème était troublante ...
-subcp latin1
) ... je ne connaissais pas umplayer, faudra que je regarde ça... 
Pour revenir sur les archives, j'ai joué un peu.
En latin1: création d'un fichier avec du latin1 pour contenu et nom de fichier avec accent, puis direction archive (sans accents par contre sinon ark râle).
En utf-8, test de décompression: konqueror + ark mais aussi en ligne de commandes.
Si l'archive est faite avec 7zip (tar.gz), Ark ne s'en sort pas pour l'extraction. 7zip, si et convertit le nom en unicode.
En passant par tar (tar.gz) 7zip s'en sort. Ark extrait l'archive mais le nom n'est pas correctement restitué (comportement identique à tar en ligne de commandes).
Par contre, un .rar généré par rar... Là ark extrait correctement (comme unrar en ligne de commandes)... et convertit le nom (pas le contenu) en unicode, comme 7zip.
Parenthèse: ce qui est très fort, c'est que 7zip arrive toujours à faire la conversion latin1 vers unicode, même pour le rar (quand c'est lui qui compresse, ça ne me surprend pas: il peut très bien stocker l'info de l'encodage de départ quelque part, le fourbe


C'est pour ça que j'accordais de l'importance au format de l'archive... Si problème il y a, je pense que ça vient de tar ou plus bas (je suppose que tar passe par gzip qui est dans base...): il faudrait tester avec d'autres archives de tar (xz, zip, etc.).
EDIT: test avec tar et .xz en sortie. Même comportement que pour le tar.gz: Ark extrait l'archive mais le nom reste en ISO, là où 7zip le convertit.
Au fond, je rejoins l'avis de benjarobin au début, ce comportement me paraît normal: à l'extraction, le système ne connaît pas l'encodage initial de l'archive...
Maintenant, 7zip y arrive dans tous les cas de figure... J'ignore pourquoi. Tente-t-il de déterminer l'encodage initial ou est-ce stocké dans l'archive ? Dans le second cas, c'est effectivement un peu bête si ark/tar n'exploite pas cela... mais je penche pour la première hypothèse.
À voir...

«The following statement is not true. The previous statement is true.» 

- Yamashita Ren
- Hankyu
- Messages : 38
- Inscription : mar. 06 mai 2008, 15:22
Re: [KDE] Problème encodage caractères
Quel courage
Bah manifestement ça me semble être une feature manquante à Ark vu qu'elle est présente sur File-Roller et 7zFM (et ptet même Xarchiver). Ptet que c'est un comportement prévisible mais si c'est le cas, il serait judicieux que ça soit corrigé pour favoriser l’interopérabilité.
Tfaçon ça m'énerve cette histoire. Il y a 6 mois j'avais déjà des problèmes avec Ark qui ne supportait pas les archives 7zip encryptées ...
Alors pour le moment je vais laisser couler et convertir ce qui doit être converti ...
Umplayer est le "sucesseur" de Smplayer (même si en fait je le trouve moins bien). En fait en passant sur Vlc, j'ai remarqué que l'encodage utilisé par défaut était "Windows" alors que Umplayer était en UTF8. J'ai donc changé l'encodage de Umplayer en ISO8859.
Je parle bien sûr de l'encodage des .srt
Bref, vu qu'on sait pas vraiment d'où vient le problème (parce que j'ai aussi des fichiers au nom mal encodé qui traînent dans mon /home) je vais laisser tomber pour le moment ...
Je me repointerais le jour ou j'aurais des infos supplémentaires.
Merci pour ta patience, j'aurais au moins compris 2/3 trucs

Bah manifestement ça me semble être une feature manquante à Ark vu qu'elle est présente sur File-Roller et 7zFM (et ptet même Xarchiver). Ptet que c'est un comportement prévisible mais si c'est le cas, il serait judicieux que ça soit corrigé pour favoriser l’interopérabilité.
Tfaçon ça m'énerve cette histoire. Il y a 6 mois j'avais déjà des problèmes avec Ark qui ne supportait pas les archives 7zip encryptées ...
Alors pour le moment je vais laisser couler et convertir ce qui doit être converti ...
Ah non ! Certainement pas ! T'imagines faire ça à chaque épisode d'une série ?FoolEcho a écrit : Je ne pense pas: passe ton fichier par iconv de latin1 à unicode. Tu peux aussi indiquer à mplayer l'encodage à utiliser (à vérifier, ça doit être: -subcp latin1 ) ... je ne connaissais pas umplayer, faudra que je regarde ça...![]()
Umplayer est le "sucesseur" de Smplayer (même si en fait je le trouve moins bien). En fait en passant sur Vlc, j'ai remarqué que l'encodage utilisé par défaut était "Windows" alors que Umplayer était en UTF8. J'ai donc changé l'encodage de Umplayer en ISO8859.
Je parle bien sûr de l'encodage des .srt

Bref, vu qu'on sait pas vraiment d'où vient le problème (parce que j'ai aussi des fichiers au nom mal encodé qui traînent dans mon /home) je vais laisser tomber pour le moment ...
Je me repointerais le jour ou j'aurais des infos supplémentaires.
Merci pour ta patience, j'aurais au moins compris 2/3 trucs

- FoolEcho
- Maître du Kyudo
- Messages : 10711
- Inscription : dim. 15 août 2010, 11:48
- Localisation : Basse-Normandie
Re: [KDE] Problème encodage caractères
Ils sont aussi tous plus épais que Ark, donc ça n'est pas choquant qu'ils en fassent plus même s'ils se basent sur les mêmes outils qu'Ark, à priori... Seul 7zFM fait tout par lui-même.Yamashita Ren a écrit :Bah manifestement ça me semble être une feature manquante à Ark vu qu'elle est présente sur File-Roller et 7zFM (et ptet même Xarchiver).
À voir quelles sont les caractéristiques exactes de Ark.
Ben oui:Yamashita Ren a écrit :Ah non ! Certainement pas ! T'imagines faire ça à chaque épisode d'une série ?

Code : Tout sélectionner
find /là/où/sont/les/srt -name "*srt" -exec bash -c "iconv -f latin1 -t utf8 \"{}\" -o tmp && mv tmp \"{}\"" \;

Mais bon, c'est sûr que lire en ISO est suffisant.

«The following statement is not true. The previous statement is true.» 
