[encodage des caractères] Lequel utiliser ?

Applications, problèmes de configuration réseau
Guiux
Elfe
Messages : 870
Inscription : sam. 04 avr. 2009, 00:04
Localisation : Paris

[encodage des caractères] Lequel utiliser ?

Message par Guiux »

Bonjour à tous,

la question que je vais poser risque de sembler basique pour des informaticiens chevronnés comme vous, mais bon...

J'ai eu pas mal de problèmes de caractères lorsque je travaille avec d'autres personnes sur des documents informatiques (notamment avec des fichiers LaTeX et html). Ceux-ci sont dus au fait que mes chers collègues (la plupart sous Windows) m'envoient leurs fichiers textes encodés en latin1, alors que je le fais en utf8.

Aucun des deux partis ne s'étant jamais posé la question de pourquoi il utilise cet encodage, je vous le demande :
quel est l'encodage le plus "standard" et le plus "récent" et à qui est-ce de changer ses habitudes pour éviter les soucis ?


Merci d'avance... :chinois:
Arch 64 bits KDE 4 + Windows 7 sur Dell XPS M1530 [Core 2 Duo 2,4 GHz | 3 Go RAM | nVidia Geforce 8600M GT]
Avatar de l’utilisateur
FoolEcho
Maître du Kyudo
Messages : 10711
Inscription : dim. 15 août 2010, 11:48
Localisation : Basse-Normandie

Re: [encodage des caractères] Lequel utiliser ?

Message par FoolEcho »

Salut,

Avant unicode, chacun se faisait son petit encodage dans son coin (pour sortir de l'ascii et avoir tous les caractères bizarres de notre alphabet dont les américains n'avaient cure, égoïstes comme ils sont :mrgreen: ), d'où la multiplicité des iso8859 en Europe par exemple (parce que bien sûr d'une langue à l'autre, non content d'être étranges, les caractères étaient différents... et que l'égoïsme n'était pas un apanage outre-atlantique :mrgreen: ).
Vint alors la norme unicode, qui fit son possible pour faire en sorte qu'un encodage commun soit mis en place pour tous les alphabets (vu que mon alphabet ne reconnaît que partiellement, voire pas du tout, celui du voisin... même si je parle sa langue, me voilà fort dépourvu, etc. ... ).

J'admire cette façon de faire des machins chacun dans son coin pour finalement se dire, ah tiens une généralisation ça serait bien quand même...

Donc, pour être plus clair:
- latin1 et assimilés <=> 1 partie des alphabets du monde.
- utf-8 : l'ensemble des alphabets du monde (théoriquement, hein, je n'ai pas vérifié)

Les 2 étants des normes internationales... donc pour répondre à tes questions: les deux sont des standards et utf-8 est le plus récent.

Dans la pratique, tant que ton éditeur de texte ou le logiciel que tu utilises est capable de reconnaître l'encodage d'un fichier et de jongler d'un encodage à l'autre tout va bien... (pour le développeur, c'est une source constante d'emmerdement... )
«The following statement is not true. The previous statement is true.» :nage:
Répondre