Page 1 sur 1

[encodage des caractères] Lequel utiliser ?

Publié : sam. 14 mai 2011, 15:59
par Guiux
Bonjour à tous,

la question que je vais poser risque de sembler basique pour des informaticiens chevronnés comme vous, mais bon...

J'ai eu pas mal de problèmes de caractères lorsque je travaille avec d'autres personnes sur des documents informatiques (notamment avec des fichiers LaTeX et html). Ceux-ci sont dus au fait que mes chers collègues (la plupart sous Windows) m'envoient leurs fichiers textes encodés en latin1, alors que je le fais en utf8.

Aucun des deux partis ne s'étant jamais posé la question de pourquoi il utilise cet encodage, je vous le demande :
quel est l'encodage le plus "standard" et le plus "récent" et à qui est-ce de changer ses habitudes pour éviter les soucis ?


Merci d'avance... :chinois:

Re: [encodage des caractères] Lequel utiliser ?

Publié : sam. 14 mai 2011, 16:35
par FoolEcho
Salut,

Avant unicode, chacun se faisait son petit encodage dans son coin (pour sortir de l'ascii et avoir tous les caractères bizarres de notre alphabet dont les américains n'avaient cure, égoïstes comme ils sont :mrgreen: ), d'où la multiplicité des iso8859 en Europe par exemple (parce que bien sûr d'une langue à l'autre, non content d'être étranges, les caractères étaient différents... et que l'égoïsme n'était pas un apanage outre-atlantique :mrgreen: ).
Vint alors la norme unicode, qui fit son possible pour faire en sorte qu'un encodage commun soit mis en place pour tous les alphabets (vu que mon alphabet ne reconnaît que partiellement, voire pas du tout, celui du voisin... même si je parle sa langue, me voilà fort dépourvu, etc. ... ).

J'admire cette façon de faire des machins chacun dans son coin pour finalement se dire, ah tiens une généralisation ça serait bien quand même...

Donc, pour être plus clair:
- latin1 et assimilés <=> 1 partie des alphabets du monde.
- utf-8 : l'ensemble des alphabets du monde (théoriquement, hein, je n'ai pas vérifié)

Les 2 étants des normes internationales... donc pour répondre à tes questions: les deux sont des standards et utf-8 est le plus récent.

Dans la pratique, tant que ton éditeur de texte ou le logiciel que tu utilises est capable de reconnaître l'encodage d'un fichier et de jongler d'un encodage à l'autre tout va bien... (pour le développeur, c'est une source constante d'emmerdement... )