i

J’avais un peu de mal à faire une détection du bon encodage de caractères dans les pages web. Du coup je cherche un peu et tombe sur cet article, de Supinfo, qui est une haute école d’ingénieurs en informatique en France :

Pour une raison ou une autre, je décide de regarder le code source.

Voilà :

i

Mais oui soyons fou : rédigeons un article pour donner des conseils pour choisir entre l’encodage unicode (UTF-8) et l’encodage ISO (ISO-8859-1) et mettons deux encodages contradictoires dans le code source de la page !

C’est comme si tu allais acheter une nouvelle voiture, que tu demandes « Et cette voiture, elle est essence ou gazole ? » et que le garagiste en chef, celui que tout le monde respecte, te disait « oui ».

Comment voulez-vous avancer dans le domaine des technologies et des standards, et faire en sorte que le monde soit un peu plus interopérable chaque jour quand les personnes supposément les plus compétentes dans le domaine font ce genre de choses ?

C’est insultant.

Bref.

Du coup, le vrai encodage c’est quoi ici ?

La page est en HTML 4. Par conséquent, la première déclaration (<meta charset="utf-8">) n’existe pas — mais ce n’est qu’une des 31 erreurs dans le code source). Le navigateur devrait l’ignorer. La valable est donc ISO-8859-1.

Pourtant, mon navigateur détecte une page en UTF-8.

Je regarde l’encodage spécifié dans les en-têtes HTTP :

content-type	text/html; charset=UTF-8

Génial… Quel bordel…

Commentaires fermés

Les commentaires sont fermés pour cet article