(Cet article s’adresse en partie à ce site : république-numérique.fr)

Bien loin est le temps où les sites n’étaient qu’en « .com » ou « .fr » : on trouve maintenant des « .france », « .xxx », « .science », « .christmas », « .google » et plein, plein d’autres.

En plus de tout ça, il est également déjà possible d’avoir des accents dans les noms de sites. Au lieu de « republique-francaise.fr » on pourrait avoir « république-française.fr ».

Voilà qui va plaire à l’Académie Française, mais je ne suis pas sûr que ça plaise à l’américain moyen, ou l’expatrié et son clavier qwerty : si taper un accent aigu sur du qwerty sur le « e » est encore relativement simple, mettre un cédille sur le « c » l’est déjà moins. Sans compter que la plupart des gens en France n’accentuent pas leur majuscules (ce qui est pourtant obligatoire selon les règles d’orthographe), et que les kikoo de Facebook n’accentuent même plus rien du tout, ça risque d’être un beau bordel.

Après, dans les nouvelles extensions de sites web, on trouve, en plus du « .christmas » et du « .google », aussi ce genre de choses : « ..삼성 », « .дети » ou « .中信 », respectivement en coréen, en russe et en chinois, alors que je ne parle pas des extensions en hébreu, en arabe, en cinghalais, en japonais, en grec ou dans tous les autres alphabets qui existent (car pourquoi se limiter à quelques-uns ?).

Tout ça c’est bien joli et sympathique pour les 2,5+ milliards de personnes dans le monde qui n’utilisent pas l’alphabet latin à la base, mais je pense que ça risque de fragmenter un peu plus internet et les sites-web et de rendre la vie plus dure à tout le monde (pas seulement moi et mon clavier latin). Il ne faut pas oublier que les claviers avec l’alphabet latin sont plus ou moins répandus partout (ou au moins en alphabet secondaire sur les claviers non latins). Comment ça sera quand un nom de site web en cyrillique devra être écrit sur clavier kana ?

Je pense que si il n’y a pas un fallback en Ascii (sous partie très réduite de l’alphabet latin et seule utilisée in facto en informatique) quelque part, il sera impossible de s’en sortir. Pas juste pour moi qui utilise cet alphabet là à la base, mais pour tous ceux qui utilisent un Internet actuel. C’est bien beau de penser à tous le monde, humainement et techniquement, mais ça risque aussi de casser bien plus de choses que ça ne résout.
Qu’un blog local s’amuse à mettre des caractères unicode dans son site, ce n’est pas trop un problème, mais ça peut le devenir si les institutions gouvernementales s’y mettent, car ces derniers peuvent avoir plus ou moins un rayonnement international.

Donc pour en revenir à république-numérique.fr, je ne peux pas être d’accord avec eux. Il faut dissocier le contenu de la page et son URL (la façon d’y accéder). Parce que sinon, on devrait également remplacer le tiret « - » par un trait d’union « ‐ » et mettre des majuscules (pas sûr que le « .fr » dans l’expression satisfasse aux règles d’orthographe).

ÉDIT : Oui, je connais le Punnycode, pour le fallback Ascii : mais j’espère que vous rigolez quand il s’agit de transformer « .香港 » (qui se lit xiāng gǎng selon les règles de translittération déjà existante) en ceci « .xn--j6w193g » ?
Je reformule donc : il faudrait un truc simple pour convertir les noms de sites en unicode, pas un charabia mathématique que personne ne comprend sans avoir un master en mathématiques. Et si possible, transparent à l’usage.
Par exemple « republique.fr » devrait pouvoir pointer tout seul sur « république.fr », et « .テスト » devrait plutôt être pointable par « .tesuto » plutôt que par « .xn--zckzah ». au moins il y aurait une logique linguistique derrière (ce qui me semble être l’un des buts de l’unicode, non ?).
À la commande d’un NDD en « .テスト » il faudrait que soient inclus d’office le « .tesuto » et leur équivalents ailleurs.

ÉDIT-2 voilà mon clavier virtuel pour navigateur pour taper dans une quarantaine de claviers différents en direct.

40 commentaires

gravatar
Gilles a dit :

En fait le site avec accents est pas officiel ;)

gravatar
Rukhazon a dit :

À la limite : une grande institution (gouvernementale dans ce cas) peux se permette de réserver le nom ASCII et le nom le plus correct possible en plus.

gravatar
HelloWorld a dit :

<troll> Il n'y a jamais de lettres majuscules accentuées car la majorité des utilisateurs sont sous Windows et que contraiment à une distro Linux, il faut faire une combinaison type ALT+random_code et non pas tout simplement MAJ+é = É</troll>

gravatar
Dijiou a dit :

Surtout, avec les accents, il faudra réserver encore plus de noms de domaines avec toutes les permutations possibles (avec/sans) accents pour éviter le fishing.
Comme tu l'as dit, initiative jolie dans l’idée, mais qui va compliquer la vie à tout le monde.

gravatar
Nicolas a dit :

Il existe un équivalent ASCII à tous les noms domaines non-ASCII : cf https://en.m.wikipedia.org/wiki/Punycode

Pour les majuscules accentuées j'en suis encore énervé... L'agent de l'État Civil a refusé d'enregistrer le prénom de ma fille "Élise" sous prétexte qu'ils ne mettent pas d'accent sur les majuscules... Officiellement elle s'appelle donc "Elise". Fu.

gravatar
Rukhazon a dit :

@Dijiou : Dans la plupart des cas de phishing, l'URL ne ressemble pas à celle du site visé (j'en ait personnellement vu dans les hébergements Free ou avec un domaine en .tk quand ce n'est pas directement l'adresse IP ...

gravatar
BÉPO a dit :

@HelloWorld : Pas besoin d'être sous linux pour les majuscules accentué suffit de changer le clavier, une petite installation qui prends 2min. J'ai un clavier azerty et j'ai configuré pour le mettre en Bépo par exemple. Aucun changement matériel à faire.
Pour Windows il y a des solutions simple si on veut garder la disposition azerty
http://portail.ecolelamache.org/2014/09/un-clavier-pour-ecrire-en-francais-sous-windows-e-c-oe-par-exemple/

gravatar
Alf a dit :

@BÉPO :

Donc faut bidouiller ... Normal, Windows est plus simple a utiliser ... (foutu troll ...)

gravatar
Le Hollandais Volant a dit :

@Alf : C’est bien la conclusion à laquelle j’arrive ici : http://lehollandaisvolant.net/?mode=links&id=20150928230628

Pour le moment, il faut bidouiller, quelque soit le système d’exploitation. Si on veut que ça change, il faut que les éditeurs d’OS se bougent le cul à intégrer des solutions plus simples pour taper des caractères non-latin plus simplement.
Ou alors prier que les sites avec des noms en unicode restent très marginaux.

gravatar
Theps a dit :

Je vois pas bien où est le problème sachant que dans facilement 90% des cas, l'URL n'est pas tappée, mais à la manière où tu le fais toi-même dans l'article, on a un lien qui pointe dessus, il ne reste plus qu'a cliquer.
Quand bien même je n'aurais pas de lien, je passerais probablement par un moteur de recherche...
Pour le reste, effectivement un clavier virtuel me semble une bonne solution, mais pour moi leur utilisation restera marginale.

gravatar
Le Hollandais Volant a dit :

@Theps : dans 90% des mots en français, il n'y a pas de "x", de "z" ou de "q". Autant supprimer ces lettres du clavier, alors ?

C'est pas parce que tu ne tapes pas tes url que tout le monde fait pareil. Et c'est pas non plus parce que tu ne les tapes pas que le faire doit être rendu impossible à cause du manque de réflexion de ceux travaillent à l'accès au web.

gravatar
pouet a dit :

Ceux qui travaillent à l'accès au web ont une réflexion un peu plus poussée que la tienne justement :)

Ils ont bien compris que le clavier latin est une restriction pour tous ceux qui ont un alphabet différent.
Ils ont bien compris que, en parallèle, peu de gens tapent directement des URL ou consultent des sites en langues étrangères : si tu ne lis pas le japonais, taper l'url en japonais ou en ascii ne change rien et si, à l'inverse, tu sais parler japonais et que tu rédiges en japonais régulièrement, tu as dès lors un clavier adapté à cet usage.
Ils ont bien compris que, si tu tapes des URL, tu es déjà plus avancé qu'une majorité d'utilisateurs et que, en conséquence, le punnycode suffit (ou une version améliorée, pourquoi pas).
Ils ont bien compris que les gens utilisent des moteurs de recherche, qui sont capables de traduire les mots clés et de rechercher du contenu multi-langue.

Ce qu'on a bien compris aussi c'est que tu veux préserver TON usage, avec pour argument "c'est pratique parce que j'en ai l'habitude et je fais ce que je veux".

Quant à ton clavier virtuel, c'est très bien si cela satisfait ton usage (et ton égo, ô sauveur du web). Les OS en incluent tous aussi.

gravatar
philippe a dit :

Pour que ce débat serve à quelque chose, il faudrait absolument avoir l'avis de ceux qui sont réellement concernés dans la vie de tous les jours par l'emploi de caractères non-latins dans la vie de tous les jours, et pas seulement d'une personne qui affirme qu'il faut se limiter aux caractères latin alors qu'il utilise de toute façon cet alphabet par défaut.

Peut-être que les gens concernés trouveront des avantages au fait de pouvoir utiliser leur alphabet de base. Peut-être qu'au contraire, ils trouveront plus pratique d'utiliser de l'ASCII standard. Dans tous les cas, c'est un problème qui les concerne eux, et ce n'est pas aux personnes qui ne sont pas concernées à la base de leur imposer une façon qui ne leur convient peut-être pas.

gravatar
Rukhazon a dit :

@Theps : Il n'y a pas que les URLs qui posent problème : j'avais voulu réserver un nom de domaine pour mon auto-entreprise avec un caractère accentué (ma cible étant essentiellement en France, je me suis dit qu'un 'é' passerait), j'ai commencé par être agacé par certains registrars qui ne prennent pas Unicode (pour comparer les tarifs) et je me suis ravisé en imaginant la tannée que ça allait être avec tous les n00bs qui utilisent un client mail tout pourri (j'ai croisé un caramail récemment) ou un webmail développé par des personnes qui ne parlent qu'en ASCII ...

gravatar
Le Hollandais Volant a dit :

@pouet : c'est clair que je dev que pour mon ego, oui. Donc je ne publierais plus rien du tout, si ça peut te prouver le contraire.

@philippe : justement, pourquoi ceux que tu dis "non concernés" sont de la partie ? Peut-être justement parce-que ce sont eux qui ont tout inventé, sans rencontrer de résistance de la part de ceux qui voulaient autre chose (ce qui ne les airait pas empêché de dev leur truc à eux dans leur coin).

Une autre solution serait de ne plus utiliser de NDD du tout : de revenir aux IP. Mais faut pas oublier pourquoi on a inventé le système DNS.

Il se trouve que j'ai déjà croisé des NDD en unicode, et rien que pour faire une validation de nom de site (en prog) c'est déjà le bordel. Y'a des solutions, elle vont être mises en place, mais au dessus il y a un problème humain.

Le même débat peut être fait, non pas pour un alphabet unique dans les URL, mais pour une langue unique dans le monde diplomatique /scientifique, et là l'Anglais n' est pas ma langue natale, je vois pas ce que les partisans du "moi moi moi" ont à dire.

L'ascii est une base commune à l'anglais (justement) et a toutes les langues en alphabet latin. S'il n'y a pas d'alphabet commun à touted les langues, qu'on en fasse une, comme on a créé l'espéranto pour les langues.

Au moins tout le monde sera content, spécialement quand le moment viendra de mettre tout ça en pratique.
Je sais que personnellement ça me dérangera pas : je lis déjà une demi-douzaine d'alphabets, un de plus ou de moins c'est pas un problème. Ce n'est pas le cas de tous : à vous de me dire si ça risque de vous faire chier...

gravatar
WXC a dit :

Il semble qu'avec l'inflation récente des TLD, l'unicode dans les URL est surtout un moyen de faire du fric. J'adresse tous mes vœux de bonheur aux webmasters qui devront lutter contre le typo squatting et le fishing, par exemple :
- lehollandaisvolant.net
- 𝐥𝐞𝐡𝐨𝐥𝐥𝐚𝐧𝐝𝐚𝐢𝐯𝐨𝐥𝐚𝐧𝐭.net
- 𝑙𝑒h𝑜𝑙𝑙𝑎𝑛𝑑𝑎𝑖𝑠𝑣𝑜𝑙𝑎𝑛𝑡.net
- 𝓵𝓮𝓱𝓸𝓵𝓵𝓪𝓷𝓭𝓪𝓲𝓼𝓿𝓸𝓵𝓪𝓷𝓽.net
etc....

gravatar
Clem a dit :

il y a aussi le problème des mails :
si une adresse e-mail est contact@république-numérique.fr, il y a un risque qu'elle soit refusée (à tort) par les formulaires web voir par certains clients mails.

gravatar
Clem a dit :

C'est vrai que quand on dépose un domaine, on se sent un peu obligé de déposer plusieurs variantes.

Et ça peut aller loin si on tient compte des paramètres suivants :

- avec ou sans tirets,
- différentes extensions,
- avec ou sans accents,
- avec ou sans article,
- singulier pluriel,
- fautes d’orthographes courantes,
- ...

Ce qui donne par exemple pour "[la] république numérique"

republique-numerique.fr
republique-numerique.eu
republique-numerique.com
republique-numerique.net
republique-numerique.org
republique-numerique.info
republique-numerique.xyz (parait que le .xyz c'est tendance)
republiquenumerique.fr
republiquenumerique.eu
republiquenumerique.com
republiquenumerique.net
republiquenumerique.org
republiquenumerique.info
republiquenumerique.xyz
république-numérique.fr
république-numérique.eu
république-numérique.com
république-numérique.net
république-numérique.org
république-numérique.info
république-numérique.xyz
républiquenumérique.fr
républiquenumérique.eu
républiquenumérique.com
républiquenumérique.net
républiquenumérique.org
républiquenumérique.info
républiquenumérique.xyz
la-republique-numerique.fr
la-republique-numerique.eu
la-republique-numerique.com
la-republique-numerique.net
la-republique-numerique.org
la-republique-numerique.info
la-republique-numerique.xyz
larepubliquenumerique.fr
larepubliquenumerique.eu
larepubliquenumerique.com
larepubliquenumerique.net
larepubliquenumerique.org
larepubliquenumerique.info
larepubliquenumerique.xyz
la-république-numérique.fr
la-république-numérique.eu
la-république-numérique.com
la-république-numérique.net
la-république-numérique.org
la-république-numérique.info
la-république-numérique.xyz
larépubliquenumérique.fr
larépubliquenumérique.eu
larépubliquenumérique.com
larépubliquenumérique.net
larépubliquenumérique.org
larépubliquenumérique.info
larépubliquenumérique.xyz

gravatar
Erwann a dit :

@Timo: je comprends ta frustration car tes remarques sont pertinentes.
Ce n'est pas de l'égocentrisme, comme certains voudraient le faire croire, mais une simple question d'efficacité.
L'utilisation - sans solution de repli - d'alphabets non ASCII ne peut que renforcer un isolement et favoriser une sorte de "communautarisme" qui est évidemment souhaité par certains pouvoirs et pays.

@Tous
Personnellement, même lorsque mes compétences en Anglais étaient très limitées, je n'ai utilisé que les versions en anglais des OS et des logiciels. Étant assez anciens pour avoir connu - ET GALÉRÉ - avec les premières versions de WinWord et Excel, localisées avec les pieds et très mal traduite qui ne causaient que des problèmes insolubles, j'ai pris le parti de me passer de logiciels localisés.

@Theps
Même en utilisant des bookmarks très fournis, je saisi de très nombreuses fois par jour des URL dans la barre d'adresse du navigateur.
En outre, si le choix définitif est de passer en unicode, il faut alors que TOUS les outils et services - SANS exception - soient conformes aux règles de validation définies dans la norme. Le problème commence déjà chez les registrars, continuent dans de nombreux frameworks et outils web (cf. le défaut de support pour vérifier la conformité d'une adresse courriel avec les RFC). Tant que IANA ou IETF n'auront pas de volonté ou de pouvoir coercitif face à des regsitrars non conformes, il ne sera pas réellement possible de supporter unicode sans mettre la pagaille.

@pouet
Je ne suis absolument pas persuadé que les promoteurs du solution unicode aient tout compris (mieux que Timo).
Je pense plutôt qu'il s'agit d'une réaction suscitée par des lobbyistes qui par là auto-justifient leur raison d'être. Ils ont lancé une nouvelle mode, qui accessoirement - comme observé par Dijiou - va conduire à devoir louer encore plus de noms de domaines (donc faire du business).

@HelloWorld et @Bepo
Concernant la gestion des accents et des umlauts, aussi bien sous Windows que sous Linux, il est possible d'écrire ces caractères sans passer par ALT+.... Il suffit de configurer le clavier pour accepter les "deadkeys". ´E = É, ^o = ô, ¨A = Ä, etc.
Devant écrire en Français et en Allemand tous les jours en utilisant un ordinateur portable sans pavé numérique, je peux confirmer que les deadkeys sont très utiles (remarque subsidiaire à tous les Français de France : utilisez un clavier Suisse, vous gagnerez grandement en efficacité (le clavier FR-FR est une horreur).
---
Dernière remarque
Je ne comprends pas les réactions ad hominem dont Timo fait l'objet. Il partage de nombreuses informations que je lis toujours avec plaisir. Je ne partage pas toujours ses opinions mais je les respecte. Personne ne m'oblige à le lire. Si je le lis, c'est que je souhaite découvrir quelque chose de nouveau.
Évidemment, il est toujours possible que des opinions divergent. C'est pour cela que l'on peut débattre. Visiblement, certaines personnes ne partageant pas l'opinion de Timo se contentent de dévaloriser d'une manière quasi humiliante ce qu'il partage au lieu de débattre de manière factuelle.
Je trouve un tel comportement tout simplement lamentable. Tout le monde parle du "vivre ensemble", mais trop peu de gens sont prêts à faire montre de tolérance, à commencer sur Internet.

gravatar
Linksawaking a dit :
mais j’espère que vous rigolez quand il s’agit de transformer « .香港 » (qui se lit zhōngguó selon les règles de translittération déjà existante) en ceci « .xn--j6w193g » ?

香港 se lit Xiāng gǎng en chinois, qui veut dire Hong-Kong, zhōngguó serait plutôt 中国, la Chine.

Juste une petite correction ;)


ÉDIT de Timo : merci, j’avais copié ça de Wiki. J’ai édité.
Pour le 中国, oui je reconnais : c’est pareil qu’en japonais^^.

gravatar
jefaispeuralafoule a dit :

@Erwann :
Je vais ajouter quelques points très personnels.

Les préceptes initiaux de l'informatique actuelle sont liés à une chose fondamentale, à savoir que l'anglais était la langue standard dans les pays où l'on mettait au point les technologies. A partir de là, il est devenu naturel et évident que les langages de programmation, mais également les outils le soient aussi, non?

Si l'on part déjà du côté restitution du code, il suffit de devoir se cogner, en tant que dev, les différents charset dans les bases de données pour comprendre où est le souci, et d'en venir à se dire "bon, on leur laisse le charset côté data, nous on fera le boulot côté serveur qui se comportera en "transférez vos données comme vous voulez"". C'est ça, le quotidien de l'informatique à l'international.

Autre aspect: les URL c'est une chose, mais quid des langages eux-mêmes? Mis à part quelques exceptions spécifiques qui convertissent le langage dans la langue locale (4D par exemple), les autres sont en anglais pur et dure. Js? Java? .NET? Tout est anglais il me semble... à quand des compilateurs qui ont un source en japonais, puis qu'on doit reconvertir pour les faire passer dans une autre langue quand on bosse dessus? Pourquoi se donner du boulot là où il n'y a pas lieu de le faire?

Dernière chose: que l'anglais soit un standard est gênant pour certains, ça je peux le comprendre, mais de là à se faire "son" standard dans son coin, et ainsi faire de soi un rocher de Monaco totalement isolé... je trouve cela autant nombriliste que vain. Certaines langues sont parlées par un nombre restreint de personnes. Est-ce pour autant intelligent d'aller revoir tous els standards pour le plus grand nombre pour préserver une "identité culturelle"?

Ca semble débile ce que je dis? Songez-y: à quand le HTML localisé dans son code? A quand les balises dans le code pays afin de le rendre parfaitement inexploitable par tout dev le récupérant? On n'a pas déjà assez de soucis avec les "standards" W3C qui sont déjà interprétés de manière différente par chacun des navigateurs du marché?

gravatar
Xavlepolak a dit :

@WXC : Je vois que ça pose d'autres problématiques (cf le rendu des liens de ton com) :) l'encodage des caractères spéciaux sur le web n'est pas la partie la plus aisée, ou tout du moins elle n'est pas un réflexe.

gravatar
Le Hollandais Volant a dit :

@jefaispeuralafoule :

Js? Java? .NET? Tout est anglais il me semble... à quand des compilateurs qui ont un source en japonais

Exact, c’est ce que je disais dans mon Shaarli avant hier : pour déclarer une fonction, je ne vois pas les japonais faire « ファンクション() {} ». Pas que ça serait illégitime de le faire, mais surtout parce qu’il n’existe aucun compilateur qui prendrait ça en entrée, pour la simple raison historique que l’informatique est inventée par les américains.

D’ailleurs, je n’ai jamais vu personne se plaindre de ça. Je sais qu’il existe des variantes, des langages de prog en Français, par exemple, mais de ce que j’en sais, c’est plutôt un fork humoristique (comme le LOLCode) qu’un vrai langage.

@Xavlepolak : justement, le lien Wiki un peu plus haut est encodé : les « é » ou « à » sont transformés en un code différent, du style « %1C » (tout simplement parce que le « é » ne fait pas partie des caractères autorisés dans une URL (du moins au début, maintenant je ne sais pas).
Mais comme tu dis, la conversion entre les deux n’est pas simple ni pratique.

gravatar
tony a dit :

PEP 3131 fût un débat houleux, finalement Guido (qui s'y refussait) a fait machine arrière: https://www.python.org/dev/peps/pep-3131

Fait une recherche sur les threads "Support for PEP 3131" et examine les arguments du 'pour', tu verras que les bienfaits sont bien plus importants... idem ici.

gravatar
Le Hollandais Volant a dit :

@tony : Je n’étais pas au courant de ça.

La plus importante selon moi est celle là : « Humans will no longer be able to validate Python syntax. »
Que ce soit Python ou un autre, la prog doit pouvoir permettre à un humain de lire du code : c’est un peu le but des langages de haut niveau. C’est même pour ça qu’ils sont là (sinon on ferait du binaire).

Utiliser un sous-set de l’unicode bien définit pour chaque langue, où chaque sous-set se comporterait comme un ascii local, ok. Mais ça nécessite le besoin d’un traducteur non ? Et dans ce cas précis, j’imagine que le traducteur (logiciel) passe par une représentation en binaire d’un glyphe pour la ressortir en russe, en latin, en japonais…
Ici, le « dénominateur commun » à tous ces langues, c’est le binaire.

Dans mon article, au vu de l’implémentation actuel, le dénominateur commun serait l’ascii. C’est déjà l’ascii en fait, vu que punnycode (déjà le truc en usage pour ça) est en ascii.
Ma remarque initiale, donc, revient à se dire que si on sait qu’on va utiliser ascii de toute façon, pourquoi faire une couche au dessus, qui va forcément compliquer les choses ?

Dans le cas des %20 ou %2C dans les URL, cette traduction ascii-unicode est devenue transparente (du moins dans Firefox : essayez de copier/coller une url avec des « éàçè »). On peut pas faire pareil pour les TLD en unicode ? un truc transparent, qui affiche tout dans la langue de l’internaute, et surtout dans une langue qu’il est capable de taper avec son clavier ?

gravatar
Erwann a dit :

@jefaispeuralafoule
Dans les heures de gloire de la "franchouillerie" dans les années 1980-90, des éditeurs français d'AGL et des sociétés de services ont réellement implémenté des langages 4G et pseudo code en Français.
Imaginer la tête des services informatiques des filiales, lorsqu'ils leur faut reprendre et maintenir les programmes qui en ont résulté.

Je suis absolument favorable à la défense de la langue française - au quotidien, en littérature, etc. - mais je trouve totalement débile une telle approche en informatique qui nous fait passer pour des clowns à l'étranger.
J'ai un client qui est en train de vivre ce problème avec ses filiales en Asie ou en Amériques.
Des outils de programmation en Français contribuent au manque de crédibilité des entreprises françaises à l'internationale.

@Timo et al.
« Humans will no longer be able to validate Python syntax. »
Je travaille dans un secteur industriel qui fait appel à la revue de code et qui doit satisfaire à des exigences réglementaires concernant la lisibilité et la capacité à comprendre (understandability) des informations.
Si à l'avenir des humains ne sont réellement plus en mesure de lire et de comprendre du code (source code review) en Python; alors Python n'est pas adapté à l'usage prévu (ce qui serait dommage).

gravatar
Phil Field a dit :

heu pourquoi voudrais-tui aller sur un site en .香港 si tu ne peux pas lire le contenu ?

Pourquoi appelles-tu ceci de la fragmentation alors que cela ammène à l'internet encore plus d'untilisateurs (qui n'utilisent pas ton alphabet cetrtes mais qui ont les mêmes besoins que toi) ?

gravatar
Le Hollandais Volant a dit :

@Phil Field : le contenu, je peux le traduire ou le faire traduire.
L’url, en revanche, ce n’est possible.

Par exemple, la ville « Paris » s’écrit « παρίσι » en grec.
Si j’ai une URL en .paris, elle ne sera pas accessible en « .παρίσι ». Alors que j’aurais exprimé le nom de la ville dans les deux cas.

C’est la distinction entre le contenu (qui peut être traduit, qui peut exprimer les mêmes choses dans plusieurs langues) et le chemin d’accès, qui lui est toujours uniquement : une chaîne de caractères. Et selon cette chaîne de caractères, certains peuvent la taper au clavier, d’autres non.

C’est uniquement sur ça que se porte la critique de mon article.

Une solution (proposée dans l’article) serait de lier automatiquement le « .paris » au « .παρίσι », mais ça… ça coûte cher : c’est à détenteur du site web de réserver et payer les noms de domaines. C’est donc une question de fric, comme souligné par @Clem : et @WXC :.

Alors ouiiiiii, il y a un moyen de les de traduire l’URL en grec en une url en alphabet latine : le punnycode. Mais comme l’est ce code : il est en ascii. Donc uniquement adapté à ceux qui utilisent l’alphabet latin.

Il ne suffit donc pas, à mon sens, pour contrer tous les problèmes engendrés par les URL en unicode : si c’est pour passer par du Ascii, autant ne pas proposer de l’unicode et rester en ascii en attendant de trouver un moyen plus neutre/international de résoudre le problème.

Selon certains, étant donné que j’utilise l’alphabet latin à la base (le Français utilise cet alphabet), je n’aurais pas mon mot à dire sur la question (ce que je réfute : j’ai le droit de le dire. Les autres ont le droit de l’ignorer aussi, oui.).

gravatar
Clem a dit :

Personnellement je trouve que les nouvelles extensions sont une mauvaise choses.
Qu’est-ce qu'on s'en fout que quelqu'un vienne squatter mon domaine avec une autre extension ?

Qui se souci de savoir ce qu'il y a sur lehollandaisvollant.com, lehollandaisvollant.org ou lehollandaisvollant.fr ?

Aujourd'hui, les moteurs de recherche savent mettre en avant le site officiel et les navigateurs savent détecter le fishing.

En fait le vrai intérêt des extensions est politique, et on peu le voir avec les fréquents changements de nom de domaine de Wikileaks, Pirate Bay, kickass Torrents ou T411.

Donc je trouve ça bien qu'il y ai une extensions gérer par chaque pays, ca peut permettre d’échapper à la censure.

Par contre les nouvelle extension, ca ajoute encore plus de restriction, et ca pue le marketing. je boycotte.

gravatar
John Doe a dit :

>> Selon certains, étant donné que j’utilise l’alphabet latin à la base (le Français utilise cet alphabet), je n’aurais pas mon mot à dire sur la question (ce que je réfute : j’ai le droit de le dire. Les autres ont le droit de l’ignorer aussi, oui.).

Ce n'est jamais ce qui a été dit (soit tu as compris et c'est malhonnête de ta part, soit tu n'as pas compris et c'est un peu inquiétant pour le débat).
Ce qui a été dit, c'est que tu ne connais pas la situation de ceux qui n'utilisent pas l'alphabet latin et pourtant tu affirmes que la situation est telle ou telle.

Tu dis par exemple:
"justement, pourquoi ceux que tu dis "non concernés" sont de la partie ? Peut-être justement parce-que ce sont eux qui ont tout inventé, sans rencontrer de résistance de la part de ceux qui voulaient autre chose (ce qui ne les airait pas empêché de dev leur truc à eux dans leur coin)."

Que sais-tu des efforts des autres pour participer à la norme ? Comment sais-tu qu'un type à Phnom Penh, pendant que les européens et les américains travaillaient là-dessus, est passé et a dit: "oh, oui, vous pouvez faire comme ça?" ? Comment sais-tu qu'à l'heure actuelle, il n'y a pas de débats, il n'y a pas de résistance ?
Il ne t'a pas été reproché de dire "il existe une solution: rester à l'ascii. qu'en pensez vous les amis ?", il t'a été reproché de considérer que les "non-concernés" à eux tout seul tu pouvais trouver une solution qui conviendrait à tout le monde sans consulter le reste de ce monde et on supposant que ce reste du monde ne peut forcément qu'être d'accord avec eux (et s'il ne l'est pas, c'est qu'il est de mauvaise volonté).
Ce qui est reproché, c'est de dire "la meilleure solution est bien évidemment de rester à l'ascii, car c'est la meilleure solution sur base de mes considérations d'européen et forcément, les non-européens ont les mêmes considérations. j'imagine qu'il n'y a pas de débat, donc, c'est sûrement qu'il n'y a pas de débat".

(désolé de revenir là-dessus, mais tu t'es créé une mauvaise image de ceux qui t'ont répondu sur base d'une interprétation qui est mauvaise: ceux qui t'ont dit ça ne sont pas des idiots comme ton interprétation le suggère)

gravatar
Le Hollandais Volant a dit :

@John Doe :

Ce n'est jamais ce qui a été dit

Ça me l’a été dit mot pour mot, au contraire. C’est pour ça que je le réitère dans mon comm au dessus.

Ce qui a été dit, c'est que tu ne connais pas la situation de ceux qui n'utilisent pas l'alphabet latin et pourtant tu affirmes que la situation est telle ou telle.

Je ne connais pas la situation partout, non.
Mais tous les claviers non-latins que j’ai vu , avaient toujours un niveau "QWERTY" dessus, exactement comme ici (tu vois que la barre d’espace est courte : la place manquante est prises par une touche pour passer du mode hiragana (celui du clavier, en dehors du qwerty) à katakana (typique au japonais et ses deux syllabaires) et une autre touche quelque part permet de passer en mode Qwerty (commune aux autres langues, parfois la touche est ailleurs aussi).

Ma généralisation à « tous les claviers font ça » est peut-être présomptueuse, mais dans les faits, elle n’est pas loin de la réalité quand même : presque tous les claviers non-latins ont un mode Qwerty (s’il n’est pas inscrit sur les touches, il est au moins inscrit dans le pilote logiciel — et ceci dit, un clavier Qwertz (allemand) ou Azerty (français) a un mode Qwerty quelque part aussi).

Peut-être justement parce-que ce sont eux qui ont tout inventé

En quoi est-ce faux ?

Sans rencontrer de résistance de la part de ceux qui voulaient autre chose

En quoi est-ce faux, manifestement ? Il suffit d’ouvrir les yeux pour voir que le Qwerty est partout. Tout comme Google a écrasé Yahoo ou Lycos (pourtant là bien avant), le Qwerty a écrasé tout le reste.
Je ne dis pas que cet écrasement est justifié ou une bonne chose (contrairement à ce que certains on lu dans ce que j’ai écrit), je dis qu’elle est là aujourd’hui, c’est tout.

Comment sais-tu qu'un type à Phnom Penh, pendant que les européens et les américains travaillaient là-dessus, est passé et a dit: "oh, oui, vous pouvez faire comme ça?

J’en sais rien.
Je constate par contre qu’en regardant tous les claviers du monde que leur disposition ne s’est pas imposé au fil du temps, contrairement au Qwerty.

Comment sais-tu qu'à l'heure actuelle, il n'y a pas de débats, il n'y a pas de résistance ?

Aucune idée.
Mais là aussi, je sais sais juste, par simple constat, que la solution actuellement retenue et en place depuis plus de 10 ans est en alphabet Latin (Ascii). Alors dire que l’Ascii c’est européo-centriste, c’est bien joli, sûrement vrai, mais c’est déjà en place, en fait (et c’est pas à cause de moi).

Oh et la raison à ça c’est peut-être que l’ASCII, ait partie des normes de l’ISO, dont 82% des États du monde font partie. C’est donc bien que l’Ascii est reconnu par une grande majorité des pays (peut-être pas l’unanimité, certes) comme une norme à utiliser, non ?
Oui, on peut tout à fait dire que l’ASCII et l’ISO sont centrés sur l’occident (USA, Europe, etc.), il n’empêche que tout le monde ou presque les a plus ou moins rejoint par la suite (probablement parce que ces pays membres ont vu un avantage économique quelconque à faire comme a fait l’inventeur d’une techno qui fonctionne bien (Internet, inventé par les USA)).

Mon article part simplement du constat qu’on a actuellement quelque chose qui marche : l’Ascii pour les NDD, et que si on change, on risque à mon humble avis de se retrouver dans un gros merde similaire à celui des prises électriques dont j’avais parlé ici.

Les prises électriques, c’est le bordel, et il faudrait unifier tout ça (peu importe lequel, mais qu’on arrête d’être obligé d’acheter des adaptateurs dans tous les sens).

Change les NDD et mettre de l’Unicode partout, c’est faire l’inverse : c’est passer d’un truc qui marche et que tout le monde utilise (il me semble que le Web fonctionne à Phnom Penh, non ?) à un truc fragmenté. Je trouve ça, comme je l’ai dit, juste stupide sur le plan technique, aussi beau que ça puisse être sur la plan culturel.

gravatar
John Doe a dit :

Je dis qu'on te reproche d'affirmer sans savoir que toutes tes hypothèses ne peuvent être qu'évidentes.
Dans ta réponse, tu confirmes que tu n'en sais rien.
Tu justifies ta conclusion par quelques indices, mais ces indices ne sont pas suffisant pour conclure
(Linux ne s'est pas imposé face à Windows, donc, les utilisateurs de Linux n'ont rien à reprocher à Windows ?
Dans le lien que tu donnes, il y a justement: https://en.wikipedia.org/wiki/International_Organization_for_Standardization#Criticism , qui donne justement des exemples que l'attribution de l'ISO n'est pas neutre et est fortement influencée par les intérêts des grands groupes qui y participent. Grands groupes qui veulent surtout satisfaire les pays développés, c-à-d ceux de l'alphabet latin. Du coup, en gros, tu dis: vu que le choix a été imposé à d'autres, c'est bien la preuve qu'il n'a pas été imposé)

Le reste du message est de nouveau dans l'erreur: personne ne te reproche de présenter la solution de l'ASCII (donne moi des LIENS pour me montrer qu'on te reproche ça. Je t'ai trop souvent entendu dire qu'on t'avait dit quelque chose alors que c'était faux, que c'était toi qui était persuadé que c'était le cas. Avec les liens, je verrais si c'est vrai ou pas).
Donc, la partie sur la défense des avantages de l'ASCII ne sert à rien, d'autant plus que je suis 100% d'accord avec toi sur ce plan là, mais je suis 100% d'accord avec ceux qui disent que ton avis à toi uniquement est trop restreint pour conclure, car tu n'as aucune idée des réalités du terrain.

gravatar
albert a dit :

Quand je vois tous les commentaires qui évoquent les normes et les techno en place, je constate qu'il y a une grosse confusion entre le fonctionnement technique d'une part, et l'interface destinée à l'utilisateur final d'autre part.

L'internationalisation et la localisation sont un des problème courant de l'informatique. A partir d'une solution technique qui fonctionne selon des normes bien définie, il s'agit de fournir une interface permettant à des gens de langues et de cultures différentes d'utiliser cette solution. Les commentaires qui évoque la traduction des langages de programmation ou des balises html dans ce contexte sont totalement hors sujets, c'est bien l'interface utilisateur, et pas la norme technique qu'il faut adapter à l'utilisateur final. Dans ce sens, la localisation peut bien être considérée comme une aberration sur le plan technique, ce n'est justement pas au niveau technique qu'elle est pertinente, mais au niveau de l'interface avec l'utilisateur final.

La comparaison avec les prises électrique ne me semble pas non plus pertinente. Dans ce cas, c'est un problème purement technique qui n'a rien à voir avec l'utilisateur final, le geste de mettre et de retirer une prise ne change pas fondamentalement d'un format à un autre, les différents format de prises ne sont pas faits pour s'adapter à la langue ou à l'écriture des habitants d'un pays. Dans ce contexte, il est clair qu'un seul standard serait plus pratique et ne changerait rien pour l'utilisateur final.

Donc finalement, dire qu'une solution est "stupide sur le plan technique" me semble totalement hors-sujet, puisque la problématique concerne la localisation destinée à l'utilisateur final.

gravatar
Jihaisse a dit :

Mais, ce que tu ne dit pas, c'est qu'on s'en fout de comment s'écrit l'url.
Les gens, les utilisateurs lambda, madame michu, qu'est-ce qu'elle fait ?
Elle tape dans sa barre d'adresse "google".
Elle clique sur le premier résultat.
Elle écrit dans le champ de recherche "mon site que je cherche" (quand c'est pas des fois l'url exacte)
Elle clique sur le premier résultat.
Et voilà, elle est sur le site.

Les gens ne savent même pas ce qu'est une url, par contre, ils connaissent très bien google et le moteur de recherche (qu'ils utilisent même pour aller sur le moteur de recherche...)

gravatar
Le Hollandais Volant a dit :

@Jihaisse :

Elle écrit dans le champ de recherche "mon site que je cherche" (quand c'est pas des fois l'url exacte)

Et quand le site est en chinois, elle le tape comment ?
Ah oui, Michu n’y va pas, sur des sites chinois, c’est vrai.
Problème résolu contourné.

Donc on fait un internet pour Michu, pas pour les autres (ce qui incluent ceux qui fabriquent des sites qui doivent après s’amuser à vérifier la validité d’une URL : mais osef de ça, vu que les logiciels tombent du ciel).

Si on se tape de comment l’URL s’écrit, je peux trouver plein d’autres façon pour planter quelqu’un sur un site simplement à cause d’un accent sur un e (alors je n’imagine pas les caractères unicode). Ce problème peut et sera résolu, on y passera, oui, mais celui qui sera emmerdé à la fin, ça sera le client car les sites « ne marchent pas » ou seront en maintenance.

Le programmeur il y voit du boulot, comme les vendeurs de NDD…

gravatar
Le Hollandais Volant a dit :

@albert :

Les commentaires qui évoque la traduction des langages de programmation ou des balises html dans ce contexte sont totalement hors sujets, c'est bien l'interface utilisateur, et pas la norme technique qu'il faut adapter à l'utilisateur final.

Firefox mobile, par défaut, affiche dans la barre d’URL le titre de la page : celle-ci, sur un site chinois (par exemple) est donc déjà en chinois. L’URL est donc caché et purement un machin technique en arrière plan.
Et les navigateurs masquent le protocole, le hash, les paramètres d’URL, et que Chrome (entre autres) prévoyaient à un moment de masquer l’URL, je pense que la dite URL va finir comme le code-source : un truc caché de la vue de l’internaute dans pas trop longtemps (vu que tout le monde n’en a rien à foutre, à part quelques geeks).

gravatar
chris a dit :

Le mouvement [des Anonymous] s’est en fait nourri de deux mamelles. D’une part la culture web, qui est issue de la contre-culture américaine des années 70, avec les premiers hackers, qui étaient aussi les premiers informaticiens en fait. Les Wozniak, les Jobs, les Stallman etc., qui bidouillaient dans leur garage tout en étant proches des milieux contestataires.

Les commentaires sont fermés pour cet article