Incunabula (@incunabula): "Which European language am I reading?"|nitter… / Twitter

Une flow chart pour savoir quelle langue européenne on a devant les yeux, en regardant les différents caractères que le texte comprend.

Version hébergée chez moi : https://lehollandaisvolant.net/img/fb/euro-lang-flowchart-0.jpeg
La source semble être Reddit, mais la définition de l’image n’est pas très bonne : https://www.reddit.com/r/languagelearning/comments/lmwsw7/what_european_language_am_i_reading_european/

Sinon, pour le Hollandais, ils auraient pu mettre le caractère constituée de la ligature « ij », soit le « ij » (voir là), qui n’existe qu’en néerlandais. Je dirais qu’il est plus rare que le ß allemand, qui n’est déjà pas hyper courant non plus. Le ij se retrouve donc difficilement dans les textes, et on passe vite à côté. Plus que le « -ieuw » qu’ils proposent.

#21227  

https://twitter.com/incunabula/status/1560597822151356416/photo/1

The Word Machine – …in some weird postmodern way…

Hihi, quand ses outils traversent les frontières :D

(Sans surprise, mes sites sont beaucoup plus visités dans les pays francophones qu’ailleurs : France, Belgique, Canada, Suisse, Maroc…) mais parfois des liens sur des blogs anglais ressortent :-D)

Perso j’aime énormément l’outil en question car c’est le seul outil que j’ai qui ressemble un peu à de la machine-learning.
Je donne une énorme liste de mots au script, il calcule statistiques relatifs aux occurrences des lettres et des suites de lettres, et après utilise ces statistiques pour créer des mots.

En fait, il suffirait que j’ajoute une fonction qui permet à chacun de valider les meilleurs mots ainsi inventés pour les ajouter à une seconde liste. Une fois que cette liste devient conséquente, on utilise cette liste là comme liste d’entrée, et voilà ! On a une machine qui invente des mots qui ressemblent à des mots dans une langue donnée, sans avoir jamais connu aucun mot réel de la langue donnée.

Mieux, on pourrait alors donner un mot à la machine et il nous dit quelque chose comme « ce mot est 98 % français », ou au contraire « Non, ce mot n’est que 4 % français ».

Et comme il y a une part d’aléatoire dans tous les mots générés, il serait possible de créer un texte totalement random de cette manière (suffit de lui apprendre à générer des phrases, en plus de produire des mots).

(et on verra dans 400 ans, les chercheurs s’arracher les cheveux comme ils le font aujourd’hui avec le texte de Voynich :-D)

#20333  

https://iswpw.net/2021/01/02/the-word-machine/

Traduire une date - le hollandais volant

JavaScript contient une solution d’internationalisation assez puissant, qui permet de détecter la langue d’un texte ou de formater une date, un nombre…

Ici, j’utilise tout juste 10 lignes de JS pour capter une date entrée par l’utilisateur et la traduire dans la langue qu’il souhaite.

J’ai mis une liste immense de codes de langues, mais beaucoup ne sont pas supportées. Je vais peut-être faire un filtre pour les virer dynamiquement.

En attendant, vous pouvez essayer des langues un peu communes : anglais, allemand, danois… Même le perse, l’arabe ou le japonais sont supportés !

Et ça formate la langue correctement, avec les majuscules, les vigules et l’ordre tout comme il faut. Actuellement il n’y a pas les variantes (pour l’anglais, par exemple j’ai juste « anglais », sans distinguer anglais UK et anglais US).

J’étofferais ça probablement un jour, peut-être avec les émoji de drapeaux, etc. pour faire joli.

ÉDIT : on me signale qu’iOS aurait du mal avec cette page et affiche des "invalide date" partout. Je regarde ça dès que possible, mais comme c’est des fonctions internes à JS et au navigateur, il n’est pas garanti que je puisse trouver une solution. Au mieux je pourrais alors mettre un message de non support de la fonction dans le navigateur.

Monsieur Samovar sur Twitter : "Tip pour savoir si on accorde ou pas le COD avec "avoir" "Les fraises, je les ai mangées." -> au moment où j'écris "mangées" je sais que ce sont des fraises, j'accorde."J'ai mangé les fraises" -> au moment où j'écris "mangé" je ne sais pas ce que c'est, pas d'accord."

J’aime ces astuces. Sauf que comme il le dire, c’est le cas le plus simple.

Si l’on regarde les cas particules, par exemple , on voit qu’il y a jusqu’à 14 cas différents d’accords et à chaque fois jusqu’à 4 sous règles :

1. L'accord du participe passé
1.1. L'accord du participe passé employé sans auxiliaire
1.2. L'accord du participe passé employé avec l'auxiliaire être
1.3. L'accord du participe passé employé avec l'auxiliaire avoir
1.4. L'accord du participe passé suivi d'un verbe à l'infinitif
1.5. L'accord du participe passé fait devant un infinitif
1.6. L'accord du participe passé laissé devant un infinitif
1.7. L'accord du participe passé laissé à, donné à
1.8. L'accord du participe passé précédé de en
1.9. L'accord du participe passé précédé d'un groupe de mots (COD)
1.10. L'accord du participe passé des verbes coûter, valoir, vivre, peser, marcher, courir
1.11. L'accord du participe passé des verbes impersonnels
1.12. L'accord du participe passé des verbes pronominaux
1.13. L'accord du participe passé du verbe bénir
1.14. L'accord du participe passé employé comme préposition

#20052  

https://twitter.com/m_samovar/status/1391102941336121346

L’orthographe comme outil politique de domination

Deux salles deux ambiances, avec le Coréen (le hangeul) :

Quand Sejong le Grand, quatrième roi de la dynastie Yi, accéde au trône, [en 1418 de l’ère commune, ndla] […], seules l’aristocratie et l’administration ont alors assez d’éducation pour apprendre à lire les hanja [les singrammes, ndla], en raison de la complexité de ce système d'écriture (plusieurs dizaines de milliers de caractères). Sejong voit dans cette situation le nœud du problème de l’illettrisme du peuple.

Sejong s’étant entouré de savants spécialistes de divers domaines scientifiques […] il élabore alors le hangeul, […] qu’il dévoile et promulgue le 9 octobre 1446 dans un ouvrage portant le même nom, assez court et rédigé en chinois classique.

Le Hanja est basé sur le chinois (d’où la complexité).
Le hangeul a été mis au point pour être beaucoup plus simple.

C’est un des alphabets les plus simples actuellement et dont l’écriture soit des plus logique / scientifique / mathématique.

On peut l’apprendre et lire phonétiquement le coréen en quelques heures seulement.

Le résultat est sans appel sur son efficacité :

Cette écriture est interdite en 1504 par le successeur de Sejong le Grand, Yeonsangun, et enfin réhabilitée en 18949. Son emploi se généralise après la Seconde Guerre mondiale et permet d’atteindre très rapidement des taux d’alphabétisation parmi les plus élevés du monde à cette époque, dans les deux Corées

Quotes : https://fr.wikipedia.org/wiki/Hangeul

#19923  

https://secouchermoinsbete.fr/86440-l-orthographe-comme-outil-politique-de-domination

Ça y est, « Digital » est officiellement traduit « Numérique »

C’est bien l’un des rares moment où je plussoie leur nouveaux mots.

Peut-être parce que « digital » avait déjà une signification antérieure.
… et que « numérique » n’est pas nouveau.

#19876  

https://www.nextinpact.com/lebrief/46366/ca-y-est-digital-est-officiellement-traduit-numerique

Une "écriture excluante" qui "s’impose par la propagande" : 32 linguistes listent les défauts de l’écriture inclusive

Je n’aime pas non plus cette écriture. Je trouve que c’est un truc pour les feignasses qui ne savent pas écrire « toutes et tous » en toutes lettres. Ah pour les gens qui voient le mal (et le mâle) partout, aussi.

Ici, dans l’article, quelques critiques techniques, pratiques et historiques vis à vis de l’écriture inclusive.

M’enfin, dès la première phrase on peut être sûr d’une chose :

Ce qui est écrit :

Bien que favorables à la féminisation de la langue, plusieurs linguistes estiment l'écriture inclusive profondément problématique.

Ce qui sera lu :

Bien que favorables à la féminisation de la langue, plusieurs linguistes estiment l'écriture inclusive profondément problématique.

Parmi les critiques :
— c’est un faux problème ; aucun texte grammairien n’a jamais dit que le masculin l’emportait. Historiquement ce n’est même pas vrai. Certains mots sont masculins, d’autres féminins, qu’ils renvoient à des hommes, à des femmes ou à des gens qui ne sont ni l’un ni l’autre ;
— jamais la grammaire n’a imposé ses règles. Elle constitue un cadre destiné à ce comprendre, mais c’est l’usage qui fait la langue (ce qui, entre nous, peut comme même posé problème dans serre tain cas) ;
— il n’y a pas une écriture inclusive, il y en a plein. En soit ça peut être résolu, si on avait une autorité sur ça, mais vu l’ouverture d’esprit de ceux qui veulent l’imposer, ça sera aussi efficace que d’imposer Vi ou Emacs comme « LE » logiciel d’édition de texte de référence : ça finira en guerre civile ;
— enfin on parle bien « d’écriture » inclusive. Et pas de « langage inclusif » : c’est impossible à vocaliser.
— plutôt que de regrouper tous les genres sous un pavillon, il les dissocie. Peut-on encore parler d’inclusion dans ce cas là ?

Comme j’ai dit au début : pour moi c’est un truc de feignasse.
Y a déjà des moyens normaux et existants pour régler les problèmes, en particulier l’emploi d’expression neutres :
— au lieu de dire « toutes et tous », dites « tout le monde » ;
— au lieu de dire « ceux et celles », dites « les personnes qui », ou « les gens qui » ;
— au lieu de parler de « droits de l’Homme », dites « droits humains », mais si la majuscule dans le premier cas devrait suffire à distinguer les l’espèce humaine de la moitié mâle de l’humanité ;
— etc.

#19850  

https://www.marianne.net/agora/tribunes-libres/une-ecriture-excluante-qui-s-impose-par-la-propagande-32-linguistes-listent-les?Echobox=1614331479#xtor=CS2-4

Amarsir ou atterrir sur Mars ? - Le Hollandais Volant

Je vois pop plein de posts qui parlent de cette question. Cet article date d’un autre atterrissage sur Mars, mais les explications valent toujours.

#19833  

https://lehollandaisvolant.net/?d=2018/11/26/13/28/48-amarsir-ou-atterrir-sur-mars

Days of the week - Sketchplanations

Dans les langues latines, les jours de la semaine portent le nom des divinités qui sont aussi les planètes ou des astres : de lundi à dimanche, on a donc la Lune, Mars, Mercure, Jupiter, Vénus, Saturne, puis dimanche qui est à part.

Dans les langues germaniques, dont l’anglais, l’allemand et le néerlandais entre-autres, les jours de la semaine viennent pour certains de divinités nordiques et d’autres d’astres. De lundi à dimanche, on a la Lune, Týr, Wodan (Odin), Thor, Frigg, Saturne et le Soleil.

En allemand cependant, le mercredi (Wednesday [EN] / Woensdag [NL]) se dit plutôt Mittwoch, qui signifie simplement « mi-semaine ».

#19753  

https://sketchplanations.com/days-of-the-week

ISO 8601 - Wikipedia

Il s’agit de l’ISO qui définit le format de la date. Pour une notation entièrement décimale, la notation ISO est YYYY-MM-DD, donc 2020-09-30 pour la date de ce jour.

L’avantage :
— année, mois, jours, sont écrit dans l’ordre de grandeur, comme centaine, dizaine, unités.
— ce format est facilement parsable informatiquement
— plusieurs dates triés par ordre chronologique sont également triés par ordre naturel (ie : alphabétique/numéral) sous ce format.
— on peut le limiter à YYYY-MM ou même YYYY simplement en retirant les derniers caractères à chaque fois (pas ceux à la fin ou au milieu). C’est pratique pour ça également.

Ce format est le plus pratique et le plus facile à lire. La même notation avec la barre oblique peut poser problème à cause de la ressemblance avec le chiffre « 1 ». Sauf exceptions d’usage ou d’emploi (tri par jour ou par mois (indépendamment de l’année, et non par date, par exemple) c’est ce format que j’utilise et que je recommande partout.

Et de toute façon, avec n’importe quel lib de parsage de dates, on peut leur fournir ce format (qui est entièrement standardisé) et le ressortir dans n’importe quel format local « mercredi 30 septembre », « mer. 30 sept. », etc.

(Oh et oui, l’abréviation courante pour « septembre » est « sept » et pas « sep » : cette abréviation respecte les règles usuelles d’abréviation en français)

Par contre pour une date+heure, je suis encore partagé entre YYYY-MM-DDTHH:II:SS et le timestamp.

Le dernier a l’avantage d’être plus universellement reconnu par un ordi et d’être un nombre entier (donc on peut ajouter/soustraire très rapidement) : c’est parfait pour l’usage dans une base de données (même si perso, historiquement, j’utilise encore beaucoup le format YYYYMMDDHHIISS…), mais c’est illisible.

Enfin, voici : https://lehollandaisvolant.net/tout/tools/timestamp/
L’autre jour où l’on était passé au timestamp de 1,6e9, j’étais tombé sur un site qui l’affichait aussi… avec un cookiewall, de la pub et des trackers. Ça m’a énervé j’ai pondu ça.

Voyez aussi :
https://lehollandaisvolant.net/tout/tools/progression-calendar/
https://lehollandaisvolant.net/tout/tools/color-second/
https://lehollandaisvolant.net/tout/tools/calendar/
https://lehollandaisvolant.net/tout/tools/dates/

#19607  

https://en.wikipedia.org/wiki/ISO_8601

WTF Fun Fact - Inscriptio Cursus Electronici

Y a donc pire que l’académie française et leur « vidéotox », « divulgâcher » ou « hyperaccéléré » ? :O

#19460  

https://wtffunfact.com/wtf-fun-fact-inscriptio-cursus-electronici/