#18525

Machine Learning is Fun! – Adam Geitgey – Medium

Un article qui explique le principe derrière le machine learning.

Le principe de base est très simple, et en fait, on peut se douter qu’on le retrouve à peu près partout.

Par contre, c’est juste un algorithme tout ce qu’il y a de plus basique : il n’y a aucune intelligence artificielle derrière : juste des math et quelques "if".

Ni le programme ni le programmeur n’ont besoin de savoir comment ça fonctionne : on donne juste des variables en entrée ainsi que les résultats et l’algo nous donne la relation entre ces nombres. Ensuite, pour l’utilisation "en prod", on ne donnera que les variables et le programme nous sort le résultat.

Comme il le dit, c’est comme si on avait ça :

10 5 2 = 4
6  2 4 = 7
6  1 4 = 10

On a les variables à gauche et le résultat à droite, il manque juste les opérations (+, −, ×, ÷) entre les nombres de gauche. C’est ça que l’algo va essayer de déterminer, en essayant sur un grand nombre de données en entrée.

Une fois que l’algo sera entraîné (qu’il aura trouvé la formule qui va bien — ou qui s’en approche suffisamment bien), on peut lui donner juste les variables et il nous donnera le résultat :

5 5 4 = ?

La principale difficultée est :
– trouver les bonnes variables pour un problème donné ;
– avoir suffisamment de données pour entraîner la machine (et être sûr que la formule fonctionne bien). Par exemple, si on a juste ces données là :

2 2 1 = 4

Ce n’est pas assez. Car plusieurs solutions fonctionnent :

2 + 2 ÷ 1 = 4
2 × 2 × 1 = 4
2 × 2 ÷ 1 = 4
(2 × 2) ÷ 1 = 4
(2 + 2) × 1 = 4

Avec assez de données, on élimine les mauvais choix et on affine notre fonction, qui devient alors de plus en précise.

Pour ce qui est de la quantité de données… On comprend maintenant pourquoi les boîtes comme Google ou Facebook veulent absolument avoir le maximum de données possibles.

Plus elle a de données sur les gens, plus elle peut prédire (i.e. trouver la fonction qui va bien) pour savoir où elle va cliquer, ce qu’elle va acheter, ce qu’elle cherche, ce qu’elle veut faire, où elle va se rendre.

Par exemple, si Google détecte (via votre téléphone) qu’il est l’heure de manger, que vous êtes en centre-ville de Paris (via Google Maps) et que vous êtes entre potes (localisation partagée par plusieurs personnes), alors l’application Google mettra en avant les suggestions de restaurants juste à côté de là où vous êtes. Si en plus il sait que vous vous êtes déjà rendu dans un resto tout proche par le passé, et que vous avez laissé une bonne note à ce resto, alors vous pouvez être sûr qu’il vous affichera ce resto là tout en haut.
Et si vous cliquez sur « appeler ce restaurant », il touchera une commission sur la note du restaurant (par le biais d’une publicité que le restaurant aura demandé à Google de placer là : les résultats Google sont meilleurs pour les restos qui payent Google).

Amazon, connaissant les habitudes d’achat de tout le monde, prédit aussi les trucs que vous allez acheter. Si vous avez acheté 2 livres d’une trilogie, il vous suggérera le 3e bouquin. Ou, si vous avez acheté des cartouches d’imprimante en janvier, en mars et en mai, il vous affichera une suggestion d’entre dès le mois de juillet pour le même produit.
Bref, le machine learning est de plus en plus fiable au fur et à mesure que l’on a des données à envoyer dans l’algorithme.

https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471

#18523

File:Notre Dame of Paris back.jpg - Wikimedia Commons

La façade : https://commons.wikimedia.org/wiki/File:Notre_Dame_of_Paris_front.jpg
Vu depuis l’arrière : https://commons.wikimedia.org/wiki/File:Notre_Dame_of_Paris_back.jpg

Suite à la tragédie de cette soirée, je viens de mettre en ligne les 2 photos que j’ai de la cathédrale Notre-Dame.

C’est pas énorme, mais c’est ce que j’ai. Je les ai mis dans le domaine public.
Si vous en avez, je vous encourage à faire pareil. Les photos permettent de ne pas oublier, et puis ça ne coûte rien.

C’est là que ça se passe pour publier des photos : https://commons.wikimedia.org/wiki/Special:UploadWizard

https://commons.wikimedia.org/wiki/File:Notre_Dame_of_Paris_back.jpg

#18522

File:Crookes radiometer and Mendocino rotor.webm - Wikimedia Commons

J’ai uploadé une petite vidéo où je montre deux appareils hors du commun qui produisent du travail mécanique à partir d’énergie solaire.

Il y a le radiomètre de Crookes (voir là) et le moteur de Mendocino. Ce dernier est un rotor à sustentation magnétique recouvert de panneaux photovoltaïques. Le courant produit par les panneaux alimente des bobines qui produisent alors un champ magnétique. Ce dernier est attiré par un aimant ce qui oriente le rotor. En tournant, le panneau éclairé passe dans l’ombre et c’est un autre panneau qui prend le relais, et provoque une nouvelle portion d’un tour, et ainsi de suite.

https://commons.wikimedia.org/wiki/File:Crookes_radiometer_and_Mendocino_rotor.webm

#18519

RSA: Des départements coupent vos allocations en cas d’aides de votre famille

« des parents versent à leurs enfants des petites sommes régulières pour les aider. Elles apparaissent sur leurs relevés bancaires et la CAF les compte comme un revenu supplémentaire. Cela peut avoir des conséquences assez redoutables comme la suppression du RSA »

Tout va bien en Macronie : la chasse aux pauvres est désormais ouverte toute l’année.

http://lavdn.lavoixdunord.fr/567788/article/2019-04-13/des-departements-coupent-vos-allocations-en-cas-d-aides-de-votre-famille

#18518

Kill the Newsletter!

Un site qui transforme les newsletter en flux RSS.

Donnez un nom ; recevez une adresse mail "bidon" + un flux RSS ; inscrivez-vous sur le site avec l’e-mail et donnez le flux RSS à votre agrégateur.

A priori, ça devrait aussi fonctionner sur les réseaux sociaux : inscrivez-vous avec cet adresse, abonnez-vous aux gens que vous voulez, configurez le réseau social pour avoir les nouveaux posts par e-mail, et recevez-les par RSS.

Voilà :)

Bien-sûr, si votre site ne propose pas de flux RSS, commencez par contacter le site et lui demander d’activer ça. Si le site utilise des plateformes comme Tumblr, Wordpress, Blogger, Squarespace… il y a de bonnes chances qu’il existe un flux RSS mais qu’il n’est pas montré : il suffit de le forger et c’est bon.

https://www.kill-the-newsletter.com/

#18516

CCleaner Is Silently Updating Users Who Turned Off Automatic Updates

(date de Septembre 2018)

That’s right: users who opted not to get updates were forced to update so they’d have access to better privacy settings. Those new settings, by the way, default to data collection.

:/

Et c'est pas tout : CCleaner tourne désormais en fond même quand on lui dit de pas le faire.

Je suis pas sûr de continuer à le recommander du coup : https://www.howtogeek.com/361112/heres-what-you-should-use-instead-of-ccleaner/

(merci Michel pour les infos)

https://www.howtogeek.com/fyi/ccleaner-is-silently-updating-users-who-turned-off-automatic-updates/

#18515

Image du trou noir : pourquoi l'avion a été préféré à Internet pour transférer les données - Sciences - Numerama

Une question de sécurité ? Non, non :

Il y avait 5 pétaoctets de données recueillies, soit « plus d’une demi-tonne de disques durs »

:-D

(5 Po = 5 000 000 Go)

ÉDIT : intéressant : voyant tous ces disques, on s’est demandé comment les lire en parallèle : c’est du RAID ?
Du coup j’ai cherché un peu les limites des systèmes de fichiers. En ce qui concernant Ext4, la limite est 1 Tio par fichier, et 1 Eio (2^30 Gio) par partition.
NTFS a à peu près les mêmes limites (16 Eio par partition).

Je n’ai pas trouvé de limite pour le nombre de disques en parallèle. Ça doit plutôt être une limite matérielle, que ces supercalculateurs n’ont probablement pas.

Il reste une question très importante : sous Windows, une fois qu’on a épuisé les C:\, D:\, E:\… Z:\… il se passe quoi ?

La réponse, c’est que le disque devra être monté manuellement dans un dossier vide d’un autre lecteur.
Un peu comme un dropbox-like : on accèdera à la 27e clé USB à partir d’un dossier dans un autre lecteur.

Notez qu’on peut faire ça pour n’importe quelle volume de stockage. C’est d’ailleurs comme ça qu’on sait utiliser un disque dur entier pour C:\Windows et un autre disque dur pour C:\Documents (pratique pour, par exemple, utilise un petit SSD très rapide pour le système et un gros HDD classique, moins rapide, pour les documents ou l’archivage). Totalement comme on fait sous Linux, en fait, avec $mount /dev/disk1 /dossier.

https://www.numerama.com/sciences/480313-image-du-trou-noir-pourquoi-lavion-a-ete-prefere-a-internet-pour-transferer-les-donnees.html

#18514

Éducation nationale : 25 millions d’euros pour accompagner des projets BYOD

BYOD « Bring your own device »

En gros, il sera bientôt demandé… pardon exigé que les élèves apportent leur propres tablettes à l’école.
Ce n’est pas choquant : après tout, on fait ça pour les crayons, les cahiers, le compas et la calculatrice.

Là où ça va être rigolo, c’est quand il faudra utiliser une application de l’école et qu’il y aura des élèves avec Android, ceux avec Android 4 (obsolète), ceux sous iOS, ceux sous Ubuntu (si ça existe encore) et quelques autres.

Un peu comme les profs qui préféraient les calculettes Casio et ceux qui voulaient absolument une TI.

Et on va également rigoler quand :
– le prof devra prêter son propre chargeur (car la moitié de la classe aura oublié le sien)
– le prof devra apprendre aux élèves à se connecter en Wi-Fi (rigolez pas, à part FB et Instagram, les gamins ne savent rien faire)
– que le routeur de la classe sera saturé quand 35 tablettes seront dessus (si c’est pas le routeur, ça sera la connexion)
– on découvrira que l’application installée pour le cours, ben c’est en fait un mouchard…
– … qui prend des photos avec la tablette le soir et les WE (rigolez : c’est possible et ça se ferra)
– le gosse aura une tablette à lui, mais ne pourra l’utiliser car ce n’est pas la marque/modèle approuvée par l’établissement
– … il faudra se procurer le modèle approuvé et qu’il sera en rupture de stock dans tous les magasins de la ville (ben oui : si un prof a 2~3 classes de 35 élèves, ça fait une centaine de tablettes identiques à trouver au même moment). Exactement comme les livres à acheter pour les cours de français : c’est telle édition, tel format, telle préface, sinon c’est mort.

Par contre, les parents qui devront payer une tablette par an (ces truc c’est pas comme une calculatrice graphique : ça ne dure pas toute la vie , ils vont moins rigoler =)

Mais bon, j’imagine que les têtes pensantes de l’enseignement national (les vieux cons qui n’ont plus mis les pieds dans une école depuis l’Empire Romain) ont pensé à ça. D’ailleurs, ils savent que « tablette », de nos jours, ça réfère à un truc style iPad, et pas à un bloc de marbre, hein ?

https://www.nextinpact.com/news/107774-education-nationale-25-millions-deuros-pour-accompagner-projets-byod.htm

#18513

Arrest update - SW1 - Metropolitan Police

Julian Assange, 47, (03.07.71) has today, Thursday 11 April, been arrested by officers from the Metropolitan Police Service (MPS) at the Embassy of Ecuador
http://news.met.police.uk/news/arrest-update-sw1-365526

#18512

D3wGs0BXkAAW_nb (image) - 640x609px

Sérieux... Et après on vient dire que la presse n'est pas orientée ?

https://pbs.twimg.com/media/D3wGs0BXkAAW_nb?format=jpg&name=small