#18525

Machine Learning is Fun! – Adam Geitgey – Medium

Un article qui explique le principe derrière le machine learning.

Le principe de base est très simple, et en fait, on peut se douter qu’on le retrouve à peu près partout.

Par contre, c’est juste un algorithme tout ce qu’il y a de plus basique : il n’y a aucune intelligence artificielle derrière : juste des math et quelques "if".

Ni le programme ni le programmeur n’ont besoin de savoir comment ça fonctionne : on donne juste des variables en entrée ainsi que les résultats et l’algo nous donne la relation entre ces nombres. Ensuite, pour l’utilisation "en prod", on ne donnera que les variables et le programme nous sort le résultat.

Comme il le dit, c’est comme si on avait ça :

10 5 2 = 4
6  2 4 = 7
6  1 4 = 10

On a les variables à gauche et le résultat à droite, il manque juste les opérations (+, −, ×, ÷) entre les nombres de gauche. C’est ça que l’algo va essayer de déterminer, en essayant sur un grand nombre de données en entrée.

Une fois que l’algo sera entraîné (qu’il aura trouvé la formule qui va bien — ou qui s’en approche suffisamment bien), on peut lui donner juste les variables et il nous donnera le résultat :

5 5 4 = ?

La principale difficultée est :
– trouver les bonnes variables pour un problème donné ;
– avoir suffisamment de données pour entraîner la machine (et être sûr que la formule fonctionne bien). Par exemple, si on a juste ces données là :

2 2 1 = 4

Ce n’est pas assez. Car plusieurs solutions fonctionnent :

2 + 2 ÷ 1 = 4
2 × 2 × 1 = 4
2 × 2 ÷ 1 = 4
(2 × 2) ÷ 1 = 4
(2 + 2) × 1 = 4

Avec assez de données, on élimine les mauvais choix et on affine notre fonction, qui devient alors de plus en précise.

Pour ce qui est de la quantité de données… On comprend maintenant pourquoi les boîtes comme Google ou Facebook veulent absolument avoir le maximum de données possibles.

Plus elle a de données sur les gens, plus elle peut prédire (i.e. trouver la fonction qui va bien) pour savoir où elle va cliquer, ce qu’elle va acheter, ce qu’elle cherche, ce qu’elle veut faire, où elle va se rendre.

Par exemple, si Google détecte (via votre téléphone) qu’il est l’heure de manger, que vous êtes en centre-ville de Paris (via Google Maps) et que vous êtes entre potes (localisation partagée par plusieurs personnes), alors l’application Google mettra en avant les suggestions de restaurants juste à côté de là où vous êtes. Si en plus il sait que vous vous êtes déjà rendu dans un resto tout proche par le passé, et que vous avez laissé une bonne note à ce resto, alors vous pouvez être sûr qu’il vous affichera ce resto là tout en haut.
Et si vous cliquez sur « appeler ce restaurant », il touchera une commission sur la note du restaurant (par le biais d’une publicité que le restaurant aura demandé à Google de placer là : les résultats Google sont meilleurs pour les restos qui payent Google).

Amazon, connaissant les habitudes d’achat de tout le monde, prédit aussi les trucs que vous allez acheter. Si vous avez acheté 2 livres d’une trilogie, il vous suggérera le 3e bouquin. Ou, si vous avez acheté des cartouches d’imprimante en janvier, en mars et en mai, il vous affichera une suggestion d’entre dès le mois de juillet pour le même produit.
Bref, le machine learning est de plus en plus fiable au fur et à mesure que l’on a des données à envoyer dans l’algorithme.

https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471