Machine learning : comment ça marche ?

Le machine learning, ou apprentissage automatique, est la principale technique de l’IA. Il consiste à entraîner des algorithmes à partir de base d’apprentissage pour leur permettre de faire des prédictions ou automatiser des tâches. 

Le machine Learning, c'est quoi ?

Le machine learning ou apprentissage automatique est une sous-discipline de l’intelligence artificielle qui consiste à détecter des tendances au sein d’un historique de connaissances (exemple : le climat) pour en tirer un modèle de prédiction pour l’avenir (ici, la météo). 

machine learning

Quel est l’intérêt du machine learning ?

L’un des principaux intérêt du machine learning est d’automatiser des tâches. Parmi les applications les plus populaires du machine learning figurent la recommandation de produits,  la traduction automatique, les véhicules autonomes ou encore l’aide au diagnostique dans le secteur de la santé.  

Au sein de volumes massifs de données, le machine learning permet également de détecter des tendances cachées, qui ne sont pas décelables via une analyse humaine. 

Qui utilise le machine learning ?

Le machine learning est utilisé dans de très nombreux domaines :

    • L’automobile, avec notamment la voiture autonome,

    •  Les biens consommations, via la recommandation de produits,

    • La finance, via des modèles de prédiction des risques financiers notamment,

    • Le transport, via les applications de calcul d’itinéraires,

    • La santé, via des assistants de diagnostic,

Comment fonctionne le machine learning ?

Le machine learning (ML) fait partie des principales technologies d’intelligence artificielle. Il consiste à entraîner un algorithme à reconnaitre au sein d’une base d’apprentissage des motifs récurrents. Cet entraînement aboutit à un modèle informatique conçu pour faire des prédictions (reconnaître un son, une image…) ou automatiser des tâches (répondre à une question, automatiser la conduite d’un véhicule…).  

Là où un programme traditionnel exécute des instructions, un algorithme de machine learning améliore ses performances au fur et à mesure de son apprentissage, mais aussi au fil de l’évolution du contexte et de réentrainements successifs. Plus on le « nourrit » de données, plus il devient précis.

Pour créer son modèle d’apprentissage, le machine learning emploie des algorithmes statistiques ou encore des réseaux de neurones. Dans les années 2010, le machine learning a atteint un momentum avec l’avènement du big data et la progression des capacités de calcul (et notamment la montée en puissance des GPU). Le big data est en effet indispensable pour entraîner des modèles sur les vastes volumes de données nécessaires au traitement automatique du langage ou à la reconnaissance d’images.

Quelle est la différence entre machine learning et intelligence artificielle ?

L’intelligence artificielle a pour but de simuler l’esprit humain. Partant de là, le machine learning n’est qu’un des outils permettant d’atteindre cet objectif. Il permet à la machine d’ingérer des exemples en fonction d’objectifs à atteindre, par exemple des images ou des vidéos pour reconnaitre un piéton qui traverse dans le cas d’une voiture autonome. Mais cette technique a ses limites. Elle ne permet pas d’exécuter un raisonnement complexe. Il est par conséquent nécessaire de la coupler à d’autres méthodes pour tendre vers une IA digne de ce nom.

Certes très puissants en matière d’apprentissage, les réseaux de neurones ne sont cependant pas complément fiables et peuvent dans certains cas aboutir à des résultats biaisés ou illogiques (exemple : une voiture autonome prenant un rond point dans le mauvais sens). D’où l’intérêt de combiner le deep learning avec d’autres méthodes, une IA symbolique ou système expert par exemple reposant sur des règles métier prédéfinies, le code de la route dans notre exemple, qui seront injectées dans le réseau pour en affiner les capacités de raisonnement. 

C’est quoi un modèle en machine learning ?

Un modèle de machine learning est un fichier qui a été entraîné à partir d’une bases d’apprentissage en vue d’automatiser des tâches, par exemple reconnaitre un émotion au regard d’une expression sur un visage, traduire un texte, proposer des produits en fonction d’un profil d’appétence… Une fois entraîné, le modèle doit être capable de générer des résultats à partir de données (textes, photos) qu’il n’a encore jamais traitées.

Machine learning supervisé vs non-supervisé, quelle différence ?

Côté machine learning supervisé, les données d’entrainement sont préalablement annotées ou étiquetée. Objectif : recourir à une base d’apprentissage représentative qui permette d’aboutir à un modèle capable de généraliser, c’est-à-dire de réaliser ensuite des prédictions correctes sur des données non présentes dans la base d’apprentissage de départ. Dans le domaine de l’apprentissage supervisé, on retrouve les algorithmes de classification, de régression linéaire, de régression logistique, les arbres de décision, ou encore les forêts aléatoires. 

Quant à l’apprentissage non supervisé, il décode les informations de contexte des données d’entrainement et la logique qui en découle, sans recourir à une source de connaissances préétablie. Les données ne sont ni annotées ni étiquetées. Dans cette catégorie, on retrouve les algorithmes de clustering (comme K-means) conçus pour partager les données en groupes similaires.  Ils peuvent permettre par exemple de réaliser des regroupements par typologies de clients, en fonction de caractéristiques de profils, de comportements d’achat similaires…