L’apprentissage automatique est une forme d’intelligence artificielle (IA) qui utilise des données pour entraîner un ordinateur à effectuer des tâches. Contrairement à la programmation traditionnelle, dans laquelle les règles sont programmées explicitement, l’apprentissage automatique utilise des algorithmes pour créer automatiquement des ensembles de règles. À un niveau élevé, l’apprentissage automatique est un ensemble de techniques empruntées à de nombreuses disciplines, notamment les statistiques, la théorie des probabilités et les neurosciences, associées à de nouvelles idées dans le but d’obtenir un aperçu des données et du calcul. L’apprentissage automatique est divisé en sous-catégories en fonction de la manière dont les apprenants sont formés et des tâches qu’ils gèrent.
Enseignement supervisé
L’apprentissage supervisé est un type d’apprentissage automatique qui intègre un signal d’apprentissage sous la forme d’étiquettes souvent déterminées par un expert humain. Les étiquettes sont le résultat souhaité d’un apprenant étant donné l’échantillon que nous lui montrons. Pour cette raison, vous pouvez considérer l’apprentissage supervisé comme un apprentissage par l’exemple. Il existe deux types d’apprentissage supervisé à prendre en compte dans Rubix ML.
Classification
Pour les problèmes de classification, un apprenant est formé à différencier les échantillons parmi un ensemble de k classes discrètes possibles. Dans ce type de problème, les étiquettes de formation sont les classes auxquelles appartient chaque échantillon. Des exemples d’étiquettes de classe incluent le chat, le chien, l’homme ou toute autre étiquette catégorielle. Les problèmes de classification incluent la reconnaissance d’image, l’analyse des sentiments du texte et la classification des fleurs d’iris.
Régression
La régression est un problème d’apprentissage qui vise à prédire un résultat à valeur continue. Dans ce cas, les étiquettes d’apprentissage sont des types de données continus tels que des entiers et des nombres à virgule flottante. Les problèmes de régression comprennent l’estimation du prix de vente d’une maison, l’évaluation du crédit et la détermination de l’angle de braquage d’un véhicule autonome.
Apprentissage non supervisé
Une forme d’apprentissage qui ne nécessite pas de données étiquetées est appelée apprentissage non supervisé. Les apprenants non supervisés se concentrent sur la digestion des modèles dans les échantillons uniquement. Il existe trois types d’apprentissage non supervisé offerts dans Rubix ML.
Clustering
Le clustering prend un ensemble de données et attribue à chacun des échantillons un numéro de cluster discret en fonction de sa similitude avec d’autres échantillons de l’ensemble d’apprentissage. Il peut être considéré comme une forme de classification plus faible où les noms de classe sont inconnus. Le clustering permet de regrouper les couleurs, de segmenter les bases de données clients et de découvrir des communautés au sein des réseaux sociaux par exemple.
Détection d’une anomalie
Les anomalies sont définies comme des échantillons qui ont été générés par un processus différent de la normale. Les échantillons peuvent être signalés ou classés en fonction de leur score d’anomalie. La détection d’anomalies est utilisée dans la sécurité de l’information pour la détection d’intrusion et de déni de service, et dans le secteur financier pour détecter la fraude.
Apprentissage du collecteur
L’apprentissage multiple est un type de réduction de dimensionnalité non linéaire non supervisée utilisée pour incorporer des jeux de données dans des représentations d’entités denses. Les intégrateurs peuvent être utilisés pour visualiser des ensembles de données de grande dimension (4 ou plus) dans de faibles dimensions (1 à 3), ou pour compresser les informations dans les échantillons avant leur entrée dans un algorithme d’apprentissage.
L’apprentissage en profondeur
Le Deep Learning est un sous-ensemble de l’apprentissage automatique qui incorpore des couches de calcul qui forment des représentations d’entités de plus en plus complexes. Il s’agit d’un changement de paradigme de l’ingénierie des fonctionnalités au fait de laisser l’apprenant construire ses propres fonctionnalités à partir des données brutes. Le Deep Learning est utilisé dans la reconnaissance d’image, le traitement du langage naturel (PNL) et pour d’autres tâches impliquant des entrées brutes de très haute dimension.
AutoML
L’apprentissage automatique automatisé (AutoML) est l’application d’outils automatisés lors de la conception de modèles d’apprentissage automatique. L’objectif d’AutoML est de simplifier le cycle de vie de l’apprentissage automatique pour les non-experts et de faciliter le prototypage rapide. En outre, AutoML peut aider à la découverte de solutions plus simples et plus précises que celles qui pourraient autrement être découvertes par l’intuition humaine seule. Rubix fournit un certain nombre d’outils pour aider à automatiser le processus d’apprentissage automatique, notamment des optimiseurs d’hyper-paramètres et des sélecteurs de fonctionnalités.
Autres formes de ML
Bien que le cadre d’apprentissage supervisé et non supervisé couvre un nombre substantiel de problèmes, il existe d’autres types d’apprentissage automatique que la bibliothèque ne prend pas en charge par défaut.
Apprentissage par renforcement
L’apprentissage par renforcement (RL) est un type d’apprentissage automatique qui vise à apprendre le contrôle optimal d’un agent dans un environnement grâce à une récompense cumulative. Les données utilisées pour former un apprenant RL sont les états obtenus en exécutant une action puis en observant la réponse. Si l’apprentissage supervisé apprend par l’exemple, alors l’apprentissage par renforcement apprend des erreurs. L’apprentissage par renforcement est utilisé pour entraîner les IA à jouer à des jeux tels que Go, Chess et Starcraft 2, ainsi qu’en robotique pour apprendre des mouvements tels que la marche ou la saisie.
Apprentissage de séquence
L’apprentissage de séquence est un type de ML qui vise à prédire la valeur suivante dans une séquence telle que le mot suivant