Machine learning dites-vous?
Le terme machine learning (apprentissage automatique en français), est un buzz word très utilisé ces derniers temps, et particulièrement dans le monde de l’entreprise. Mais qu’est-ce donc que le machine learning ?
Pour bien comprendre, rien ne vaut une mise en situation. Il est plus que probable qu’au moment où vous lisez ces lignes, vous aurez utilisé le résultat d’algorithmes d’apprentissage automatique plusieurs fois aujourd’hui : votre réseau social habituel vous a peut-être proposé de nouvelles relations potentielles et le moteur de recherche a jugé certaines pages pertinentes pour vous, mais pas pour votre voisin. Vous avez peut-être dicté un message sur votre téléphone portable, ou bien utilisé un logiciel de reconnaissance optique de caractères, lu un article qui vous a été proposé spécifiquement en fonction de vos préférences et qui a peut-être été traduit automatiquement.
Toutes ces actions sont issues du machine learning, c’est-à-dire de la capacité à vous proposer des solutions ou des produits toujours plus adaptés à vos besoins.
Depuis quand cela existe-t-il?
Le machine learning a émergé dans la seconde moitié du XXème siècle, du domaine de l’intelligence artificielle, et correspond à l’élaboration d’algorithmes capables d’accumuler de la connaissance et de l’intelligence à partir d’expériences, sans être humainement guidés au cours de leur apprentissage, ni explicitement programmés pour gérer telle ou telle expérience ou donnée spécifique.
Les premiers travaux remontent aux années 1960 avec Alan Turing1 qui fût un des premiers à contribuer au débat sur la possibilité de l’intelligence artificielle, en proposant notamment le test de Turing2. Puis les travaux d’Arthur Samuel3 et Tom M. Mitchel4 ont permis d’ouvrir la voie aux apprentissages des ordinateurs sans qu’ils soient explicitement programmés. Dans les années 1990, le mathématicien russe Vladmir Vapnik5 a fait avancer les travaux de recherche en formalisant « la théorie scientifique de l’apprentissage ».
Ainsi, le machine learning s’est petit à petit construit comme un champ d’étude de l’intelligence artificielle et concerne actuellement la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine (au sens large) « d’évoluer » par un processus systématique, et ainsi de remplir des tâches difficiles ou impossibles à remplir par des moyens algorithmiques plus classiques. Le machine learning n’est donc pas nouveau (plusieurs décennies de recherches) mais le concept connaît un engouement ces dernières années qui n’est pas déconnecté de l’essor du Big Data6.
Machine learning et Big Data
Au-delà du buzz médiatique dont il fait l’objet, le Big Data est un sujet stratégique majeur, au cœur d’enjeux économiques et sociétaux considérables. Son impact est désormais perçu dans presque tous les secteurs de l’activité humaine : de la recherche scientifique à la médecine en passant, entre autres, par la finance, le bâtiment, l’e-commerce, la défense ou les transports.
Les avancées technologiques, l’omniprésence des capteurs (systèmes embarqués, objets connectés, internet …) et l’explosion des réseaux sociaux s’accompagnent d’un véritable déluge de données. Dans ce contexte, le duo Big Data et machine learning va permettre aux entreprises de créer, sans l’ombre d’un doute, de la valeur ajoutée grâce à leurs données. Pourquoi ? Parce qu’au-delà de la collecte et du stockage des données, le principal enjeu est de pouvoir analyser et valoriser la donnée afin d’optimiser les décisions et mettre au point de nouvelles applications, toujours plus performantes : maintenance prédictive dans les réseaux et transports, ciblage commercial, biométrie…
En effet, la variété des données aujourd’hui disponibles (nombres, images, textes, signaux), leur grande dimension et leur volumétrie rendent souvent inopérantes les méthodes statistiques traditionnelles reposant sur le prétraitement humain et demandent un long travail de modélisation.
Le machine learning vise donc à élaborer et à étudier des algorithmes, à vocation prédictive le plus souvent, permettant à des machines d’apprendre automatiquement à partir des données et à effectuer des tâches de plus en plus complexes de façon performante. Il s’agit de révéler l’information cachée dans les données. Dans ce contexte, l’utilisation conjointe de quantités massives d’informations et d’algorithmes d’apprentissage rend possible la solution de problèmes considérés il y a peu comme inaccessibles.
Les applications pratiques du machine learning
Le machine learning est devenu une matière enseignée dans de nombreux cursus universitaires. Son champ d’application augmente de jour en jour : dès qu’un domaine dispose de données, la question de l’utilisation de celles-ci pour améliorer les algorithmes du domaine se pose systématiquement.
Les premières applications pratiques du machine learning ont concerné la reconnaissance de formes qui a engendré des applications dans la biométrie, la reconnaissance faciale ou de caractères manuscrits. La transmission des images et vidéos sur Internet a également été une des applications originelle du machine learning.
A l’heure actuelle le machine learning est utilisé pour doter des ordinateurs ou des machines de systèmes de :
- Perception de leur environnement : vision, reconnaissance d’objets (visages, schémas, langages naturels, écriture, formes syntaxiques, etc.) ;
- Moteurs de recherche ;
- Aide aux diagnostics, médical notamment, bio-informatique, chémoinformatique7 ; interfaces cerveau-machine ;
- Détection de fraudes à la carte de crédit ;
- Analyse financière, dont analyse du marché boursier ;
- Classification des séquences d’ADN (code génétique) ;
- Sites web adaptatifs ou mieux adaptés ;
- Locomotion de robots ;
- Analyse prédictive en matière juridique et judiciaire.
A titre d’exemple, dans le secteur aérien, la maintenance prédictive fait appel au machine learning qui analyse les milliers de rapports de vol de la totalité d’une flotte pour en déduire les priorités de maintenance. En e-commerce, une recommandation personnalisée pour chacun des dizaines de milliers d’utilisateurs d’un site se base sur l’analyse de centaines de milliers de produits. Dans la finance, des milliers d’informations sont scannées chaque seconde, ce qui permet de détecter une anomalie parmi des millions d’instructions dans les flux monétaires.
Conclusion
Les possibilités du machine learning pour l’avenir sont quasiment illimitées. Grâce à cette technologie, nous pourrons bénéficier de soins personnalisés en fonction de notre code génétique et de notre style de vie. Les programmes de sécurité informatique pourront aisément détecter les malwares, les virus et les attaques. La sécurité civile pourra être pilotée par des ordinateurs capables de prédire qui représente une menace dans un lieu public (stade, aéroport). Par ailleurs, la détection de fraude dans les secteurs de la finance et des assurances permettra d’économiser beaucoup d’argent. Très prochainement, un traducteur intégré au téléphone pourrait permettre à l’interlocuteur de recevoir le discours dans une autre langue de manière instantanée.
Cette technologie risque également de transformer le monde du travail à l’échelle mondiale. Ses algorithmes vont permettre de faciliter le travail de nombreuses personnes, mais risque de rendre également certains métiers obsolètes. En effet, le machine learning peut désormais répondre à nos emails, interpréter des images médicales, explorer les textes de loi, analyser les données et bien plus encore. Au total, sur les 5 prochaines années, 5 millions d’emplois pourraient disparaître au profit des ordinateurs et des robots.
Ainsi, quel que soit le métier, il est important de vérifier la manière donc le Machine Learning risque d’affecter le secteur, l’entreprise et l’emploi. Pour ne pas être pris au dépourvu, mieux vaut s’informer et se préparer à ce bouleversement majeur.
Contacts : Vincent Weber · Pascal Bally
[1] voir : https://fr.wikipedia.org/wiki/Alan_Turing
[2] voir : https://sites.google.com/site/int3llig3nc3artifici3ll3/le-test-de-turing
[3] voir : https://fr.wikipedia.org/wiki/Arthur_Samuel
[4] voir : https://en.wikipedia.org/wiki/Tom_M._Mitchell
[5] voir : https://fr.wikipedia.org/wiki/Vladimir_Vapnik
[6] voir notre article : https://www.inneance.fr/les-big-data-avenir-et-enjeux/
[7] Domaine de la science qui consiste en l’application de l’informatique aux problèmes relatifs à la chimie. Elle a pour objectif de fournir des outils et des méthodes pour l’analyse et le traitement des données issues des différents domaines de la chimie.