Elisa Fromont et les défis de l'intelligence artificielle

Comment faciliter l'apprentissage automatique quand les exemples d'apprentissage manquent ? Ou quand ces données sont impossibles à relier dans l'espace ? Arrivée en septembre 2017 comme professeur d'informatique à l'Université de Rennes 1, Elisa Fromont s'attelle à résoudre ces difficultés. Ses recherches, menées à l'IRISA, portent sur l'intelligence artificielle (IA) en général et l'apprentissage automatique en particulier. L'occasion de poser quelques jalons pour mieux comprendre cette technologie aux implications majeures.

Triptyque de J. Bosch (détail) interprété par un réseau de neurones artificiels © K. McDonald / A. Mordvintsev, C. Olah, M. Tyka
  1. Intelligence artificielle (IA) : forte ou faible ?
  2. Qu’est-ce que l’apprentissage automatique ?
  3. Au cœur de l'apprentissage automatique : une grande variété de modèles
  4. Apprendre par l'exemple
  5. Les défis de l'apprentissage profond
  6. Un parcours
  7. Un conseil pour son orientation ?

Intelligence artificielle (IA) : forte ou faible ?

Élisa Fromont - Professeur d'informatique à l'Université de Rennes 1, membre de l'Institut de recherche en informatique et systèmes aléatoires (IRISA) - © UR1/DirCom/JLB

"Il faut distinguer l'intelligence artificielle forte, générale ou universelle (qui serait polyvalente, voire consciente d'elle-même), et l'intelligence artificielle "faible" ou "étroite" (spécialisée dans une tâche précise, sans conscience d'elle-même). Seule l’IA « faible » existe réellement de nos jours alors que l’IA « forte », outre le fait qu’une telle entité n’est peut-être pas souhaitable, est encore hors de portée", précise Elisa Fromont.

Quoi qu'il en soit, les spécialistes s'accordent à dire que les développements de l'IA faible sont déjà à l'origine de forts impacts sur nos sociétés, ces impacts étant appelés à s'amplifier de manière exponentielle.

Aujourd'hui, il existe des milliers d'IA faibles, ponctuellement performantes sur des tâches particulières, en particulier la classification automatique d'images et de photos, la représentation de connaissances issues du web, la planification d’actions, le raisonnement automatique à partir de texte, la traduction automatique, la reconnaissance et la synthèse de la voix ou la capacité de jouer à des jeux abstraits tels que les échecs ou le go. Les chercheurs en IA travaillent depuis plusieurs décennies sur ces sujets et ils obtiennent actuellement, pour certains, des résultats spectaculaires qui mettent ce sujet sur le devant de la scène.

Parmi toutes les thématiques liées à l'IA, Elisa Fromont travaille sur l'apprentissage automatique. C'est un ensemble de méthodes qui consistent à construire des modèles à partir d'exemples. Ce sont ces méthodes d’apprentissage automatique qui permettent de supprimer automatiquement une partie des courriels indésirables, (ce fameux « spam » qui représente aujourd’hui près de 60% du trafic mondial de courriels). Ces mêmes méthodes permettent aux opérateurs du réseau d'alimentation électrique d’anticiper la consommation de la population, à Météo-France de prédire le temps qu’il fera demain, à La Poste de trier automatiquement une partie du courrier, etc.

IA et météo - Reconnaissance visuelle par apprentissage profond, appliquée à la détection d'événements météorologiques extrêmes. - © U.S. Dpt of Energy / Berkeley Lab

Qu’est-ce que l’apprentissage automatique ?

Comment un être l’humain sait-il reconnaître qu’un objet est une chaise ? C’est parce qu’il a vu, depuis son enfance, énormément d’exemples de cet objet ; souvent, ces chaises lui ont été présentées par une personne qui lui désignait l’objet, tout en énonçant le mot « chaise ». L’enfant humain apprend donc progressivement ce qu'est une chaise-type (paradigme) avec ses quatre pieds, son siège, son dossier ; dans le même temps, il prend conscience des contextes dans lesquels il va la trouver.

"L’apprentissage automatique vise ainsi à faire apprendre à une machine une représentation interne (un modèle) d’un objet (par exemple une chaise) qui lui permettra de pouvoir reconnaître automatiquement cet objet, comme le ferait un humain, dans n’importe quel contexte adéquat", explique Elisa Fromont.

Au cœur de l'apprentissage automatique : une grande variété de modèles

Pour parvenir à faire différencier à une IA un catalogue (des classes) d'objets donnés, par exemple du texte, des images, des séquences génétiques… on utilise une fonction mathématique, ou modèle, dont on peut connaître à l'avance la forme (une droite, un arbre, une sphère...).

Le processus d’apprentissage va consister à apprendre les paramètres de ce modèle. Le plus simple des modèles est l’équation de la droite « y = ax+b » que l’on "apprend" en faisant une régression linéaire. Dans ce cas, les paramètres à apprendre sont le coefficient directeur (la pente) a et l’ordonnée à l’origine (position) b de la droite.

Imaginons que l'on décrive une maison en fonction de sa surface, sachant que son prix de vente est connu. Ensuite, on constitue un catalogue de maisons ainsi documentées, toutes pourvues d'une étiquette prix connue, par exemple à partir d'une base de données de petites annonces. On représente chacune de ces maisons sur un diagramme, et on cherche à faire construire à l'ordinateur une droite les reliant toutes. Une telle droite serait, capable d'aider à prédire le prix d'autres maisons. Le processus d’apprentissage consiste ensuite à entraîner le système en vérifiant ses prévisions, et à corriger la position et la pente de la droite pour que son tracé engendre le moins d'erreur possible.

Un modèle analogue peut être également utilisé pour réaliser des classements, quand il est possible de faire passer une droite entre deux catégories d'objets à différencier.

Catégoriser des données - Calcul de fonction non séparables linéairement dans un espace de plus grande dimension, qui rend la séparation linéaire possible. - © Alisneaky - CC

Un autre modèle couramment utilisé est celui des arbres de décisions. Le processus d’apprentissage va cette fois déterminer quelles sont les meilleures questions à poser à chaque nœud de l’arbre, et dans quel ordre, pour pouvoir réaliser une prédiction précise. Cette manière de procéder est celle pratiquée, entre autres, dans bien des jeux d'enfants de type "Qui est-ce ?" qui consiste à créer le meilleur enchaînement de questions pour démasquer un personnage mystère.

Parmi tous les modèles utilisables en apprentissage automatique, l'un des plus en vogue, mais aussi l’un des plus complexe, est le réseau de neurones. Un tel réseau met en œuvre une combinaison de fonctions mathématiques permettant de résoudre par exemple des problèmes où de simples droites ne suffisent pas pour départager les catégories.

Apprendre par l'exemple

Si l’apprentissage des paramètres d’une droite ne demande d’estimer que 2 paramètres (a et b précédemment cités), l’apprentissage des paramètres d’un réseau de neurones est autrement plus complexe, le nombre de paramètres pouvant se compter en millions. La seule manière d’estimer correctement autant de paramètres est de disposer d’un très grand nombre d’exemples d’apprentissage, c’est à dire d’exemples pour lesquels on connaît déjà le résultat attendu (par exemple le nom de l’objet sur l’image).

Ainsi, les progrès fulgurants accomplis en classifications d’images ces dernières années tiennent initialement à la mise en ligne de bases de données d'entraînement pour ces réseaux, telle ImageNet, dont les quelque 15 millions d'images ont été annotées et vérifiées à la main pour constituer un corpus d'exemples fiables. Bien entraîné, un réseau de neurones devient suffisamment robuste pour pouvoir prédire le concept-cible (par exemple le nom de l’objet dans l’image), et ce sur de nouveaux exemples avec une précision très importante  : le réseau ne se trompe plus que rarement d'objet.

"Aujourd'hui, un réseau de neurone spécialisé dans la reconnaissance d'images compte plusieurs dizaines de couches de neurones, les premières étant consacrées à la reconnaissance de formes simples (ovales des yeux, motifs, textures). Ces premières couches dégrossissent le travail pour autres, plus profondes, le deuxième grand niveau du réseau étant consacrée à la classification. Pour qualifier cet empilement, on parle de "deep learning", ou d’"apprentissage profond"," détaille Elisa Fromont.

Les chercheurs font preuve de beaucoup d’ingéniosité pour pouvoir générer à bas coût des ensembles d’exemples étiquetés en nombre suffisant pour pouvoir entraîner leurs réseaux de neurones.

C’est ce dont a bénéficié AlphaGoZero, une IA basée sur un réseau de neurones et développée par Google Deepmind. Ses concepteurs l'ont entraînée à jouer au go en disputant des milliers de parties contre elle-même. L’IA ainsi entraînée a pu développer des stratégies surprenantes ; d'après ses concepteurs, elle est devenue en quelques jours, et sans entraînement face à des joueurs humains, la meilleure joueuse de Go au monde. Des succès comparables ont été obtenus sur des jeux comme les échecs et le shogi (échecs japonais).

IA et jeu de go - AlphaGo, prédécesseur d'AlphaGo Zero, utilisait encore des données issues de parties réalisées par des êtres humains pour s'entraîner. - © Buster Benson

Les défis de l'apprentissage profond

Les recherches d'Elisa Fromont s'attellent aux difficultés fondamentales que rencontrent les méthodes d’apprentisssage automatique en général et les réseaux de neurones profonds (deep learning) en particulier.

La thèse de la professeure, préparée à l’IRISA en collaboration avec le LTSI et le CHU de Rennes, portait sur la reconnaissance de signaux cardiaques anormaux (arythmies). Or, si les exemples d'électrocardiogrammes (ECG) normaux sont très nombreux, en revanche il existe trop peu d’exemples de signaux anormaux disponibles pour l'analyse : ils ne suffisent pas à entraîner un réseau de neurones de manière performante. La résolution de ce problème à fort enjeu est bien entendu  cruciale.

De même, l’apprentissage profond ou deep learning ne fonctionne pas très bien sur des jeux de données où il n’existe pas de motifs récurrents, susceptibles d’être capturés et dégrossis par les premières couches du réseau, spécialisées dans l’analyse de formes (la « convolution »). Un tracé d'ECG, une image, se prêtent bien à cette opération. Ce n'est pas forcément le cas d'autres données telles que des jeux de transaction bancaires, des molécules représentées en 3D, des séquences génétiques, des traces laissées par des envois de messages dans un réseau, etc. Pour toutes ces données, d’autres modèles et d’autres types d’algorithmes doivent être développés.

Enfin, des problèmes de recherche se posent également lorsqu'un réseau de neurones est entraîné à faire des prédictions pour un monde donné, et que les règles de ce monde ayant changé, le modèle initial n'est plus pertinent. C'est ce qui arrive quand on apprend à une IA à évaluer une situation à risque liée à la configuration de remontées mécaniques dans une station de ski, et qu’il faut l’utiliser cette IA dans une autre station, au paysage très différent. La même difficulté survient quand les données proviennent de plusieurs sources hétérogènes et difficilement comparables.  
 

Projet MIVAO - Reconnaissance visuelle appliquée à la sécurité des remontées mécaniques - © Projet MIVAO

Ces problématiques majeures « d’adaptation de domaine », « d’apprentissage multi-source », « d’apprentissage de représentations pertinentes communes » constituent le cœur des travaux de recherche actuel d'Elisa Fromont. Trouver des solutions à ces problèmes passe par le développement de nouveaux algorithmes, autrement dit de nouvelles méthodes d’apprentissage, ou bien par l’adaptation des méthodes existantes à de nouveaux contextes.

Adaptation de domaine - © Emilie Morvant via Wikimedia Commons

Un parcours

« Rennaise, j’ai poursuivi mses études à Saint Brieuc puis à Rennes jusqu'au doctorat », se souvient Elisa Fromont. « Après un contrat post-doctoral de deux ans et demi à Leuven en Belgique, j’ai été recrutée comme maître de conférences à Saint-Étienne où j’ai travaillé pendant neuf ans, avant de revenir à Rennes 1 comme professeur ».

À l'IRISA, Elisa Fromont est membre de LACODAM (équipe de recherche commune IRISA/Inria) spécialisée dans l'analyse collaborative de données à grande échelle. Dans son équipe, elle apprécie de travailler sur la conception des algorithmes, en amont de leur utilisation. Les demandes des industriels sont nombreuses :

  • analyse de séries temporelles concernant la (consommation électrique, les données provenant du domaine agronomique (santé des troupeaux, analyse de l’eau, optimisation de la gestion des prairies), données médicales, vidéos, …
  • surveillance de transactions bancaires, qui s'analysent elles aussi comme des flux de données. L'objectif est de repérer les anomalies pour détecter les fraudes ;
  • dans le cas d'un parc de voitures en libre-service, prédire où les véhicules seront trop nombreux, où il faudra les déplacer pour optimiser leur disponibilité.

Un conseil pour son orientation ?

Élève ou étudiant.e, si vous recherchez une formation qui vous conduirait à travailler sur l'intelligence artificielle, je vous conseille de vous orienter vers l'informatique, mais sans jamais perdre les mathématiques de vue. La conjonction des deux disciplines est indispensable pour travailler en apprentissage automatique, précise Elisa Fromont.