Laurence Devillers
L'intelligence artificielle (IA) a pour objectif de simuler des capacités cognitives comme la perception, l'aide à la décision et la génération. Les systèmes d'IA, qui sont fondés sur des techniques d'apprentissage machine, génèrent des modèles exprimant des corrélations statistiques entre les éléments des données utilisées pour leur entraînement. Les représentations internes de ces modèles sont difficiles à interpréter pour les humains. Deux types majeurs d'algorithmes d'IA existent : les systèmes d'IA prédictive et d'IA générative. Un système d'IA prédictive sert à reconnaître des formes. Il est entraîné sur des données existantes et les utilise pour classer de nouvelles données. Pour l'entraîner, l'ingénieur écrit un programme qui implémente un modèle, par exemple, de réseau de neurones. Les paramètres du modèle, les poids du réseau de neurones, sont initialement définis de manière aléatoire. Pendant la phase d'apprentissage, ils sont ajustés en fonction des données d'entraînement fournies pour minimiser l'erreur entre les prédictions et les valeurs cibles. Cela permet à une IA d'apprendre à partir de grandes quantités de données, bien au-delà de ce qu'un cerveau humain pourrait traiter. Ces IA peuvent résoudre des problèmes complexes, comme la détection précoce de tumeur cancéreuse dans des radios. Cet apprentissage laborieux n'a en tout cas rien à voir avec la façon dont un enfant apprend très rapidement, par exemple en touchant ou en goûtant.
Les systèmes d'IA générative, eux, répondent à des invites (« prompts ») en produisant de nouvelles données, par exemple la séquence de mots la plus probable après le prompt, à partir de caractéristiques communes apprises sur la base d'un grand corpus de données textuelles. Ils se servent de modèles de fondation permettant de produire un résultat présentant un certain degré de similarité avec les données d'apprentissage. Un modèle de fondation est un modèle de grande taille fondé sur une architecture de réseau de neurones profond, entraîné par apprentissage autosupervisé sur une grande quantité de données non annotées. Ces systèmes utilisent l'hypothèse distributionnelle, qui stipule que le sens d'un mot peut être déduit de son contexte, c'est-à-dire des mots voisins. Les entités du modèle de fondation peuvent être des suites de caractères ou des mots. Le modèle génératif apprend à prédire l'entité suivante dans une phrase, puis la suivante, etc., un peu comme la fonction de complétion automatique sur un clavier. Le système ne manipule aucun concept abstrait ni logique et n'a aucune compréhension des entités manipulées. Les IA génératives ne distinguent ainsi pas ce qui est possible de ce qui est impossible, ni le vrai du faux. Elles peuvent produire des sorties combinant des assertions vraies et des fausses, des résultats inattendus ou conduire à des émergences de comportements. La vérification n'est pas aisée, d'autant que le modèle de fondation ne produit aucune référence aux sources et que les résultats produits sont souvent indiscernables de ceux produits par un humain. Il est donc nécessaire de les vérifier.
Comments