
Le chercheur Yann LeCun n’annonce pas la fin des grands modèles de langage. Il dit plutôt qu’ils ne suffiront pas. Dans une longue entrevue consacrée à l’avenir de l’intelligence artificielle, le récipiendaire du prix Turing et figure majeure du domaine, défend une thèse qui tranche avec l’enthousiasme dominant autour des LLM : ces modèles sont utiles, puissants et déjà très présents dans les produits numériques, mais ils ne constituent pas, selon lui, le chemin vers une intelligence humaine, ni même vers une intelligence comparable à celle des animaux.
Son argument central tient en une distinction simple. Les grands modèles de langage manipulent très bien les mots, le code, les mathématiques ou les textes juridiques. Ils excellent dans les domaines où le langage lui-même sert de support au raisonnement. Mais le monde réel, lui, ne fonctionne pas comme une suite de mots à prédire. Il est continu, bruité, physique, incertain, rempli de situations impossibles à réduire à une simple séquence de jetons. Pour LeCun, c’est là que se trouve la prochaine frontière de l’intelligence artificielle.
Cette conviction est au cœur d’AMI, pour Advanced Machine Intelligence, la nouvelle entreprise qu’il a lancée après son départ de Meta. Le slogan qu’il revendique, « AI for the real world », résume l’ambition : créer des systèmes capables de comprendre le monde physique, d’anticiper les conséquences de leurs actions et de planifier. LeCun ne cherche donc pas seulement à améliorer les robots conversationnels. Il veut construire des systèmes capables d’agir dans des environnements complexes, de la robotique à l’industrie, en passant par la santé.
La notion clé est celle de « world model », ou modèle du monde. Pour LeCun, un système intelligent doit pouvoir prévoir ce qui arrivera s’il agit d’une certaine façon. Cette capacité est indispensable pour planifier une séquence d’actions et atteindre un objectif. Il donne un exemple concret : une bouteille d’eau posée sur une table. Si on la pousse près de sa base, elle glissera probablement. Si on la pousse près du haut, elle risque de basculer. Un humain n’a pas besoin de prédire chaque pixel de la scène pour comprendre ce qui va se passer. Il raisonne à un niveau abstrait.
C’est précisément ce que LeCun reproche aux approches génératives classiques appliquées au réel. Elles cherchent souvent à reconstruire ou produire des données détaillées, comme des images ou des vidéos, alors que l’intelligence humaine travaille plutôt avec des représentations abstraites. D’où son intérêt pour l’architecture JEPA, pour Joint Embedding Predictive Architecture, une approche qui tente de prédire des représentations internes plutôt que des pixels. Dans cette logique, l’IA n’essaie pas de reproduire le monde image par image. Elle apprend à comprendre ce qui compte vraiment pour agir.
Cette critique vise aussi les modèles vision-langage-action utilisés en robotique. LeCun estime que ces systèmes, souvent entraînés par imitation à partir d’énormes quantités de données, restent fragiles et peu généralisables. Ils peuvent impressionner dans des démonstrations contrôlées, mais ils exigent beaucoup trop d’exemples pour apprendre chaque nouvelle tâche. À ses yeux, un robot réellement intelligent devrait pouvoir résoudre une tâche nouvelle sans avoir été explicitement entraîné à la réaliser, comme un adolescent qui apprend à conduire en quelques heures, alors que les voitures autonomes n’ont toujours pas atteint une autonomie complète malgré des millions d’heures de données.
Cette différence de vision explique aussi son départ de Meta. LeCun affirme que l’entreprise a progressivement recentré ses efforts sur les grands modèles de langage, notamment après les difficultés rencontrées avec Llama 4 et la volonté de rattraper les concurrents. Même si certains dirigeants, dont Mark Zuckerberg et Andrew Bosworth, auraient soutenu ses recherches sur les modèles du monde, l’organisation interne ne lui semblait plus adaptée à une recherche exploratoire de long terme. Les applications qu’il vise, robotique, industrie, santé, contrôle de procédés complexes, ne correspondaient plus vraiment aux priorités immédiates de Meta.
LeCun décrit d’ailleurs une tension plus large dans l’industrie. Les grands laboratoires technologiques sont pris dans une course à court terme : publier de nouveaux modèles, améliorer les performances, soutenir des produits commerciaux. Dans ce contexte, la recherche fondamentale devient plus difficile à protéger. Il défend l’idée qu’une vraie percée exige de recruter les meilleurs chercheurs, de leur donner les moyens nécessaires et de ne pas les enfermer dans des objectifs trop immédiats. C’est, selon lui, ce qui avait fait la force de FAIR, le laboratoire d’intelligence artificielle de Meta qu’il a contribué à bâtir.
Son regard sur les LLM reste nuancé, mais sévère. Il reconnaît leur utilité pour la programmation, les mathématiques ou l’accès à l’information. Il estime cependant qu’ils ne sont pas des architectes logiciels, des scientifiques ou des médecins au sens complet du terme. Ils peuvent aider, accélérer, reformuler, coder, mais ils ne disposent pas d’un modèle fiable du monde. LeCun va jusqu’à dire que les LLM sont intrinsèquement peu sûrs lorsqu’ils deviennent agentiques, parce qu’ils peuvent produire des actions sans comprendre pleinement leurs conséquences.
À ses yeux, la sécurité passera plutôt par une IA « objective driven », guidée par des objectifs et des contraintes explicites. Un tel système utiliserait un modèle du monde pour évaluer les conséquences possibles de ses actions, puis choisirait une séquence qui minimise un coût ou respecte certaines contraintes. Cela ne supprimerait pas toutes les erreurs, prévient-il, car le modèle du monde ou la fonction d’objectif pourraient être imparfaits. Mais l’approche serait, selon lui, plus robuste que des systèmes qui improvisent leur sortie mot après mot.
L’entrevue aborde aussi un autre projet, Tapestry, où LeCun défend une idée de souveraineté numérique appliquée à l’IA. Son inquiétude est claire : si les assistants intelligents deviennent l’interface principale de notre accès à l’information, il serait problématique que la majorité des modèles soient conçus en Californie ou en Chine. Les langues, les cultures, les valeurs et les réalités politiques du reste du monde risqueraient d’être mal représentées. Il plaide donc pour des modèles ouverts, entraînés de façon collaborative, avec des contributions locales qui ne nécessitent pas de partager directement les données sensibles.
Cette vision rejoint un débat de plus en plus présent en Europe, en Inde, au Japon, en Afrique et ailleurs : comment éviter que l’intelligence artificielle devienne une infrastructure contrôlée par quelques entreprises américaines ou chinoises ? LeCun compare cette évolution possible à celle de Linux. Les plateformes propriétaires dominantes des années 1990 ont été largement remplacées par une infrastructure ouverte devenue incontournable. Il croit qu’un mouvement similaire pourrait se produire avec l’IA.
Reste que sa thèse demeure un pari. LeCun reconnaît que les modèles du monde n’ont pas encore produit l’équivalent commercial et spectaculaire des grands modèles de langage. Il avance toutefois que les signes deviennent visibles, notamment dans la recherche sur la vidéo, la robotique et les systèmes auto-supervisés. Il prévoit que la nécessité d’un changement de paradigme deviendra évidente pour une grande partie du secteur d’ici 2027, même si les solutions pleinement opérationnelles prendront plus de temps.
L’intérêt de cette entrevue tient précisément à ce décalage. Au moment où une large partie de l’industrie concentre ses ressources sur l’amélioration des LLM, Yann LeCun rappelle que l’intelligence ne se limite pas à produire du texte crédible. Comprendre le monde, prévoir, planifier, agir avec fiabilité, apprendre avec peu de données : voilà, selon lui, les vrais défis. Les LLM ont peut-être ouvert une étape majeure de l’intelligence artificielle. Mais pour LeCun, la prochaine révolution ne viendra pas d’un modèle qui parle mieux. Elle viendra d’un système qui comprend enfin ce qu’il fait.
Source :
*****
Du lundi au vendredi, Bruno Guglielminetti vous propose un regard sur l’essentiel de l’actualité numérique avec 120 secondes de Tech.
Ou encore…
Écoutez la plus récente édition de Mon Carnet,
le magazine hebdomadaire de l’actualité numérique.
En savoir plus sur Mon Carnet
Subscribe to get the latest posts sent to your email.

