Comment l’IA apprend : comme un enfant, mais en 1000x plus vite

Quand un bébé apprend à parler, personne lui donne un dictionnaire. Il écoute les gens autour de lui, reconnaît des patterns, et commence à reproduire des sons. « Ma-ma ». « Pa-pa ». « Non! » (celui-là, il l’apprend vite.)

L’IA apprend de la même façon. Sauf qu’au lieu d’écouter sa famille pendant 3 ans, elle analyse des milliards de textes en quelques semaines. Et au lieu de dire « ma-ma », elle dit « La mitochondrie est la centrale énergétique de la cellule. »

L’entraînement : la garderie de l’IA

Quand on « entraîne » une IA, on lui montre des tonnes de données. Pour un modèle de langage comme ChatGPT, ces données c’est du texte : des livres, des sites web, des articles, des forums. Des milliards et des milliards de mots.

Le modèle regarde ces textes et apprend à prédire : quel mot vient après quel mot? Si tu vois « Le chat est assis sur le ___ », le mot « tapis » est plus probable que « volcan ». Le modèle apprend ces probabilités à force de voir des millions d’exemples.

C’est pas plus compliqué que ça. L’IA est un prédicteur de mots glorifié. Mais quand tu fais ça à l’échelle de centaines de milliards de mots, quelque chose d’étonnant émerge : le modèle commence à « comprendre » la grammaire, les faits, la logique, le style — sans qu’on lui ait enseigné aucun de ces concepts explicitement.

Les erreurs font l’apprentissage

Comme un enfant, l’IA apprend par essais et erreurs. Au début de l’entraînement, ses prédictions sont complètement aléatoires. Du charabia. Puis, à chaque erreur, on ajuste ses paramètres un tout petit peu. Après des milliards d’ajustements, les prédictions deviennent bonnes.

C’est comme apprendre à lancer un ballon de basket. Les premiers lancers sont n’importe où. Mais à chaque lancer, ton cerveau ajuste un peu l’angle, la force, le poignet. Après des milliers de lancers, tu mets des paniers les yeux fermés.

La différence? L’IA fait des milliards de « lancers » par jour. C’est pour ça que ça prend des semaines au lieu d’années.

La grande différence avec les humains

Un enfant apprend le langage avec quelques milliers d’heures de conversation. ChatGPT a eu besoin de l’équivalent de millions d’années de lecture. L’IA est rapide en temps de calcul, mais incroyablement inefficace comparée au cerveau humain.

Et surtout, un enfant apprend dans un contexte. Il sait que « chaud » ça brûle parce qu’il a touché le poêle. L’IA sait que « chaud » et « brûlure » apparaissent souvent dans les mêmes phrases, mais elle a jamais eu mal.

C’est cette différence-là qui explique pourquoi l’IA peut écrire un poème sur la douleur sans avoir jamais souffert. Elle connaît les mots de la douleur. Pas l’expérience.

Pourquoi c’est important de le savoir

Comprendre comment l’IA apprend, ça change comment tu l’utilises. Tu sais que ses réponses sont basées sur des patterns statistiques, pas sur une compréhension profonde. Tu sais qu’elle est bonne pour les sujets bien documentés et poche pour les sujets obscurs. Tu sais que ses « erreurs » sont pas de la stupidité — c’est les limites d’un système qui prédit des mots.

Chez Laeka Research, on étudie ces mécanismes d’apprentissage pour comprendre comment les rendre meilleurs et plus alignés avec la façon dont les humains pensent vraiment. Et avec Sherpa, on t’explique tout ça en français, simplement, gratuitement.