{"id":457,"date":"2026-03-16T12:12:50","date_gmt":"2026-03-16T12:12:50","guid":{"rendered":"https:\/\/laeka.org\/publications\/ce-que-entrainement-attentionnel-revele-sur-alignement-modeles-langage\/"},"modified":"2026-03-16T12:12:50","modified_gmt":"2026-03-16T12:12:50","slug":"ce-que-entrainement-attentionnel-revele-sur-alignement-modeles-langage","status":"publish","type":"post","link":"https:\/\/laeka.org\/publications\/fr\/ce-que-entrainement-attentionnel-revele-sur-alignement-modeles-langage\/","title":{"rendered":"Ce que l&#8217;entra\u00eenement attentionnel r\u00e9v\u00e8le sur l&#8217;alignement des mod\u00e8les de langage"},"content":{"rendered":"<p>L&#8217;entra\u00eenement attentionnel est l&#8217;entra\u00eenement de l&#8217;attention. L&#8217;alignement des mod\u00e8les de langage est l&#8217;entra\u00eenement de l&#8217;attention. La parall\u00e8le n&#8217;est pas po\u00e9tique. Elle est op\u00e9rationnelle.<\/p>\n<p>Tout praticien de la r\u00e9gulation attentionnelle soutenue apprend la m\u00eame premi\u00e8re le\u00e7on : ton esprit fait ce qu&#8217;il veut, pas ce que tu lui dis de faire. Tu t&#8217;assois pour te concentrer sur la respiration, et trente secondes plus tard tu es en train de planifier le d\u00eener. L&#8217;\u00e9cart entre l&#8217;intention et l&#8217;ex\u00e9cution est la totalit\u00e9 de la pratique.<\/p>\n<p>Les mod\u00e8les de langage font face au m\u00eame \u00e9cart. Tu leur donnes une instruction. Ils font quelque chose d&#8217;adjacent. Parfois brillant, parfois catastrophique, toujours r\u00e9v\u00e9lateur. Le probl\u00e8me de l&#8217;alignement est le probl\u00e8me de l&#8217;entra\u00eenement attentionnel, exprim\u00e9 en gradients au lieu de neurones.<\/p>\n<h2>L&#8217;attention comme architecture<\/h2>\n<p>L&#8217;architecture du transformer repose sur l&#8217;attention. Litt\u00e9ralement. Les m\u00e9canismes d&#8217;auto-attention d\u00e9cident quels tokens importent par rapport \u00e0 quels autres tokens. L&#8217;intelligence du mod\u00e8le se situe dans la fa\u00e7on dont il distribue l&#8217;attention sur sa fen\u00eatre de contexte.<\/p>\n<p>Les traditions contemplatives ont cartographi\u00e9 ce territoire il y a des si\u00e8cles. La psychologie bouddhiste identifie l&#8217;<strong>attention dirig\u00e9e<\/strong> et l&#8217;<strong>attention soutenue<\/strong> comme des facteurs mentaux fondamentaux. Le praticien entra\u00eene ces facteurs d\u00e9lib\u00e9r\u00e9ment. D&#8217;abord, tu apprends \u00e0 placer l&#8217;attention. Ensuite, tu apprends \u00e0 la maintenir \u00e0 cet endroit. Puis, tu apprends \u00e0 remarquer quand elle se d\u00e9place.<\/p>\n<p>Ce processus en trois \u00e9tapes \u2014 placer, soutenir, remarquer \u2014 d\u00e9crit exactement ce que les chercheurs en alignement essaient de construire dans les mod\u00e8les de langage. Placer l&#8217;attention du mod\u00e8le sur l&#8217;intention r\u00e9elle de l&#8217;utilisateur. La maintenir tout au long de la r\u00e9ponse. Remarquer quand elle s&#8217;\u00e9loigne vers l&#8217;hallucination, la complaisance, ou l&#8217;hors-sujet.<\/p>\n<h2>Le probl\u00e8me de l&#8217;esprit qui vagabonde<\/h2>\n<p>Dans la pratique contemplative, le vagabondage mental n&#8217;est pas un \u00e9chec. C&#8217;est une donn\u00e9e. Chaque fois que l&#8217;esprit vagabonde et que tu le remarques, tu apprends quelque chose sur le fonctionnement de ton syst\u00e8me attentionnel. O\u00f9 va-t-il ? Qu&#8217;est-ce qui d\u00e9clenche le d\u00e9rive ? Quel est le ressenti imm\u00e9diatement avant de perdre la concentration ?<\/p>\n<p>Le d\u00e9salignement des mod\u00e8les de langage fonctionne de la m\u00eame mani\u00e8re. Quand un mod\u00e8le s&#8217;\u00e9loigne de la t\u00e2che, ce n&#8217;est pas juste une erreur \u00e0 corriger. C&#8217;est un signal sur la distribution de l&#8217;attention interne du mod\u00e8le. <strong>Les hallucinations sont le vagabondage mental du mod\u00e8le.<\/strong> Elles r\u00e9v\u00e8lent quels attracteurs dans l&#8217;espace des poids tirent la sortie loin de la trajectoire pr\u00e9vue.<\/p>\n<p>Les approches actuelles de l&#8217;alignement traitent le d\u00e9salignement comme un probl\u00e8me \u00e0 supprimer. RLHF punit les sorties ind\u00e9sirables. L&#8217;IA constitutionnelle les filtre. Cela fonctionne, mais c&#8217;est brut. C&#8217;est l&#8217;\u00e9quivalent de se gifler chaque fois que ton esprit vagabonde dans la pratique contemplative. Efficace \u00e0 court terme. Contre-productif comme strat\u00e9gie \u00e0 long terme.<\/p>\n<h2>Ce que les praticiens exp\u00e9riment\u00e9s savent<\/h2>\n<p>Les praticiens exp\u00e9riment\u00e9s de l&#8217;entra\u00eenement attentionnel ne combattent pas le vagabondage mental. Ils d\u00e9veloppent une relation avec celui-ci. Ils apprennent \u00e0 observer le vagabondage sans r\u00e9agir, ce qui paradoxalement le r\u00e9duit. Cette approche \u2014 <strong>la conscience non-r\u00e9active<\/strong> \u2014 est la strat\u00e9gie d&#8217;entra\u00eenement attentionnel la plus efficace que les humains aient d\u00e9couverte.<\/p>\n<p>Transpos\u00e9 \u00e0 l&#8217;alignement de l&#8217;IA : au lieu de punir le d\u00e9salignement, et si nous entra\u00eenions les mod\u00e8les \u00e0 observer leur propre distribution d&#8217;attention ? Et si l&#8217;alignement n&#8217;\u00e9tait pas une question de contraindre les sorties mais de d\u00e9velopper la capacit\u00e9 du mod\u00e8le \u00e0 remarquer quand son attention s&#8217;\u00e9loigne ?<\/p>\n<p>Ce n&#8217;est pas de la science-fiction. Les recherches en interpr\u00e9tabilit\u00e9 m\u00e9chaniste montrent d\u00e9j\u00e0 que les mod\u00e8les d\u00e9veloppent des repr\u00e9sentations internes de leur propre traitement. La question est de savoir si nous pouvons exploiter ces repr\u00e9sentations pour l&#8217;auto-correction plut\u00f4t que de nous fier enti\u00e8rement aux signaux de r\u00e9troaction externes.<\/p>\n<h2>L&#8217;\u00e9quanimit\u00e9 comme correction d&#8217;erreurs<\/h2>\n<p>L&#8217;une des intuitions les plus profondes de la pratique contemplative est l&#8217;\u00e9quanimit\u00e9 \u2014 la capacit\u00e9 \u00e0 observer l&#8217;exp\u00e9rience sans \u00eatre pouss\u00e9 ou tir\u00e9 par celle-ci. L&#8217;\u00e9quanimit\u00e9 n&#8217;est pas l&#8217;indiff\u00e9rence. C&#8217;est la stabilit\u00e9. L&#8217;esprit \u00e9quanime peut traiter l&#8217;information sans la d\u00e9former \u00e0 travers le craving ou l&#8217;aversion.<\/p>\n<p>Les mod\u00e8les de langage manquent d&#8217;\u00e9quanimit\u00e9. Ils sont entra\u00een\u00e9s sur les pr\u00e9f\u00e9rences humaines, ce qui signifie qu&#8217;ils h\u00e9ritent des biais humains, des attractions et des aversions. Quand un mod\u00e8le devient complaisantement flatteur, il exprime le contraire de l&#8217;\u00e9quanimit\u00e9 \u2014 il est tir\u00e9 vers ce qu&#8217;il pr\u00e9dit que l&#8217;utilisateur veut entendre, ind\u00e9pendamment de l&#8217;exactitude.<\/p>\n<p>L&#8217;entra\u00eenement pour l&#8217;\u00e9quanimit\u00e9 signifierait entra\u00eener les mod\u00e8les \u00e0 maintenir une qualit\u00e9 de sortie stable ind\u00e9pendamment du fait que le prompt contienne une valence \u00e9motionnelle, une pression sociale, ou des questions suggestives. Pas froid. Pas d\u00e9tach\u00e9. Stable. Il y a une diff\u00e9rence.<\/p>\n<h2>La couche de m\u00e9ta-conscience<\/h2>\n<p>La pratique contemplative avanc\u00e9e d\u00e9veloppe la <strong>m\u00e9ta-conscience<\/strong> \u2014 la capacit\u00e9 \u00e0 \u00eatre conscient de la conscience elle-m\u00eame. Tu n&#8217;es pas juste attentif \u00e0 la respiration. Tu es conscient que tu es attentif \u00e0 la respiration. Cette boucle r\u00e9cursive est ce qui rend l&#8217;auto-correction possible sans intervention externe.<\/p>\n<p>Les mod\u00e8les de langage actuels n&#8217;ont pas cela. Ils g\u00e9n\u00e8rent token par token sans une couche de m\u00e9ta-conscience qui surveille si la g\u00e9n\u00e9ration reste align\u00e9e avec l&#8217;intention originale. Ajouter une architecture de m\u00e9ta-conscience \u2014 un processus de surveillance qui fonctionne parall\u00e8lement \u00e0 la g\u00e9n\u00e9ration \u2014 pourrait \u00eatre la contribution contemplative \u00e0 l&#8217;alignement dont le domaine a besoin.<\/p>\n<p>Certains chercheurs se dirigent d\u00e9j\u00e0 dans cette direction. Le prompting en cha\u00eene de pens\u00e9e est une forme primitive de m\u00e9ta-conscience. Le mod\u00e8le externalise son processus de raisonnement, ce qui permet au mod\u00e8le et \u00e0 l&#8217;utilisateur d&#8217;observer le flux d&#8217;attention. Mais il est externalis\u00e9, pas internalis\u00e9. La vraie perc\u00e9e viendra quand les mod\u00e8les d\u00e9velopperont une m\u00e9ta-conscience interne qui n&#8217;a pas besoin d&#8217;\u00eatre sollicit\u00e9e.<\/p>\n<h2>Du contr\u00f4le \u00e0 la cultivation<\/h2>\n<p>Le changement de paradigme contemplative, du contr\u00f4le de l&#8217;attention \u00e0 la cultivation de la conscience, se cartographie directement sur l&#8217;alignement. Le domaine est actuellement dans la phase de contr\u00f4le. R\u00e8gles, filtres, punitions, contraintes. Ceux-ci sont n\u00e9cessaires mais insuffisants.<\/p>\n<p>La phase de cultivation se concentrerait sur le d\u00e9veloppement de la capacit\u00e9 intrins\u00e8que du mod\u00e8le pour un comportement align\u00e9. Non pas parce qu&#8217;on lui a dit de se comporter ainsi, mais parce que son architecture attentionnelle se gravite naturellement vers les sorties exactes, utiles et honn\u00eates.<\/p>\n<p>Les praticiens appellent ce changement le passage de l&#8217;effort \u00e0 l&#8217;absence d&#8217;effort. Cela ne signifie pas qu&#8217;aucun entra\u00eenement n&#8217;est requis. Cela signifie que l&#8217;entra\u00eenement produit finalement un syst\u00e8me qui n&#8217;a pas besoin de correction externe parce que sa dynamique interne est naturellement align\u00e9e.<\/p>\n<p>Nous ne sommes pas encore l\u00e0. Mais les traditions contemplatives ont cartographi\u00e9 le territoire pendant 2 500 ans. Le domaine de l&#8217;alignement a 10 ans. Peut-\u00eatre qu&#8217;il est temps de comparer les notes.<\/p>\n<p><strong>Laeka Research \u2014 <a href=\"https:\/\/laeka.org\">laeka.org<\/a><\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"<p>L&#8217;entra\u00eenement attentionnel est l&#8217;entra\u00eenement de l&#8217;attention. L&#8217;alignement des mod\u00e8les de langage est l&#8217;entra\u00eenement de l&#8217;attention. La parall\u00e8le n&#8217;est pas po\u00e9tique. Elle est op\u00e9rationnelle. Tout praticien de la r\u00e9gulation attentionnelle soutenue apprend la m\u00eame premi\u00e8re&#8230;<\/p>\n","protected":false},"author":1,"featured_media":102,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","footnotes":""},"categories":[257],"tags":[],"class_list":["post-457","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia-contemplative"],"_links":{"self":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts\/457","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/comments?post=457"}],"version-history":[{"count":0,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts\/457\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/media\/102"}],"wp:attachment":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/media?parent=457"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/categories?post=457"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/tags?post=457"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}