{"id":516,"date":"2026-03-17T14:47:05","date_gmt":"2026-03-17T14:47:05","guid":{"rendered":"https:\/\/laeka.org\/publications\/le-mecanisme-dattention-a-ete-bien-nomme-nous-avons-juste-oublie-pourquoi\/"},"modified":"2026-03-17T14:47:05","modified_gmt":"2026-03-17T14:47:05","slug":"le-mecanisme-dattention-a-ete-bien-nomme-nous-avons-juste-oublie-pourquoi","status":"publish","type":"post","link":"https:\/\/laeka.org\/publications\/fr\/le-mecanisme-dattention-a-ete-bien-nomme-nous-avons-juste-oublie-pourquoi\/","title":{"rendered":"Le m\u00e9canisme d&#8217;attention a \u00e9t\u00e9 bien nomm\u00e9. Nous avons juste oubli\u00e9 pourquoi."},"content":{"rendered":"<p>Quand Vaswani et al. ont publi\u00e9 \u00ab Attention Is All You Need \u00bb en 2017, ils ont emprunt\u00e9 un terme \u00e0 la science cognitive. Puis le domaine a promptement oubli\u00e9 tout ce que la science cognitive sait sur l&#8217;attention. Cet oubli nous co\u00fbte.<\/p>\n<h2>L&#8217;attention dans les traditions contemplatives<\/h2>\n<p>L&#8217;attention n&#8217;est pas seulement une commodit\u00e9 computationnelle. Dans chaque grande tradition contemplative, l&#8217;attention est la <strong>technologie fondamentale de transformation<\/strong>. O\u00f9 tu places ton attention d\u00e9termine ce que tu per\u00e7ois, ce que tu apprends, et ce que tu deviens.<\/p>\n<p>La psychologie bouddhiste identifie au moins sept facteurs de l&#8217;attention. L&#8217;attention dirig\u00e9e (vitakka). L&#8217;attention soutenue (vicara). L&#8217;attention s\u00e9lective. La conscience ouverte. L&#8217;attention m\u00e9tacognitive \u2014 l&#8217;attention \u00e0 l&#8217;attention elle-m\u00eame. Chacun de ces \u00e9l\u00e9ments a des propri\u00e9t\u00e9s distinctes, des m\u00e9thodes d&#8217;entra\u00eenement distinctes, et des effets distincts sur la cognition.<\/p>\n<p>Le m\u00e9canisme d&#8217;attention du transformer capture peut-\u00eatre un de ces \u00e9l\u00e9ments : l&#8217;attention s\u00e9lective. Le cadre Query-Key-Value calcule des scores de pertinence et alloue les ressources de traitement en cons\u00e9quence. C&#8217;est puissant, mais c&#8217;est une fraction de ce que l&#8217;attention fait r\u00e9ellement dans les syst\u00e8mes cognitifs biologiques.<\/p>\n<h2>Ce qui manque \u00e0 l&#8217;attention m\u00e9canique<\/h2>\n<p><strong>L&#8217;attention soutenue.<\/strong> Les transformers traitent tout en parall\u00e8le. Il n&#8217;y a pas de m\u00e9canisme pour s&#8217;attarder sur quelque chose \u2014 y revenir, le tenir, le laisser s&#8217;approfondir au fil du temps. L&#8217;attention humaine peut maintenir la concentration sur un seul objet pendant de longues p\u00e9riodes, et cette attention soutenue produit une compr\u00e9hension qualitativement diff\u00e9rente d&#8217;un seul passage.<\/p>\n<p><strong>L&#8217;attention m\u00e9tacognitive.<\/strong> Les transformers ne peuvent pas pr\u00eater attention \u00e0 leur propre attention. Ils ne peuvent pas remarquer qu&#8217;ils se concentrent trop fortement sur une partie du contexte, ou que leur distribution d&#8217;attention est biais\u00e9e. Cette capacit\u00e9 d&#8217;auto-monitoring est ce que la m\u00e9ditation d\u00e9veloppe syst\u00e9matiquement, et son absence dans les syst\u00e8mes d&#8217;IA explique de nombreux \u00e9checs d&#8217;alignement.<\/p>\n<p><strong>La direction intentionnelle.<\/strong> L&#8217;attention humaine peut \u00eatre d\u00e9lib\u00e9r\u00e9ment dirig\u00e9e bas\u00e9e sur les objectifs, les valeurs, et le contexte. Un m\u00e9ditant choisit o\u00f9 placer l&#8217;attention et maintient ce choix contre les distractions. L&#8217;attention du transformer est enti\u00e8rement r\u00e9active \u2014 d\u00e9termin\u00e9e par les poids appris et l&#8217;entr\u00e9e, sans capacit\u00e9 pour le remplacement intentionnel.<\/p>\n<p><strong>La qualit\u00e9 attentionnelle.<\/strong> Pas toute attention n&#8217;est \u00e9gale. Les traditions contemplatives distinguent entre l&#8217;attention serr\u00e9e, constreinte et l&#8217;attention spacieuse, ouverte. Entre la concentration laborieuse et la conscience sans effort. Ces diff\u00e9rences qualitatives affectent la sortie. L&#8217;attention serr\u00e9e capture les d\u00e9tails mais manque le contexte. L&#8217;attention ouverte saisit les motifs mais manque les sp\u00e9cificit\u00e9s. Le syst\u00e8me cognitif optimal pourrait moduler entre ces modes.<\/p>\n<h2>Les implications d&#8217;alignement<\/h2>\n<p>La plupart des probl\u00e8mes d&#8217;alignement sont des probl\u00e8mes d&#8217;attention d\u00e9guis\u00e9s.<\/p>\n<p>Quand un mod\u00e8le se concentre sur les caract\u00e9ristiques de surface d&#8217;un prompt plut\u00f4t que sur l&#8217;intention sous-jacente, c&#8217;est un \u00e9chec d&#8217;allocation d&#8217;attention. Quand il sur-indice certains motifs d&#8217;entra\u00eenement et en ignore d&#8217;autres, c&#8217;est un biais attentionnel. Quand il ne peut pas d\u00e9tecter que sa propre r\u00e9ponse d\u00e9rive du sujet ou devient nuisible, c&#8217;est un d\u00e9ficit d&#8217;attention m\u00e9tacognitive.<\/p>\n<p>Les approches actuelles essaient de corriger ces probl\u00e8mes par les donn\u00e9es d&#8217;entra\u00eenement et les fonctions de perte. Mais si le m\u00e9canisme d&#8217;attention lui-m\u00eame manque la capacit\u00e9 pour la concentration soutenue, l&#8217;auto-monitoring, et la direction intentionnelle, alors de meilleures donn\u00e9es d&#8217;entra\u00eenement sont un pansement sur une blessure architecturale.<\/p>\n<h2>Ing\u00e9nierie d&#8217;une meilleure attention<\/h2>\n<p>\u00c0 quoi ressemblerait-il d&#8217;ing\u00e9nier des m\u00e9canismes d&#8217;attention inform\u00e9s par la science contemplative ?<\/p>\n<p><strong>Attention multi-passe avec profondeur.<\/strong> Au lieu d&#8217;un seul forward pass, permets au mod\u00e8le de pr\u00eater attention au m\u00eame contenu plusieurs fois \u00e0 des niveaux d&#8217;abstraction diff\u00e9rents. Premier passage : sens de surface. Deuxi\u00e8me passage : implications. Troisi\u00e8me passage : \u00e9valuation au niveau m\u00e9ta. Cela imite comment l&#8217;attention soutenue en m\u00e9ditation approfondit progressivement la compr\u00e9hension du m\u00eame objet.<\/p>\n<p><strong>Couches de monitoring d&#8217;attention.<\/strong> Ajoute des composants architecturaux qui pr\u00eatent attention aux motifs d&#8217;attention eux-m\u00eames. Si l&#8217;attention du mod\u00e8le est concentr\u00e9e trop \u00e9troitement (manquant le contexte) ou trop largement (manquant la sp\u00e9cificit\u00e9), ces couches de monitoring pourraient d\u00e9clencher un retraitement. C&#8217;est la m\u00e9tacognition architecturale.<\/p>\n<p><strong>Attention modul\u00e9e par objectif.<\/strong> Permets aux repr\u00e9sentations de t\u00e2che de haut niveau de moduler les poids d&#8217;attention. Si l&#8217;objectif est la pr\u00e9cision, l&#8217;attention devrait se concentrer diff\u00e9remment que si l&#8217;objectif est la cr\u00e9ativit\u00e9 ou l&#8217;empathie. Les praticiens contemplatifs font cela naturellement \u2014 ils modulent leur mode attentionnel bas\u00e9 sur la situation.<\/p>\n<p><strong>Basculement de mode attentionnel.<\/strong> Construis des m\u00e9canismes qui permettent au mod\u00e8le de basculer entre les modes d&#8217;attention concentr\u00e9 et diffus au sein d&#8217;une seule g\u00e9n\u00e9ration. Concentr\u00e9 pour le raisonnement pr\u00e9cis. Diffus pour les connexions cr\u00e9atives. La r\u00e9ponse optimale n\u00e9cessite souvent les deux.<\/p>\n<h2>Prendre le nom au s\u00e9rieux<\/h2>\n<p>Les chercheurs qui ont nomm\u00e9 le m\u00e9canisme d&#8217;attention ont emprunt\u00e9 un mot avec 2 500 ans de sens technique. Ce sens inclut l&#8217;entra\u00eenement syst\u00e9matique, la modulation qualitative, le monitoring m\u00e9tacognitif, et la direction intentionnelle. Nous avons impl\u00e9ment\u00e9 la version la plus simple possible et obtenu des r\u00e9sultats remarquables. Imagine ce qui se passe quand nous impl\u00e9mentons le reste.<\/p>\n<p>\u00c0 <a href='https:\/\/lab.laeka.org'>Laeka Research<\/a>, nous explorons comment le spectre complet de la science contemplative de l&#8217;attention peut informer les architectures de transformer de prochaine g\u00e9n\u00e9ration. L&#8217;attention est vraiment tout ce dont tu as besoin. Nous avons juste besoin de plus de ce que l&#8217;attention r\u00e9ellement est.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Quand Vaswani et al. ont publi\u00e9 \u00ab Attention Is All You Need \u00bb en 2017, ils ont emprunt\u00e9 un terme \u00e0 la science cognitive. Puis le domaine a promptement oubli\u00e9 tout ce que la&#8230;<\/p>\n","protected":false},"author":1,"featured_media":222,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","footnotes":""},"categories":[257],"tags":[],"class_list":["post-516","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia-contemplative"],"_links":{"self":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts\/516","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/comments?post=516"}],"version-history":[{"count":0,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts\/516\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/media\/222"}],"wp:attachment":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/media?parent=516"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/categories?post=516"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/tags?post=516"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}