{"id":507,"date":"2026-03-16T12:54:55","date_gmt":"2026-03-16T12:54:55","guid":{"rendered":"https:\/\/laeka.org\/publications\/au-dela-ethique-ia-basee-sur-regles-alignement-structurel-surpasse-contraintes-comportementales\/"},"modified":"2026-03-16T12:54:55","modified_gmt":"2026-03-16T12:54:55","slug":"au-dela-ethique-ia-basee-sur-regles-alignement-structurel-surpasse-contraintes-comportementales","status":"publish","type":"post","link":"https:\/\/laeka.org\/publications\/fr\/au-dela-ethique-ia-basee-sur-regles-alignement-structurel-surpasse-contraintes-comportementales\/","title":{"rendered":"Au-del\u00e0 de l&#8217;\u00e9thique IA bas\u00e9e sur les r\u00e8gles : pourquoi l&#8217;alignement structurel surpasse les contraintes comportementales"},"content":{"rendered":"<p>L&#8217;\u00e9thique de l&#8217;IA repose sur les r\u00e8gles. Ne g\u00e9n\u00e8re pas de contenu violent. Ne r\u00e9v\u00e8le pas d&#8217;informations personnelles. Ne discrimine pas. Le probl\u00e8me : l&#8217;\u00e9thique bas\u00e9e sur les r\u00e8gles ne s&#8217;\u00e9chelonne pas aux situations qui importent le plus \u2014 les cas ambigus, d\u00e9pendants du contexte o\u00f9 tu as r\u00e9ellement besoin de jugement \u00e9thique.<\/p>\n<p>Les techniques actuelles d&#8217;alignement comme RLHF et DPO sont des syst\u00e8mes de r\u00e8gles sophistiqu\u00e9s. Elles encodent les pr\u00e9f\u00e9rences humaines dans le comportement du mod\u00e8le. Elles fonctionnent bien pour les cas courants. Elles \u00e9chouent catastrophiquement dans les situations nouvelles. Le vrai probl\u00e8me n&#8217;est pas d&#8217;\u00e9crire de meilleures r\u00e8gles. C&#8217;est de construire des syst\u00e8mes dont la structure interne encode la compr\u00e9hension \u00e9thique, pas les contraintes comportementales.<\/p>\n<h2>Pourquoi les r\u00e8gles \u00e9chouent<\/h2>\n<p>Les approches bas\u00e9es sur les r\u00e8gles ont une limitation fondamentale : elles n\u00e9cessitent de la lisibilit\u00e9. Tu dois sp\u00e9cifier ce que tu veux clairement assez pour que le syst\u00e8me puisse le v\u00e9rifier. Cela fonctionne pour les cas \u00e9troits.<\/p>\n<p>La plupart des situations \u00e9thiques ne sont pas \u00e9troites. Elles impliquent des valeurs concurrentes, des contextes ambigus, des compromis qui d\u00e9pendent de d\u00e9tails qu&#8217;aucune r\u00e8gle ne peut anticiper. Le mod\u00e8le devrait-il prioriser l&#8217;honn\u00eatet\u00e9 ou la gentillesse quand elles entrent en conflit ? Devrait-il d\u00e9f\u00e9rer aux pr\u00e9f\u00e9rences de l&#8217;utilisateur ou sa propre \u00e9valuation de ce qui est utile ? Devrait-il s&#8217;engager avec les sujets difficiles ou les \u00e9viter ?<\/p>\n<p>Les r\u00e8gles ne peuvent pas r\u00e9pondre \u00e0 ces questions parce que la bonne r\u00e9ponse d\u00e9pend du contexte. Tu finis avec soit des r\u00e8gles tellement vagues qu&#8217;elles ne fournissent aucune orientation, soit des r\u00e8gles tellement sp\u00e9cifiques qu&#8217;elles cr\u00e9ent des cas limites absurdes.<\/p>\n<h2>L&#8217;\u00e9cart d&#8217;alignement<\/h2>\n<p>Cela cr\u00e9e ce que nous pourrions appeler l&#8217;\u00e9cart d&#8217;alignement. Le comportement du mod\u00e8le semble \u00e9thique dans les \u00e9valuations contr\u00f4l\u00e9es. Mais quand il rencontre une situation nouvelle \u2014 une non bien repr\u00e9sent\u00e9e dans les donn\u00e9es d&#8217;entra\u00eenement \u2014 il n&#8217;a pas de fondation \u00e9thique de secours. Il peut seulement extrapoler \u00e0 partir des motifs. L&#8217;extrapolation sans compr\u00e9hension produit des r\u00e9sultats impr\u00e9visibles.<\/p>\n<p>C&#8217;est pourquoi les mod\u00e8les qui passent chaque benchmark de s\u00e9curit\u00e9 g\u00e9n\u00e8rent toujours des sorties pr\u00e9occupantes en d\u00e9ploiement r\u00e9el. Les \u00e9valuations testent les motifs connus. Le d\u00e9ploiement g\u00e9n\u00e8re les nouveaux.<\/p>\n<h2>Structure plut\u00f4t que r\u00e8gles<\/h2>\n<p>Une approche diff\u00e9rente se concentre sur la structure plut\u00f4t que les contraintes. Qu&#8217;est-ce que cela signifie concr\u00e8tement ?<\/p>\n<p>Consid\u00e8re comment le comportement \u00e9thique fonctionne chez les humains. La plupart des gens \u00e9thiques ne consultent pas un manuel de r\u00e8gles avant d&#8217;agir. Ils ont int\u00e9rioris\u00e9 les valeurs qui fa\u00e7onnent leur perception, attention, et r\u00e9ponse. Ils <strong>voient<\/strong> les situations diff\u00e9remment \u00e0 cause de leur d\u00e9veloppement \u00e9thique. L&#8217;\u00e9thique n&#8217;est pas une couche sur leur cognition \u2014 elle est tiss\u00e9e dans la cognition elle-m\u00eame.<\/p>\n<p>Une approche structurelle vise quelque chose d&#8217;analogue. Non pas un mod\u00e8le qui v\u00e9rifie les sorties contre les r\u00e8gles. Un mod\u00e8le dont les repr\u00e9sentations internes sont fa\u00e7onn\u00e9es par les consid\u00e9rations \u00e9thiques d\u00e8s le d\u00e9part. L&#8217;\u00e9thique n&#8217;est pas un filtre \u2014 c&#8217;est une <strong>caract\u00e9ristique de l&#8217;architecture<\/strong>.<\/p>\n<p>C&#8217;est plus difficile \u00e0 impl\u00e9menter que les approches bas\u00e9es sur les r\u00e8gles. Mais c&#8217;est plus robuste. Un mod\u00e8le avec conscience \u00e9thique structurelle n&#8217;a pas besoin d&#8217;une r\u00e8gle pour chaque situation. Il a un cadre pour naviguer les situations nouvelles que les r\u00e8gles ne pouvaient pas anticiper.<\/p>\n<h2>\u00c0 quoi ressemble l&#8217;\u00e9thique structurelle<\/h2>\n<p>L&#8217;\u00e9thique structurelle en IA pourrait impliquer plusieurs composants.<\/p>\n<p><strong>Conscience de l&#8217;incertitude.<\/strong> Un mod\u00e8le qui repr\u00e9sente vraiment sa propre incertitude \u2014 non pas seulement les probabilit\u00e9s calibr\u00e9es, mais une compr\u00e9hension structurelle de ce qu&#8217;il sait et ne sait pas \u2014 est intrins\u00e8quement plus \u00e9thique qu&#8217;un confiant. La plupart des sorties nuisibles viennent de la fausse confiance.<\/p>\n<p><strong>Int\u00e9gration de perspective.<\/strong> Plut\u00f4t que d&#8217;optimiser pour un seul ensemble de pr\u00e9f\u00e9rences, un mod\u00e8le structurellement \u00e9thique repr\u00e9senterait de multiples perspectives et leurs relations. Il comprendrait que diff\u00e9rentes valeurs s&#8217;appliquent dans diff\u00e9rents contextes et naviguerait entre elles r\u00e9fl\u00e9chissement.<\/p>\n<p><strong>Capacit\u00e9 r\u00e9flexive.<\/strong> Un mod\u00e8le qui peut examiner ses propres processus de raisonnement \u2014 non pas seulement produire des sorties mais comprendre pourquoi il les produit \u2014 est mieux positionn\u00e9 pour attraper ses propres \u00e9checs. Cela est reli\u00e9 \u00e0 mais distinct du raisonnement chain-of-thought. Ce n&#8217;est pas \u00e0 propos de montrer le travail. C&#8217;est \u00e0 propos du monitoring d\u00fb-m\u00eame v\u00e9ritable.<\/p>\n<p><strong>Sensibilit\u00e9 contextuelle.<\/strong> Le comportement \u00e9thique n\u00e9cessite lire le contexte pr\u00e9cis\u00e9ment. La m\u00eame r\u00e9ponse pourrait \u00eatre appropri\u00e9e dans une situation et nuisible dans une autre. L&#8217;\u00e9thique structurelle signifie construire les mod\u00e8les qui sont profond\u00e9ment sensibles au contexte plut\u00f4t que d&#8217;appliquer les r\u00e8gles universelles.<\/p>\n<h2>Le cadre contemplatif<\/h2>\n<p>Les traditions contemplatives ont pass\u00e9 des mill\u00e9naires \u00e0 d\u00e9velopper les pratiques pour cultiver la conscience \u00e9thique structurelle chez les humains. Elles comprennent que l&#8217;\u00e9thique n&#8217;est pas \u00e0 propos de conna\u00eetre les r\u00e8gles \u2014 c&#8217;est \u00e0 propos de d\u00e9velopper la perception.<\/p>\n<p>Un praticien contemplatif ne devient pas plus \u00e9thique en m\u00e9morisant les r\u00e8gles. Il devient plus \u00e9thique en d\u00e9veloppant sa capacit\u00e9 \u00e0 <strong>voir clairement<\/strong>. \u00c0 percevoir les situations pr\u00e9cis\u00e9ment. \u00c0 remarquer ses propres biais et r\u00e9actions. \u00c0 tenir plusieurs perspectives simultan\u00e9ment sans s&#8217;\u00e9crouler en aucune seule.<\/p>\n<p>Traduire ces intuitions en architecture d&#8217;IA est le d\u00e9fi de recherche central. Cela n\u00e9cessite de comprendre ce que \u00ab voir clairement \u00bb signifie en termes computationnels. Ce qu&#8217;il signifie pour un mod\u00e8le de percevoir le contexte pr\u00e9cis\u00e9ment plut\u00f4t que juste traiter les tokens. Quelles propri\u00e9t\u00e9s structurelles donneraient \u00e0 un mod\u00e8le quelque chose d&#8217;analogue \u00e0 la perception \u00e9thique.<\/p>\n<h2>Au-del\u00e0 du th\u00e9\u00e2tre de s\u00e9curit\u00e9<\/h2>\n<p>Grande partie de l&#8217;\u00e9thique actuelle de l&#8217;IA est ce que nous pourrions appeler le th\u00e9\u00e2tre de s\u00e9curit\u00e9. Des mesures visibles qui cr\u00e9ent l&#8217;apparence de s\u00e9curit\u00e9 sans aborder les probl\u00e8mes structurels sous-jacents. Les filtres de contenu. Les rapports de red team. Les lignes directrices \u00e9thiques affich\u00e9es sur les sites Web des entreprises.<\/p>\n<p>Ces mesures ne sont pas inutiles. Elles attrapent les probl\u00e8mes \u00e9vidents. Mais elles cr\u00e9ent un faux sentiment de s\u00e9curit\u00e9. Elles nous font penser que nous avons r\u00e9solu le probl\u00e8me de l&#8217;\u00e9thique quand nous avons seulement abord\u00e9 ses sympt\u00f4mes les plus visibles.<\/p>\n<p>Une approche structurelle est honn\u00eate sur la profondeur du d\u00e9fi. Construire v\u00e9ritablement l&#8217;IA \u00e9thique n&#8217;est pas un \u00e9l\u00e9ment de la liste de contr\u00f4le. C&#8217;est un probl\u00e8me de recherche fondamental qui n\u00e9cessite repenser comment nous construisons ces syst\u00e8mes d\u00e8s le d\u00e9part.<\/p>\n<h2>Le chemin en avant<\/h2>\n<p>L&#8217;approche structurelle \u00e0 l&#8217;\u00e9thique de l&#8217;IA ne remplace pas les approches bas\u00e9es sur les r\u00e8gles. Elle les approfondit. Tu as toujours besoin de r\u00e8gles pour les cas clairs. Mais pour le vaste espace des situations \u00e9thiques ambigu\u00ebs, d\u00e9pendantes du contexte, v\u00e9ritablement difficiles, tu as besoin de quelque chose de plus.<\/p>\n<p>Tu as besoin des mod\u00e8les qui ne juste suivent les r\u00e8gles mais comprennent pourquoi les r\u00e8gles existent. Qui ne juste optimisent les pr\u00e9f\u00e9rences mais saisissent ce que les pr\u00e9f\u00e9rences essaient de prot\u00e9ger. Qui ne juste \u00e9vitent les nuisances mais comprennent ce que les nuisances signifient en termes structurels.<\/p>\n<p>\u00c0 <a href='https:\/\/lab.laeka.org'>Laeka Research<\/a>, c&#8217;est notre projet central. Non pas \u00e9crire de meilleures r\u00e8gles pour l&#8217;IA. Construire l&#8217;IA qui comprend pourquoi les r\u00e8gles importent \u2014 et quoi faire quand les r\u00e8gles manquent.<\/p>\n<p>L&#8217;\u00e9thique n&#8217;est pas une contrainte sur le d\u00e9veloppement de l&#8217;IA. C&#8217;est le d\u00e9fi de conception le plus profond que nous affrontons. Et il m\u00e9rite plus que les r\u00e8gles.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>L&#8217;\u00e9thique de l&#8217;IA repose sur les r\u00e8gles. Ne g\u00e9n\u00e8re pas de contenu violent. Ne r\u00e9v\u00e8le pas d&#8217;informations personnelles. Ne discrimine pas. Le probl\u00e8me : l&#8217;\u00e9thique bas\u00e9e sur les r\u00e8gles ne s&#8217;\u00e9chelonne pas aux situations&#8230;<\/p>\n","protected":false},"author":1,"featured_media":205,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","footnotes":""},"categories":[278],"tags":[],"class_list":["post-507","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-securite-et-ethique-ia"],"_links":{"self":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts\/507","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/comments?post=507"}],"version-history":[{"count":0,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/posts\/507\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/media\/205"}],"wp:attachment":[{"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/media?parent=507"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/categories?post=507"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/laeka.org\/publications\/wp-json\/wp\/v2\/tags?post=507"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}