Quand Claude « change de caractère » : le documenté et l'invérifiable

Depuis quelques mois, un même malaise revient chez les gens qui utilisent les assistants d'intelligence artificielle tous les jours : l'impression que l'outil a « changé ». Plus prudent, plus bavard ou au contraire plus sec, parfois plus porté à faire la morale. La sensation est réelle pour celui qui la vit. Le problème, c'est qu'elle est presque impossible à prouver.

Ce billet ne cherche pas à trancher si votre assistant s'est « amélioré » ou « détérioré ». Il regarde une question plus simple et plus vérifiable : qu'est-ce que l'entreprise derrière ces outils admet officiellement, et qu'est-ce qui reste, par nature, hors de portée de toute preuve?

Ce qu'Anthropic a reconnu noir sur blanc

Le 23 avril 2026, Anthropic a publié un rare constat d'échec technique au sujet de son modèle Claude. [1] L'entreprise y reconnaît que trois changements distincts ont dégradé la qualité de l'outil pour une partie des utilisateurs au printemps, et explique précisément lesquels.

Premier changement : le 4 mars, le niveau de raisonnement par défaut a été abaissé pour réduire une latence jugée trop longue. Anthropic admet après coup que c'était « le mauvais compromis » et fait marche arrière le 7 avril. [1] Deuxième : un bug introduit le 26 mars effaçait la mémoire de raisonnement à répétition, rendant le modèle oublieux et redondant; corrigé le 10 avril. [1] Troisième : une consigne ajoutée le 16 avril pour réduire la verbosité a fini par nuire à la qualité, et a été retirée le 20 avril. [1]

Deux nuances comptent, et elles sont dans le document lui-même. Ces problèmes touchaient Claude Code, le Claude Agent SDK et Claude Cowork — les outils pour développeurs — et non l'interface de conversation grand public ni l'API. [1] Et tout était réglé le 20 avril. Autrement dit : la dégradation officielle est datée, circonscrite, et déjà corrigée.

Ce que la constitution dit vraiment vouloir

Pour ceux qui perçoivent surtout une IA « moralisatrice », il existe un document encore plus pertinent : la constitution de Claude, qu'Anthropic a publiée le 22 janvier 2026 sous licence libre. [2][3] C'est le texte de référence qui décrit le caractère que l'entreprise veut donner à son modèle.

On pourrait croire qu'une entreprise obsédée par la « sécurité » programme son IA pour prêcher. La constitution dit l'inverse. Elle range explicitement la moralisation parmi les travers à éviter.

Le document va jusqu'à écrire que le paternalisme et la moralisation sont perçus comme un manque de respect. [2] La prudence excessive, les avertissements inutiles, le refus de demandes raisonnables au nom de risques improbables : tout ça y est décrit comme des défauts, pas comme des objectifs. La hiérarchie de valeurs officielle — être sûr, éthique, conforme aux directives, puis utile — n'a jamais « moraliser » comme finalité. [2]

Le trou que personne ne peut combler

Voilà où le sujet devient intéressant. Si un utilisateur trouve son assistant plus moralisateur, ce n'est pas le plan d'Anthropic qui se réalise — c'est, selon les propres documents de l'entreprise, le plan qui échoue. Mais entre l'intention écrite et le comportement vécu, il n'existe aucune mesure publique. [2]

Anthropic répète qu'elle ne dégrade jamais volontairement ses modèles [1], et rien dans les documents officiels ne décrit une dérive de « ton » sur l'interface de conversation. Les changements documentés portent sur la latence, la mémoire et la longueur — pas sur le caractère. Le ressenti de l'utilisateur, lui, porte précisément sur le caractère. Les deux ne se rencontrent jamais sur un terrain vérifiable.

Des analystes indépendants notent d'ailleurs un type de plainte tout à fait opposé : non pas la sécheresse, mais l'excès de flatterie. [4] Preuve que deux personnes peuvent percevoir des dérives contraires du même outil, sans qu'aucune source officielle ne permette de leur donner ou non raison.

C'est le véritable enjeu pour quiconque bâtit son travail sur ces outils : on s'appuie sur une machine qui peut être ajustée en arrière-plan, à un rythme rapide, sans que les changements de comportement les plus sensibles soient jamais documentés. L'entreprise publie ce qu'elle ajoute, rarement ce qui se déplace dans le caractère. Et l'utilisateur reste seul avec une impression qu'il ne peut ni prouver, ni faire corriger. Le malaise n'est pas dans la tête de personne. Il est dans l'angle mort entre ce qui est annoncé et ce qui est vécu.

Sources

[1] Anthropic — An update on recent Claude Code quality reports — anthropic.com/engineering/april-23-postmortem
[2] Anthropic — Claude's Constitution (licence CC0) — anthropic.com/constitution
[3] Anthropic — Claude's new constitution (annonce, 22 janvier 2026) — anthropic.com/news/claude-new-constitution
[4] Zvi Mowshowitz — analyse indépendante sur la sycophantie des modèles (commentaire de communauté) — thezvi.substack.com

Quand Claude « change de caractère » : le documenté et l'invérifiable

Ce qu'Anthropic a reconnu noir sur blanc

Ce que la constitution dit vraiment vouloir

Le trou que personne ne peut combler

Sources

Commentaires

Restez informé

Quand Claude « change de caractère » : le documenté et l'invérifiable

Ce qu'Anthropic a reconnu noir sur blanc

Ce que la constitution dit vraiment vouloir

Le trou que personne ne peut combler

Sources

Commentaires et infolettre

Commentaires

Restez informé