Le basculement silencieux : l'IA a appris à se souvenir en 2024-2026
Pendant la majeure partie de la première année de ChatGPT, chaque conversation commençait de zéro. Le modèle ne savait pas qui vous étiez, sur quoi vous travailliez, ou ce que vous aviez demandé cinq minutes plus tôt dans un autre onglet. C'était le contrat. C'était aussi la raison pour laquelle les utilisateurs soucieux de leur vie privée lui faisaient plus confiance qu'à, disons, leur historique de recherche.
Ce contrat a pris fin en février 2024. OpenAI a annoncé Memory en aperçu de recherche. En septembre 2024, il était généralement disponible. Le 10 avril 2025, OpenAI a mis à niveau la fonction pour que ChatGPT puisse référencer toutes les conversations passées, pas seulement les éléments que vous demandiez explicitement de retenir. Le déploiement sur le palier gratuit a suivi le 3 juin 2025. Un outil utilisé par des centaines de millions de personnes était devenu persistant presque du jour au lendemain, et la plupart des utilisateurs n'ont pas changé un seul réglage.
Anthropic a pris le rythme inverse. Claude Memory a été lancé pour les plans Team et Enterprise en septembre 2025, a atteint les utilisateurs Pro et Max en octobre 2025, et est finalement arrivé sur le palier gratuit le 2 mars 2026. Le blog de lancement d'Anthropic soulignait ce que les concurrents avaient esquivé : une mémoire que les utilisateurs pouvaient réellement lire, modifier et supprimer.
Google a livré « Saved Info » dans Gemini en février 2025 comme fonctionnalité manuelle. En août 2025, il a basculé l'interrupteur : le « Contexte personnel » est devenu automatique et activé par défaut pour la plupart des comptes. Les mineurs, les comptes Workspace et toute personne dans l'EEE, au Royaume-Uni ou en Suisse ont été exclus, un schéma qui vous dit tout sur les réglages de mémoire qui survivent à l'examen réglementaire européen.
Le basculement a été silencieux parce que chaque étape était incrémentale. Pris ensemble, c'est l'un des points d'inflexion de la confidentialité les plus significatifs de la décennie.
Comment chaque système vous stocke vraiment
Le langage marketing est presque identique. « Mémoire. » « Contexte personnel. » « Apprend à vous connaître au fil du temps. » Ce qui varie est l'architecture sous-jacente, et cette différence compte.
ChatGPT exploite deux couches de mémoire. La première est « Saved Memories », qui est explicite : vous ou le modèle marquez un fait, et il est stocké comme un élément discret. La seconde est la couche d'historique de chat ajoutée en avril 2025. Celle-là est implicite. Le modèle parcourt les conversations passées pour en extraire schémas, préférences et contexte, et injecte ces signaux dans les nouveaux chats. Vous pouvez voir les Saved Memories dans Paramètres, mais la couche d'historique de chat est plus difficile à auditer directement. C'est du raisonnement sur du texte, pas une liste.
Claude a pris un chemin différent. Son système de mémoire est construit autour de fichiers Markdown. Sur Claude Code et Claude.ai, le contexte de long terme vit dans des fichiers de type CLAUDE.md que vous pouvez ouvrir, lire, modifier ou supprimer ligne par ligne. L'approche par fichier signifie qu'il n'y a pas de boîte noire. Si Claude « se souvient » que vous préférez des réponses concises, c'est parce qu'une phrase littérale à cet effet se trouve dans un fichier que vous pouvez consulter. Claude propose aussi un mode « Incognito Chat » pour les sessions qui ne devraient pas toucher à la mémoire du tout.
Le « Contexte personnel » de Gemini est le plus proche de la couche implicite de ChatGPT. Il construit automatiquement un profil à partir des conversations dans l'écosystème Google. La fonction interagit avec Gemini Gems, le système de personas personnalisables de Google, de sorte que les souvenirs peuvent être limités à des flux spécifiques. Les chats temporaires s'auto-suppriment après 72 heures, ce qui est à la fois une fonctionnalité de confidentialité et un rappel que « temporaire » dans les produits d'IA a désormais une durée de conservation spécifique.
Voici la matrice de fonctionnalités côte à côte :
| Fonctionnalité | ChatGPT | Claude | Gemini |
|---|---|---|---|
| Lancement de la mémoire | Fév. 2024 (preview), sept. 2024 (GA) | Sept. 2025 (Team/Enterprise) | Fév. 2025 (manuel) |
| Déploiement palier gratuit | 3 juin 2025 | 2 mars 2026 | Août 2025 (comme Personal Context) |
| Modèle de stockage | Saved memories + historique de chat implicite | Fichiers Markdown lisibles par l'humain | Profil automatique basé sur des vecteurs |
| État par défaut | Opt-out | Opt-in en gratuit, activé par défaut en payant | Activé par défaut (là où c'est permis) |
| Mode incognito / temporaire | Temporary Chat | Incognito Chat | Chats temporaires (auto-suppression 72h) |
| L'utilisateur peut lire la mémoire brute | Partiel (saved uniquement) | Oui (fichiers complets) | Non |
| L'utilisateur peut modifier la mémoire directement | Limité | Oui | Non |
| Import depuis les concurrents | Non | Oui (mars 2026) | Oui (mars 2026) |
| EEE / R.-U. / Suisse | Disponible avec opt-out | Disponible | Exclu |
| Comptes de moins de 18 ans | Restreint | Restreint | Exclu |
Le tableau cache une chose que les docs officielles ne mettent pas en avant : les valeurs par défaut sont le destin, et la plupart des utilisateurs ne les changent jamais.
L'écart de transparence
L'approche par fichier de Claude mérite qu'on s'y attarde un moment, parce qu'elle reformule ce que la mémoire est censée être.
Si vous demandez à ChatGPT ce dont il se souvient, vous obtenez un résumé. Si vous demandez à Gemini, vous obtenez une description douce de « ce que j'ai retenu de nos conversations ». Si vous demandez à Claude, vous pouvez ouvrir le fichier réel. La différence entre un résumé et un fichier est la différence entre un compte rendu oral de votre histoire médicale et le dossier lui-même.
Cela compte pour trois raisons. D'abord, l'audit. Vous ne pouvez pas consentir de manière significative à un système que vous ne pouvez pas inspecter. Les fichiers Markdown vous donnent un contrôle ligne par ligne : garder ceci, supprimer cela, réécrire la troisième ligne. Ensuite, la correction. Les systèmes de mémoire implicite infèrent des choses, et les inférences sont souvent fausses. Si ChatGPT conclut tacitement que vous êtes enseignant parce que vous avez posé une question sur les politiques de classe une fois, cette hypothèse façonne chaque réponse future et vous n'avez aucun moyen de la voir. Enfin, la portabilité. Un fichier lisible par l'humain voyage. Un embedding propriétaire, non.
Simon Willison l'a dit sans détour sur son blog le 21 mai 2025 : « Je n'aime vraiment pas le nouveau dossier mémoire de ChatGPT. » Sa plainte ne portait pas sur la confidentialité dans l'abstrait. C'était sur l'opacité. Willison, qui a passé des années à documenter le comportement des LLM, s'opposait à un système qui construit un modèle de lui sans lui donner le modèle pour l'inspecter. Il n'était pas paranoïaque. Il décrivait le problème central : la mémoire IA crée une représentation de vous que vous ne possédez pas, ne pouvez pas voir pleinement et ne pouvez pas déplacer proprement.
Pour du contexte sur pourquoi ce basculement compte au-delà du théâtre de la confidentialité, notre article sur comment gérer le contexte personnel dans un flux axé IA couvre le côté opérationnel.
Ce qui peut mal tourner : incidents de confidentialité 2025-2026
Les inquiétudes abstraites sont devenues concrètes rapidement. Un court calendrier de ce qui s'est vraiment passé :
| Date | Incident | Impact |
|---|---|---|
| 2025 (en cours) | Ordonnance NYT v. OpenAI | OpenAI tenu de conserver des conversations que les utilisateurs pensaient avoir supprimées, en attendant le procès |
| Mi-2025 | Fuite Firebase de l'app Chat & Ask AI | Environ 300 millions de messages de chat IA exposés via une base de données mal configurée |
| S1 2025 | Rapport Concentric AI sur l'exposition Copilot | Environ 3 millions de documents sensibles exposés par organisation concernée via les intégrations Microsoft Copilot |
| Oct. 2025 | Étude de Stanford sur la rétention des LLM | Signalement de la rétention indéfinie et de la revue humaine des chats signalés comme risque systémique |
| Fin 2025 | Rapport Help Net Security | Documente que les conversations IA « supprimées » persistent souvent dans les sauvegardes et les files de revue bien plus longtemps que les utilisateurs ne le pensent |
L'ordonnance NYT est la plus importante structurellement. Les utilisateurs qui ont explicitement supprimé des chats, y compris des Temporary Chats qui n'étaient jamais censés être sauvegardés, font désormais partie d'une conservation légale à laquelle ils n'ont pas consenti. Votre droit de supprimer la mémoire IA est conditionnel au fait que quelqu'un poursuit actuellement votre fournisseur d'IA.
La fuite de Chat & Ask AI est un mode d'échec différent. Un wrapper tiers utilisant les API sous-jacentes a mal configuré Firebase et a exposé des centaines de millions de messages. La surface d'attaque n'est pas seulement OpenAI, Anthropic et Google. C'est chaque startup empilée par-dessus.
L'analyse de Stanford d'octobre 2025 a ajouté la dernière pièce. Même lorsque les fournisseurs ont l'intention de supprimer des données, les sauvegardes, les files de revue de sécurité, les conservations légales et les pipelines d'entraînement créent des fenêtres de rétention qui dépassent souvent les attentes des utilisateurs de plusieurs ordres de grandeur.
La question du moi numérique
Le cadrage en termes de confidentialité ne vous mène que jusqu'à un certain point. L'enjeu plus profond est ce que cela signifie d'être modélisé.
Quand ChatGPT accumule des milliers d'interactions avec vous, il ne stocke pas seulement des faits. Il construit une approximation statistique de votre façon de penser, de ce qui vous tient à cœur, de comment vous formulez les choses. Cette approximation façonne ensuite chaque réponse future que vous recevez. L'IA à qui vous parlez au jour 300 parle, dans un sens significatif, à un simulacre de vous tout en vous parlant. La boucle est récursive.
Le cadrage en « dossier » de Willison saisit un côté de cela. L'autre côté est psychologique. Les gros utilisateurs d'IA se mettent à performer pour la façon dont le système les voit. Les gens ajustent leurs prompts, leur ton, voire leurs descriptions d'eux-mêmes pour façonner l'impression du modèle à leur égard.
C'est différent de la façon dont nous performons pour les moteurs de recherche ou les réseaux sociaux. Google ne vous répond pas dans votre voix. L'IA, si. Et quand la couche de mémoire est opaque, vous performez pour un miroir qui vous renvoie un reflet que vous ne pouvez pas pleinement voir.
Notre article précédent sur le piège de la pensée IA couvre le côté cognitif de cela. La couche de mémoire ajoute une dimension identitaire. Vous ne risquez pas seulement d'externaliser votre pensée. Vous risquez d'externaliser le registre faisant autorité de qui vous êtes.
Portabilité de la mémoire : mars 2026 a tout changé
Pendant la majeure partie de 2025, la mémoire IA était un mécanisme de verrouillage. Plus vous utilisiez longtemps ChatGPT, plus il savait, et plus il coûtait cher de passer à Claude ou Gemini. La mémoire était un effet de réseau composé par utilisateur.
Mars 2026 a fissuré cela. Anthropic a lancé un outil Import Memory qui tire du contexte des exports ChatGPT et Gemini vers les fichiers Markdown de Claude. Google a livré son propre import multiplateforme à peu près au même moment. La question est passée de « comment garder mon contexte si je change de fournisseur ? » à « quel fournisseur me donne les meilleures primitives de mémoire, et comment passer de l'un à l'autre ? ».
Deux effets ont suivi. Les coûts de changement ont chuté pour les utilisateurs avancés. Et la surface pour les abus s'est élargie : tout outil capable d'ingérer un export de mémoire peut en reconstruire un modèle détaillé de l'utilisateur. Import Memory est à la fois une fonctionnalité de portabilité et une fonctionnalité de concentration du risque.
La partie intéressante est la façon dont cela interagit avec l'approche par fichier de Claude. Parce que la mémoire de Claude est déjà du Markdown lisible par l'humain, vous pouvez y importer des fichiers, les modifier, les fusionner ou en écrire vous-même à partir de zéro. Cela transforme la mémoire de quelque chose que l'IA vous fait en quelque chose que vous faites avec l'IA.
Pratique : comment auditer et contrôler votre mémoire IA aujourd'hui
Les valeurs par défaut ne vont pas vous protéger. Voici ce qu'il faut vraiment faire, plateforme par plateforme.
ChatGPT
- Ouvrez Paramètres, puis Personnalisation, puis Memory.
- Revoyez « Saved memories ». Supprimez tout ce qui est sensible ou inexact. La plupart des utilisateurs trouvent au moins une surprise ici.
- Désactivez « Reference chat history » si vous voulez limiter la couche implicite. Notez que cela réduit sensiblement la personnalisation.
- Utilisez « Temporary Chat » pour tout ce que vous ne voulez pas voir référencé plus tard. Soyez conscient de l'ordonnance de rétention NYT : temporaire n'est pas synonyme de supprimé.
- Exportez périodiquement vos données via Paramètres pour auditer ce que détient OpenAI.
Claude
- Ouvrez votre fichier CLAUDE.md ou équivalent directement.
- Modifiez-le comme n'importe quel fichier texte. Supprimez les lignes qui sont fausses ou dépassées.
- Utilisez Incognito Chat pour les sessions sensibles.
- Sur Claude Code, votre fichier de mémoire est dans votre dépôt projet. Gardez-le hors des commits publics, sauf si vous voulez que votre contexte soit indexé par tous les moteurs de recherche.
- Envisagez d'écrire votre propre fichier de mémoire à partir de zéro : vos préférences, vos projets, votre style de travail. C'est mieux que de laisser le modèle deviner.
Gemini
- Allez sur gemini.google.com, puis Activité, puis revoyez les informations sauvegardées et l'historique d'activité.
- Désactivez le Contexte personnel si vous ne voulez pas de profilage automatique. Attendez-vous à une qualité réduite pour les tâches personnalisées.
- Utilisez les chats temporaires (auto-suppression 72 heures) pour les requêtes sensibles ponctuelles.
- Si vous êtes dans l'EEE, au Royaume-Uni ou en Suisse, la fonctionnalité est déjà désactivée pour vous. Bon à savoir.
- Vérifiez les permissions d'intégration : le Contexte personnel peut recouvrir les accès Gmail, Calendar et Drive. Auditez-les séparément.
Pour les trois
- Ne collez rien dans une IA que vous ne mettriez pas dans un e-mail professionnel. Les conservations légales, les fuites et les fenêtres de rétention font du bouton supprimer un vœu pieux.
- Traitez la mémoire IA comme une extension de votre dossier public, pas comme un carnet privé.
- Gardez votre véritable base de connaissances quelque part que vous contrôlez. Plus à ce sujet ci-dessous.
Vers une mémoire possédée par l'utilisateur
Voici la conclusion inconfortable des deux dernières années. Si la mémoire est la couche qui rend l'IA utile, alors celui qui possède la mémoire possède la relation. Pour l'instant, pour la plupart des utilisateurs, ce propriétaire est OpenAI, Anthropic ou Google.
L'alternative n'est pas d'abandonner l'IA. C'est de posséder votre propre couche de mémoire et de laisser l'IA y lire, plutôt que l'inverse.
C'est là que s'inscrivent les outils contrôlés par l'utilisateur. Le surligneur web de Glasp vous permet de sauvegarder des passages, annotations et notes de tout ce que vous lisez sur le web, dans un format que vous contrôlez, exportable à tout moment. Ces surlignages deviennent un registre durable de ce que vous avez engagé et de ce que vous en avez pensé. Ils ne sont pas inférés de votre comportement par un fournisseur. Ils sont rédigés par vous.
Une fois que vous avez cette couche, le chat IA de Glasp peut y lire d'une manière à laquelle vous avez explicitement consenti. Vous choisissez ce qui entre. Vous décidez de ce qui reste. Vous pouvez supprimer un surlignage et savoir que la suppression tient, parce que le stockage est le vôtre. Et parce que les surlignages sont du texte plutôt que des embeddings opaques, ils sont portables vers Claude, ChatGPT, Obsidian ou tout outil futur.
Ce n'est pas hypothétique. La communauté Glasp construit des archives de surlignages personnelles depuis des années, souvent sans réaliser qu'elle construisait la primitive exacte que l'industrie de l'IA allait plus tard banaliser et centraliser. Une bibliothèque de surlignages bien tenue est la forme la plus pratique de mémoire IA disponible aujourd'hui, parce que vous la possédez.
Le cadrage plus large concerne l'héritage. Nous avons soutenu ailleurs que vos surlignages et notes sont sans doute le plus grand héritage intellectuel que vous puissiez laisser parce qu'ils capturent l'attention, le goût et le jugement sous une forme qui survit aux plateformes qui les hébergent. Le même travail de curation qui fait une grande fenêtre de contexte IA fait aussi un grand registre d'un esprit. Et à une époque où l'IA sera de plus en plus l'interface par laquelle les générations futures liront, le rôle du curateur humain devient plus précieux, pas moins.
Questions fréquemment posées
Puis-je supprimer complètement ma mémoire ChatGPT ?
Vous pouvez supprimer les Saved Memories et effacer l'historique de chat via Paramètres. Cependant, en raison de l'ordonnance judiciaire NYT v. OpenAI de 2025, OpenAI est actuellement tenu de conserver les conversations qui seraient autrement supprimées, y compris certains chats temporaires. Traitez la mémoire IA comme persistante jusqu'à ce que les fournisseurs confirment le contraire.
La mémoire Markdown de Claude est-elle vraiment plus sûre que celle de ChatGPT ?
Elle est plus transparente, ce qui est une propriété différente de plus sûre. Vous pouvez lire, auditer et modifier la mémoire de Claude d'une manière que vous ne pouvez pas avec ChatGPT ou Gemini. La transparence facilite la détection d'erreurs et la suppression de contenu sensible, mais les fichiers reposent toujours sur l'infrastructure d'Anthropic et sont soumis aux mêmes réalités légales et opérationnelles.
Pourquoi la mémoire de Gemini est-elle désactivée dans l'UE ?
Le Contexte personnel est exclu dans l'EEE, au Royaume-Uni et en Suisse parce que les règles européennes de protection des données (principalement le RGPD) imposent des exigences plus strictes sur le profilage automatisé et les activations par défaut. Plutôt que de réarchitecturer la fonctionnalité, Google a choisi de la restreindre par région. C'est un schéma récurrent dans les lancements de produits IA.
Quelle est la différence entre Temporary Chat et un chat supprimé ?
Temporary Chat est conçu pour exclure la session de la mémoire et de l'entraînement. Les chats supprimés sont les sessions que l'utilisateur a explicitement retirées. En pratique, les deux peuvent être soumis à des conservations légales, à de la rétention de sauvegarde et à des files de revue de sécurité qui conservent les données bien plus longtemps que ce que l'interface suggère. L'étude de Stanford 2025 a documenté cet écart en détail.
Puis-je déplacer ma mémoire entre ChatGPT, Claude et Gemini ?
Depuis mars 2026, oui, avec des réserves. Anthropic et Google ont tous deux livré des outils Import Memory qui tirent du contexte des exports concurrents. ChatGPT n'a pas encore rendu la pareille. La portabilité s'améliore, mais la fidélité aller-retour (exporter, importer, réexporter) reste imparfaite.
Devrais-je désactiver complètement la mémoire IA ?
Pour la plupart des utilisateurs, la bonne réponse est quelque part au milieu. Désactivez les couches de mémoire implicite (historique de chat, Contexte personnel) si vous valorisez la confidentialité et que vous n'avez pas besoin d'une forte personnalisation. Gardez les couches de mémoire explicite (Saved Memories, fichiers CLAUDE.md) parce que vous les contrôlez. Et construisez une base de connaissances parallèle possédée par l'utilisateur (comme des surlignages ou des notes) qui vous donne du contexte IA sans donner votre dossier à un fournisseur.
Comment Glasp s'inscrit-il dans tout cela ?
Glasp est une mémoire rédigée par l'utilisateur. Vos surlignages et annotations sont du texte que vous avez écrit ou sélectionné, stocké dans un format que vous pouvez exporter, supprimer et transporter entre outils. Quand vous utilisez le chat IA de Glasp, il lit à partir d'un contexte que vous avez explicitement choisi. C'est l'inverse du modèle par défaut de mémoire IA, où les fournisseurs infèrent le contexte à partir de votre comportement et le stockent de manière opaque.
La mémoire IA est-elle régulée quelque part ?
Le RGPD de l'UE et l'AI Act émergent imposent des contraintes indirectes, c'est pourquoi le Contexte personnel de Gemini y est désactivé. Aux États-Unis, les lois de confidentialité au niveau des États (CCPA, CPRA, Illinois BIPA pour les données biométriques) créent une couverture partielle. Il n'existe pas de réglementation fédérale complète sur la mémoire IA en avril 2026, bien que l'affaire NYT v. OpenAI influence la façon dont les tribunaux traitent les demandes de suppression.
Conclusion : votre mémoire, votre héritage
Les guerres de mémoire ne concernent pas vraiment l'IA. Elles concernent celui qui aura le droit d'écrire le registre faisant autorité de votre vie intellectuelle.
Pour la première fois, ce registre est construit par défaut, par des systèmes que vous ne contrôlez pas, dans des formats que vous ne pouvez pas lire, stockés dans des endroits que vous ne pouvez pas pleinement auditer. C'est un changement significatif par rapport à l'époque où vos connaissances vivaient dans des carnets, des favoris et des surlignages que vous possédiez. Le basculement s'est fait assez vite pour que la plupart des gens le ratent.
Bonne nouvelle : la mémoire possédée par l'utilisateur reste possible, et les mouvements de portabilité de mars 2026 rendent plus facile de garder la mémoire fournisseur comme couche de confort plutôt que comme dépendance. Le choix désormais porte moins sur quelle IA utiliser que sur l'endroit où vit réellement le registre canonique de votre pensée.
Vos surlignages, annotations et contextes organisés sont un héritage. La mémoire fournisseur est un service. Soyez clair sur lequel est lequel, car l'un sera encore à vous dans dix ans et l'autre sera ce que les conditions d'utilisation en vigueur diront qu'il est.
Commencez à posséder votre mémoire. Des outils comme Glasp existent pour cette raison, et plus vous attendez, plus votre moi numérique appartient à quelqu'un d'autre.