A mudança silenciosa: a IA aprendeu a lembrar em 2024-2026
Durante a maior parte do primeiro ano do ChatGPT, toda conversa começava do zero. O modelo não sabia quem você era, em que trabalhava ou o que você havia perguntado cinco minutos antes em outra aba. Esse era o acordo. Também era a razão pela qual usuários preocupados com privacidade confiavam nele mais do que, digamos, em seu histórico de buscas.
Esse acordo terminou em fevereiro de 2024. A OpenAI anunciou o Memory como um preview de pesquisa. Em setembro de 2024, ele estava geralmente disponível. Em 10 de abril de 2025, a OpenAI atualizou o recurso para que o ChatGPT pudesse referenciar todas as conversas passadas, não apenas itens que você explicitamente pediu para lembrar. O rollout na camada gratuita seguiu em 3 de junho de 2025. Uma ferramenta usada por centenas de milhões de pessoas havia se tornado persistente quase da noite para o dia, e a maioria dos usuários não mudou uma única configuração.
A Anthropic tomou o ritmo oposto. O Claude Memory foi lançado para planos Team e Enterprise em setembro de 2025, alcançou usuários Pro e Max em outubro de 2025 e finalmente chegou à camada gratuita em 2 de março de 2026. O blog de lançamento da Anthropic enfatizou algo que os concorrentes haviam evitado: memória que os usuários poderiam realmente ler, editar e excluir.
O Google lançou o "Saved Info" no Gemini em fevereiro de 2025 como recurso manual. Em agosto de 2025, acionou a chave: o "Personal Context" se tornou automático e ativado por padrão para a maioria das contas. Usuários menores de 18 anos, contas Workspace e qualquer pessoa na EEE, Reino Unido ou Suíça foram excluídos, um padrão que diz tudo sobre quais padrões de memória sobrevivem ao escrutínio regulatório europeu.
A mudança foi silenciosa porque cada passo foi incremental. Tomadas em conjunto, é um dos pontos de inflexão de privacidade mais significativos da década.
Como cada sistema realmente armazena você
A linguagem de marketing é quase idêntica. "Memória". "Contexto pessoal". "Aprende sobre você ao longo do tempo". O que varia é a arquitetura subjacente, e essa diferença importa.
ChatGPT opera duas camadas de memória. A primeira é "Saved Memories", que é explícita: você ou o modelo marca um fato, e ele é armazenado como um item discreto. A segunda é a camada de histórico de chat adicionada em abril de 2025. Essa é implícita. O modelo escaneia conversas passadas para extrair padrões, preferências e contexto, e alimenta esses sinais em novos chats. Você pode ver as memórias salvas nas Configurações, mas a camada de histórico de chat é mais difícil de auditar diretamente. É raciocínio sobre texto, não uma lista.
Claude tomou um caminho diferente. Seu sistema de memória é construído em torno de arquivos markdown. No Claude Code e no Claude.ai, o contexto de longo prazo vive em arquivos estilo CLAUDE.md que você pode abrir, ler, editar ou excluir linha por linha. A abordagem de arquivo significa que não há caixa preta. Se o Claude "lembra" que você prefere respostas concisas, é porque uma frase literal a esse efeito está em um arquivo que você pode visualizar. O Claude também oferece um modo "Incognito Chat" para sessões que não devem tocar a memória.
O Personal Context do Gemini roda mais próximo da camada implícita do ChatGPT. Ele constrói automaticamente um perfil a partir de conversas em todo o ecossistema Google. O recurso interage com os Gemini Gems, o sistema de personas customizadas do Google, para que as memórias possam ser escopadas para fluxos de trabalho específicos. Chats temporários se autoexcluem após 72 horas, o que é tanto um recurso de privacidade quanto um lembrete de que "temporário" em produtos de IA agora tem uma vida útil específica.
Aqui está a matriz de recursos lado a lado:
| Recurso | ChatGPT | Claude | Gemini |
|---|---|---|---|
| Lançamento da memória | Fev de 2024 (preview), Set de 2024 (GA) | Set de 2025 (Team/Enterprise) | Fev de 2025 (manual) |
| Rollout na camada gratuita | 3 de junho de 2025 | 2 de março de 2026 | Ago de 2025 (como Personal Context) |
| Modelo de armazenamento | Memórias salvas + histórico de chat implícito | Arquivos markdown legíveis por humanos | Perfil automático baseado em vetores |
| Estado padrão | Opt-out | Opt-in no gratuito, ativado por padrão no pago | Ativado por padrão (onde permitido) |
| Modo incógnito / temporário | Temporary Chat | Incognito Chat | Chats temporários (auto-exclusão em 72h) |
| Usuário pode ler memória bruta | Parcial (apenas salva) | Sim (arquivos completos) | Não |
| Usuário pode editar memória diretamente | Limitado | Sim | Não |
| Importação de concorrentes | Não | Sim (março de 2026) | Sim (março de 2026) |
| EEE / Reino Unido / Suíça | Disponível com opt-out | Disponível | Excluído |
| Contas de menores de 18 anos | Restrito | Restrito | Excluído |
A tabela esconde uma coisa que os documentos oficiais não enfatizam: padrões são destino, e a maioria dos usuários nunca os muda.
A lacuna de transparência
A abordagem baseada em arquivos do Claude vale ficar parado por um momento, porque reformula o que a memória deveria ser.
Se você pergunta ao ChatGPT o que ele lembra, recebe um resumo. Se pergunta ao Gemini, recebe uma descrição gentil do "que eu peguei de nossas conversas". Se pergunta ao Claude, você pode abrir o arquivo real. A diferença entre um resumo e um arquivo é a diferença entre um relato verbal do seu histórico médico e o próprio prontuário.
Isso importa por três razões. Primeiro, auditoria. Você não pode consentir de forma significativa a um sistema que não pode inspecionar. Arquivos markdown dão controle item por item: mantenha isto, exclua aquilo, reescreva a terceira linha. Segundo, correção. Sistemas de memória implícitos inferem coisas, e inferências são frequentemente erradas. Se o ChatGPT silenciosamente conclui que você é professor porque você perguntou sobre políticas de sala de aula uma vez, essa suposição molda toda resposta futura e você não tem como vê-la. Terceiro, portabilidade. Um arquivo legível por humanos viaja. Um embedding proprietário não.
Simon Willison colocou isso sem rodeios em seu blog em 21 de maio de 2025: "Eu realmente não gosto do novo dossiê de memória do ChatGPT". Sua queixa não era sobre privacidade no abstrato. Era sobre opacidade. Willison, que passou anos documentando o comportamento de LLMs, objetou a um sistema que constrói um modelo dele sem lhe dar o modelo para inspecionar. Ele não estava sendo paranoico. Ele estava descrevendo a questão central: a memória de IA cria uma representação de você que você não possui, não pode ver por completo e não pode mover de forma limpa.
Para contexto sobre por que essa mudança importa além do teatro de privacidade, nosso texto sobre como gerenciar contexto pessoal em um fluxo de trabalho AI-first cobre o lado operacional.
O que poderia dar errado: incidentes de privacidade de 2025-2026
As preocupações abstratas se tornaram concretas rápido. Uma pequena linha do tempo do que realmente aconteceu:
| Data | Incidente | Impacto |
|---|---|---|
| 2025 (em andamento) | Ordem judicial NYT v. OpenAI | OpenAI obrigada a reter conversas que os usuários achavam que haviam excluído, pendente de litígio |
| Meados de 2025 | Vazamento Firebase do app Chat & Ask AI | Aproximadamente 300M mensagens de chat de IA expostas via banco de dados mal configurado |
| 1º semestre de 2025 | Relatório da Concentric AI sobre exposição do Copilot | Aproximadamente 3M registros sensíveis expostos por organização afetada via integrações do Microsoft Copilot |
| Out de 2025 | Estudo de Stanford sobre retenção de LLM | Sinalizou retenção indefinida e revisão humana de chats sinalizados como risco sistêmico de privacidade |
| Final de 2025 | Relatório da Help Net Security | Documentou que conversas de IA "excluídas" frequentemente persistem em backups e filas de revisão muito mais do que os usuários esperam |
A ordem do NYT é a estruturalmente mais importante. Usuários que explicitamente excluíram chats, incluindo Temporary Chats que nunca deveriam ser salvos, agora fazem parte de uma retenção legal com a qual não consentiram. Seu direito de excluir memória de IA é condicional a se alguém está atualmente processando seu provedor de IA.
O vazamento do Chat & Ask AI é um modo de falha diferente. Um wrapper de terceiros usando as APIs subjacentes configurou mal o Firebase e expôs centenas de milhões de mensagens. A superfície de ataque não é apenas OpenAI, Anthropic e Google. É toda startup em camada em cima deles.
A análise de Stanford de outubro de 2025 adicionou a peça final. Mesmo quando os provedores pretendem excluir dados, backups, filas de revisão de segurança, retenções legais e pipelines de treinamento criam janelas de retenção que frequentemente excedem as expectativas dos usuários por ordens de magnitude.
A questão do eu digital
O enquadramento da privacidade só leva você até certo ponto. A questão mais profunda é o que significa ser modelado.
Quando o ChatGPT acumula milhares de interações com você, não está apenas armazenando fatos. Está construindo uma aproximação estatística de como você pensa, do que você se importa, de como você formula as coisas. Essa aproximação então molda toda resposta futura que você recebe. A IA com quem você conversa no dia 300 está, em um sentido significativo, conversando com um simulacro de você enquanto também conversa com você. O loop é recursivo.
O enquadramento de "dossiê" de Willison captura um lado disso. O outro lado é psicológico. Usuários pesados de IA começam a performar para como o sistema os vê. As pessoas ajustam seus prompts, seu tom, até suas autodescrições para moldar a impressão do modelo sobre elas.
Isso é diferente de como performamos para motores de busca ou redes sociais. O Google não responde com sua voz. A IA responde. E quando a camada de memória é opaca, você está performando para um espelho que mostra um reflexo que você não pode ver por completo.
Nosso texto anterior sobre a armadilha do pensamento com IA cobre o lado cognitivo disso. A camada de memória adiciona uma dimensão de identidade. Você não está apenas em risco de terceirizar seu pensamento. Está em risco de terceirizar o registro autoritativo de quem você é.
Portabilidade de memória: março de 2026 mudou tudo
Durante a maior parte de 2025, a memória de IA foi um mecanismo de lock-in. Quanto mais você usava o ChatGPT, mais ele sabia, e mais caro era mudar para Claude ou Gemini. A memória era efeito de rede composto por usuário.
Março de 2026 rachou isso. A Anthropic lançou uma ferramenta Import Memory que puxa contexto das exportações do ChatGPT e do Gemini para os arquivos markdown do Claude. O Google lançou sua própria importação entre plataformas por volta do mesmo tempo. A questão mudou de "como mantenho meu contexto se mudo de provedor?" para "qual provedor me dá as melhores primitivas de memória, e como me movo entre eles?"
Dois efeitos se seguiram. Os custos de mudança caíram para usuários avançados. E a superfície de área para abuso se expandiu: qualquer ferramenta que pode ingerir uma exportação de memória pode reconstruir um modelo detalhado do usuário a partir dela. O Import Memory é um recurso de portabilidade e um recurso de concentração de risco ao mesmo tempo.
A parte interessante é como isso interage com a abordagem baseada em arquivos do Claude. Como a memória do Claude já é markdown legível por humanos, você pode trazer arquivos, editá-los, fundi-los ou escrever o seu próprio do zero. Isso transforma a memória de algo que a IA faz para você em algo que você faz com a IA.
Prático: como auditar e controlar sua memória de IA hoje
Os padrões não vão protegê-lo. Aqui está o que realmente fazer, plataforma por plataforma.
ChatGPT
- Abra Configurações, depois Personalization, depois Memory.
- Revise "Saved memories". Exclua qualquer coisa sensível ou imprecisa. A maioria dos usuários encontra pelo menos uma surpresa aqui.
- Desative "Reference chat history" se quiser limitar a camada implícita. Note que isso reduz a personalização significativamente.
- Use "Temporary Chat" para qualquer coisa que você não quer referenciada mais tarde. Esteja ciente da ordem de retenção do NYT: temporário não é o mesmo que excluído.
- Exporte periodicamente seus dados via Configurações para auditar o que a OpenAI mantém.
Claude
- Abra seu arquivo CLAUDE.md ou arquivo de memória equivalente diretamente.
- Edite-o como qualquer arquivo de texto. Exclua linhas que estão erradas ou desatualizadas.
- Use Incognito Chat para sessões sensíveis.
- No Claude Code, seu arquivo de memória está em seu repositório do projeto. Mantenha-o fora de commits públicos, a menos que você queira seu contexto indexado por todo mecanismo de busca.
- Considere escrever seu próprio arquivo de memória do zero: suas preferências, seus projetos, seu estilo de trabalho. É melhor do que deixar o modelo adivinhar.
Gemini
- Vá para gemini.google.com, depois Atividade, depois revise informações salvas e histórico de atividades.
- Desative o Personal Context se não quiser profiling automático. Espere qualidade reduzida para tarefas personalizadas.
- Use chats temporários (auto-exclusão em 72 horas) para consultas sensíveis pontuais.
- Se você está na EEE, Reino Unido ou Suíça, o recurso já está desativado para você. Vale saber.
- Verifique permissões de integração: o Personal Context pode se sobrepor ao acesso ao Gmail, Calendário e Drive. Audite essas separadamente.
Em todos os três
- Não cole nada na IA que você não colocaria em um e-mail de trabalho. Retenções legais, vazamentos e janelas de retenção significam que o botão de exclusão é aspiracional.
- Trate a memória de IA como uma extensão do seu registro público, não um caderno privado.
- Mantenha sua verdadeira base de conhecimento em algum lugar que você controla. Mais sobre isso abaixo.
Em direção à memória controlada pelo usuário
Aqui está a conclusão desconfortável dos últimos dois anos. Se a memória é a camada que torna a IA útil, então quem é dono da memória é dono da relação. Agora, para a maioria dos usuários, esse dono é a OpenAI, Anthropic ou Google.
A alternativa não é abandonar a IA. É ser dono da sua própria camada de memória e deixar a IA ler dela, em vez do contrário.
É aqui que ferramentas controladas pelo usuário se encaixam. O marcador web do Glasp permite salvar passagens, anotações e notas de qualquer coisa que você ler na web, em um formato que você controla, exportável a qualquer momento. Esses destaques se tornam um registro durável do que você engajou e do que pensou sobre isso. Eles não são inferidos de seu comportamento por um fornecedor. São autorados por você.
Uma vez que você tem essa camada, o chat com IA do Glasp pode ler dela de uma forma à qual você explicitamente optou por participar. Você escolhe o que entra. Você decide o que guardar. Você pode excluir um destaque e saber que a exclusão se mantém, porque o armazenamento é seu. E porque os destaques são texto em vez de embeddings opacos, eles são portáteis para Claude, ChatGPT, Obsidian ou qualquer ferramenta futura.
Isso não é hipotético. A comunidade do Glasp vem construindo arquivos pessoais de destaques há anos, frequentemente sem perceber que estavam construindo exatamente a primitiva que a indústria de IA mais tarde comoditizaria e centralizaria. Uma biblioteca de destaques bem mantida é a forma mais prática de memória de IA disponível hoje, porque você é dono dela.
O enquadramento mais amplo é sobre legado. Argumentamos em outros lugares que seus destaques e notas são possivelmente a maior herança intelectual que você pode deixar porque capturam atenção, gosto e julgamento em uma forma que sobrevive às plataformas que os hospedam. A mesma curadoria que faz uma ótima janela de contexto de IA também faz um ótimo registro de uma mente. E em uma era em que a IA será cada vez mais a interface através da qual gerações futuras lerão, o papel do curador humano se torna mais valioso, não menos.
Perguntas frequentes
Posso excluir totalmente minha memória do ChatGPT?
Você pode excluir memórias salvas e limpar o histórico de chat através das Configurações. No entanto, devido à ordem judicial NYT v. OpenAI de 2025, a OpenAI é atualmente obrigada a reter conversas que seriam excluídas de outra forma, incluindo alguns chats temporários. Trate a memória de IA como persistente até que os provedores confirmem o contrário.
A memória markdown do Claude é realmente mais segura do que a do ChatGPT?
É mais transparente, o que é uma propriedade diferente de mais segura. Você pode ler, auditar e editar a memória do Claude de uma forma que não pode com ChatGPT ou Gemini. A transparência facilita pegar erros e remover conteúdo sensível, mas os arquivos ainda ficam na infraestrutura da Anthropic e estão sujeitos às mesmas realidades legais e operacionais.
Por que a memória do Gemini está desativada na UE?
O Personal Context está excluído na EEE, Reino Unido e Suíça porque as regras europeias de proteção de dados (principalmente o GDPR) impõem requisitos mais rigorosos sobre profiling automatizado e opt-ins por padrão. Em vez de rearquitetar o recurso, o Google escolheu restringi-lo por região. Esse é um padrão recorrente em lançamentos de produtos de IA.
Qual a diferença entre um Temporary Chat e um chat excluído?
O Temporary Chat é projetado para excluir a sessão da memória e do treinamento. Chats excluídos são sessões que o usuário removeu explicitamente. Na prática, ambos podem estar sujeitos a retenções legais, retenção de backup e filas de revisão de segurança que mantêm dados muito mais tempo do que a UI sugere. O estudo de Stanford de 2025 documentou essa lacuna em detalhe.
Posso mover minha memória entre ChatGPT, Claude e Gemini?
Em março de 2026, sim, com ressalvas. Anthropic e Google ambos lançaram ferramentas Import Memory que puxam contexto de exportações de concorrentes. O ChatGPT ainda não correspondeu. A portabilidade está melhorando, mas a fidelidade em ida e volta (exportar, importar, exportar novamente) ainda é imperfeita.
Devo desligar a memória de IA totalmente?
Para a maioria dos usuários, a resposta certa está em algum lugar no meio. Desative camadas de memória implícitas (histórico de chat, Personal Context) se você valoriza a privacidade e não precisa de personalização pesada. Mantenha camadas de memória explícitas (Saved Memories, arquivos CLAUDE.md) porque você as controla. E construa uma base de conhecimento paralela de propriedade do usuário (como destaques ou notas) que lhe dê contexto de IA sem dar a um fornecedor seu dossiê.
Como o Glasp se encaixa nisso?
O Glasp é memória autorada pelo usuário. Seus destaques e anotações são texto que você escreveu ou selecionou, armazenado em um formato que você pode exportar, excluir e carregar entre ferramentas. Quando você usa o chat com IA do Glasp, ele lê de contexto que você escolheu explicitamente. Este é o inverso do modelo padrão de memória de IA, em que os fornecedores inferem contexto de seu comportamento e o armazenam de forma opaca.
A memória de IA é regulamentada em algum lugar?
O GDPR da UE e a emergente AI Act impõem restrições indiretas, razão pela qual o Personal Context do Gemini está desativado lá. Nos EUA, leis estaduais de privacidade (CCPA, CPRA, Illinois BIPA para dados biométricos) criam cobertura parcial. Não há regulamentação federal abrangente de memória de IA em abril de 2026, embora o caso NYT v. OpenAI esteja influenciando como os tribunais tratam reivindicações de exclusão.
Conclusão: sua memória, seu legado
As guerras de memória não são realmente sobre IA. São sobre quem pode escrever o registro autoritativo de sua vida intelectual.
Pela primeira vez, esse registro está sendo construído por padrão, por sistemas que você não controla, em formatos que você não pode ler, armazenados em lugares que você não pode auditar por completo. Essa é uma mudança significativa em relação à era em que seu conhecimento vivia em cadernos, marcadores e destaques que você possuía. A mudança aconteceu rápido o suficiente para que a maioria das pessoas não percebesse.
A boa notícia: a memória controlada pelo usuário ainda é possível, e os movimentos de portabilidade de março de 2026 facilitam manter a memória do fornecedor como uma camada de conveniência em vez de uma dependência. A escolha agora é menos sobre qual IA usar e mais sobre onde o registro canônico do seu pensamento realmente vive.
Seus destaques, anotações e contexto curado são um legado. A memória do fornecedor é um serviço. Seja claro sobre qual é qual, porque um ainda será seu em dez anos e o outro será o que quer que os termos de serviço atuais digam que é.
Comece a ser dono da sua memória. Ferramentas como o Glasp existem por essa razão, e quanto mais você esperar, mais seu eu digital pertence a outra pessoa.