O que a OpenAI lançou em 4 de junho
Quando escrevemos Guerras de memória de IA em abril, a linha divisória entre os sistemas de memória de IA era a transparência. O ChatGPT mantinha uma lista parcial que você podia revisar. O Claude mantinha arquivos legíveis por humanos que você podia editar. O Gemini mantinha um perfil automático que você não podia ver de jeito nenhum. Dois meses depois, a OpenAI redesenhou o mapa.
Em 4 de junho de 2026, a OpenAI anunciou "Dreaming: Better memory for a more helpful ChatGPT". A versão curta: a lista de memórias salvas não é mais a forma principal de o ChatGPT lembrar de você. No lugar dela roda um processo em segundo plano, que a OpenAI chama de dreaming, que lê suas conversas passadas e sintetiza continuamente um estado de memória atualizado. Você não pede para ele lembrar das coisas. Ele percebe.
Um detalhe do anúncio merece mais atenção do que recebeu. A OpenAI disse que o dreaming já vinha rodando silenciosamente havia cerca de um ano, complementando as memórias salvas antes que alguém fora da empresa soubesse que aquilo tinha um nome. O lançamento de junho não foi o início da síntese em segundo plano. Foi o momento em que a OpenAI a transformou na arquitetura e parou de tratar a lista como a fonte da verdade.
O rollout começou com assinantes Plus e Pro nos EUA, com usuários gratuitos e do Go, além de mais países, prometidos para as semanas seguintes. Essa expansão para a camada gratuita é notícia por si só: a OpenAI diz que uma redução de aproximadamente 5x no custo de computação para rodar o processo de dreaming tornou viável, pela primeira vez, dar memória persistente e sintetizada a centenas de milhões de contas gratuitas.
Como o Dreaming realmente funciona
A OpenAI não publicou a arquitetura em detalhes, mas o anúncio e a cobertura inicial do Engadget e do TechTimes esboçam a mecânica com clareza suficiente.
Entre as suas conversas, um processo em segundo plano revisa o que você discutiu, extrai o contexto durável, mescla com o que o sistema já acredita sobre você e reescreve o estado da memória. O resultado não é uma lista de fatos discretos. É um modelo sintetizado: seu trabalho, seus projetos, seus equipamentos, suas preferências, sua linha do tempo. Se você mencionou sua câmera em uma conversa oito meses atrás, um chat de recomendação de produtos hoje já sabe o que é compatível com o seu setup.
A capacidade mais marcante é a revisão temporal. As antigas memórias salvas ficavam desatualizadas: o ChatGPT alegremente mencionava como futura uma viagem que você fez um ano atrás. O Dreaming atualiza as entradas conforme o tempo passa, então "você vai para Singapura em julho" vira "você foi para Singapura em julho de 2026" quando a viagem termina. O sistema não apenas acumula. Ele reescreve.
O que você vê é uma página de resumo da memória: uma visão geral de alto nível do que o ChatGPT sintetizou, com controles para corrigir detalhes, dispensar itens e dizer ao ChatGPT quais assuntos mencionar ou evitar. Repare na palavra resumo. Você está lendo um relatório gerado sobre a memória, não a memória em si. Voltaremos ao motivo de essa distinção importar mais do que parece.
Se você quiser o contexto mais amplo sobre como ChatGPT, Claude e Gemini chegaram até aqui, o artigo anterior cobre toda a linha do tempo de 2024 ao início de 2026. Tudo abaixo foca no que mudou desde então.
A linhagem de pesquisa: modelos que pensam enquanto você dorme
"Dreaming" soa como capricho de marketing. Na verdade, é uma descrição razoavelmente honesta de uma direção de pesquisa que vem se construindo desde 2023.
A linhagem começa com o MemGPT, o projeto da UC Berkeley que tratava um LLM como um sistema operacional gerenciando a própria memória, paginando informações entre um pequeno contexto de trabalho e um armazenamento externo maior. O MemGPT virou a startup Letta, fundada por Charles Packer e Sarah Wooders a partir do Sky Computing Lab de Berkeley.
Em abril de 2025, uma equipe da Letta e da UC Berkeley (Kevin Lin, Charlie Snell, Yu Wang, Packer, Wooders, Ion Stoica e Joseph E. Gonzalez) publicou "Sleep-time Compute: Beyond Inference Scaling at Test-time" (arXiv:2504.13171). A ideia central: em vez de fazer todo o raciocínio enquanto o usuário espera, deixar o modelo pensar offline durante o tempo ocioso, pré-processando o contexto e destilando o histórico bruto em uma forma útil. Nos experimentos deles, isso cortou em cerca de 5x a computação em tempo de teste necessária para a mesma precisão em um dos benchmarks. A metáfora biológica é deliberada: a consolidação da memória humana acontece em grande parte durante o sono.
Em 2026, a ideia chegou à produção nos dois grandes laboratórios, sob o mesmo nome. A Anthropic lançou o "dreaming" para os Claude Managed Agents em 6 de maio de 2026, como um processo agendado que revisa as sessões dos agentes, mescla duplicatas, poda entradas obsoletas e escreve as lições destiladas em notas e playbooks de texto simples. A empresa de IA jurídica Harvey relatou taxas de conclusão de tarefas cerca de 6x maiores em testes depois que seus agentes puderam carregar soluções de contorno entre sessões. A versão de consumo da OpenAI veio quatro semanas depois.
Mas aqui está a bifurcação no caminho. O dreaming da Anthropic escreve suas conclusões em arquivos que humanos podem ler e auditar. O dreaming da OpenAI escreve em um estado de memória que você só vê através de um resumo. Mesma linhagem de pesquisa, mesmo nome, respostas opostas para a pergunta de que trata este artigo.
O que o Dreaming melhora de verdade
Justiça em primeiro lugar: o sistema antigo era ruim, e este é mensuravelmente melhor no que faz.
A OpenAI publicou uma avaliação interna de recall factual mostrando sucesso em tarefas de 41.5% com as memórias salvas de 2024, 67.9% com o sistema de 2025 e 82.8% com o Dreaming V3. Na mesma suíte de avaliação, a aderência a preferências marcou 71.3% e a precisão sensível ao tempo, 75.1%. São números do fornecedor com uma metodologia não publicada, então trate-os como direcionais, não como precisos. Mas a direção bate com o que os usuários reclamaram por dois anos: as memórias salvas eram desatualizadas, redundantes e estranhamente seletivas.
As melhorias concretas são fáceis de listar. Fatos desatualizados são revisados em vez de contradizer o presente. O contexto que você mencionou naturalmente na conversa é capturado sem o ritual do "lembre-se disto". Detalhes relevantes aparecem através das fronteiras de assunto, então seu equipamento de fotografia informa sua pergunta de compras. E a redução de 5x na computação leva tudo isso para as contas gratuitas, que antes recebiam os recursos de memória mais fracos.
Há também um argumento honesto de que a síntese é simplesmente o que memória significa. A memória humana também não é um registro de acréscimos sem fim. Nós consolidamos, revisamos e esquecemos, e é em grande parte por isso que lembrar funciona. Então a engenharia é defensável e os benefícios são reais. O problema não é o que o dreaming faz. É o que você não pode mais fazer.
O que isso custa: auditoria, contestabilidade, lock-in
A antiga lista de memórias salvas era desajeitada, mas tinha uma propriedade que ninguém precificou corretamente até ela desaparecer: era enumerável. Você podia ler cada item, apontar para um e excluí-lo. As crenças do modelo sobre você e a lista que você auditava eram o mesmo objeto.
O Dreaming quebra essa identidade. Três perdas específicas decorrem disso.
Auditoria. A página de resumo da memória é uma visão geral gerada, e a própria documentação da OpenAI reconhece que ela não necessariamente inclui tudo o que o ChatGPT pode lembrar de conversas passadas. Você está auditando um relatório sobre o registro, não o registro. A cobertura do TechTimes apontou isso como a mudança central: o motor de personalização foi reescrito, e a trilha de auditoria ficou mais estreita ao mesmo tempo.
Contestabilidade. Suponha que a síntese tire uma inferência errada sobre sua saúde, sua política ou seu empregador. Com uma lista, você apaga a linha. Com um estado sintetizado, os controles são mais brandos: segundo o TechTimes, selecionar "não mencione isso de novo" reduz referências futuras a um detalhe, mas não exclui a entrada subjacente, e excluir uma conversa não remove memórias já derivadas dela. Você precisa caçar tanto a inferência quanto a fonte dela, e não pode verificar se a caçada deu certo. Um sistema que se revisa silenciosamente também pode revisar silenciosamente uma correção que você nunca chegou a revisar.
Lock-in. Este é o custo lento. O artigo anterior celebrou os movimentos de portabilidade de março de 2026, quando Claude e Gemini lançaram ferramentas de importação capazes de ingerir exportações de concorrentes. Essas ferramentas funcionam sobre exportações legíveis. Um estado de memória continuamente sintetizado é exatamente o tipo de artefato que exporta mal: o que você exportaria, afinal, o resumo? Cada mês de dreaming torna o seu ChatGPT mensuravelmente mais útil para você e o seu contexto menos reconstruível em qualquer outro lugar. Já escrevemos antes sobre por que o contexto pessoal está se tornando o verdadeiro fosso competitivo, e o Dreaming é o exemplo mais limpo até agora: o fosso agora é construído automaticamente, em segundo plano, do lado da cerca do fornecedor.
Nada disso exige má intenção da OpenAI. É uma propriedade estrutural do design. Quando o registro sobre você é um artefato que só o processo do fornecedor pode escrever, sua relação com esse registro muda de dono para sujeito.
ChatGPT vs Claude vs Gemini: a memória em junho de 2026
A tabela comparativa do artigo anterior já tem duas gerações de produto de idade, então aqui está o panorama atualizado. Desde março de 2026: o Google lançou o Personal Intelligence (14 de janeiro de 2026 para AI Pro e Ultra nos EUA, expandindo para usuários gratuitos a partir do fim de março), que puxa contexto do Gmail, Photos, Search e do histórico do YouTube. A Anthropic levou a memória a todos os planos do Claude em 2 de março de 2026 e adicionou o dreaming de agentes em maio. E a OpenAI lançou a reformulação de que trata este artigo.
| Em junho de 2026 | ChatGPT (Dreaming) | Claude | Gemini |
|---|---|---|---|
| Mecanismo | Síntese em segundo plano reescreve um estado de memória unificado em todos os chats | Sumarização periódica em memória legível por humanos; baseada em arquivos e editável; o "dreaming" de agentes escreve playbooks em texto simples | Memória entre chats passados mais o Personal Intelligence apoiado em Gmail, Photos, Search, YouTube |
| Visibilidade para o usuário | Página de resumo da memória; sem garantia de estar completa | Texto completo dos arquivos de memória legível | Configurações e controles de atividade; sem visão do perfil bruto |
| Editabilidade | Corrigir, dispensar ou instruir; "não mencione isso de novo" suprime, mas não exclui | Editar ou excluir linha por linha, como um documento | Ligar e desligar recursos e conexões de apps; edição limitada no nível de item |
| Portabilidade | Exportação de dados; sem importação de rivais | Importa do ChatGPT e do Gemini (março de 2026); markdown viaja para qualquer lugar | Ferramenta de importação (março de 2026); contexto derivado de apps fica no Google |
| Padrões | Ativado por padrão para Free, Plus, Pro; desativado por padrão para Enterprise | Ativado em todos os planos desde 2 de março de 2026, com modo incognito | Memória de chat amplamente ativada; conexões de apps desativadas por padrão |
O padrão que vale notar: os três fornecedores não estão mais convergindo. O Claude dobrou a aposta na legibilidade, o Google dobrou a aposta na abrangência (sua caixa de entrada e sua biblioteca de fotos agora são memória) e a OpenAI dobrou a aposta na qualidade da síntese às custas da inspeção. Escolha seu trade-off, porque você definitivamente está fazendo um.
Nota para desenvolvedores: o stack de memória de agentes
Se você constrói com LLMs em vez de apenas conversar com eles, existe um ecossistema paralelo de memória que vale a pena conhecer, e ele, em sua maioria, assumiu a posição oposta sobre propriedade.
A Letta (a equipe do MemGPT) trata a memória como uma hierarquia gerenciada pelo agente e roda o sleep-time compute como recurso de primeira classe, com agentes que reorganizam a memória entre sessões. A Zep constrói a memória como um grafo de conhecimento temporal através da sua biblioteca open-source Graphiti (27k estrelas no GitHub), em que cada fato carrega timestamps de validade e invalidade, de modo que "o usuário se mudou para Tóquio" substitui em vez de contradizer "o usuário mora em Berlim". É o mesmo truque de revisão temporal do Dreaming, só que consultável e inspecionável. A Mem0 levantou uma Série A de $24M em outubro de 2025 para ser a camada de memória gerenciada para apps de IA, cruzou 41,000 estrelas no GitHub no anúncio (hoje passa de 58,000) e se tornou a provedora de memória do Agent SDK da AWS. O LangMem é a versão da LangChain, dividindo a memória nos tipos semântico, episódico e procedural.
A resposta da Anthropic do lado da API é a ferramenta de memória (memory_20250818), que dá ao Claude um diretório de arquivos persistente que ele pode ler e escrever entre sessões. A escolha de design notável: os arquivos vivem do lado do cliente, na sua infraestrutura. O modelo da Anthropic faz o lembrar; você guarda as memórias.
A avaliação se padronizou em torno de dois benchmarks. O LoCoMo testa memória conversacional de longuíssimo prazo em diálogos de múltiplas sessões, incluindo perguntas de raciocínio temporal e de múltiplos saltos. O LongMemEval pareia cada pergunta com aproximadamente 115k tokens de histórico de chat em um arranjo de agulha no palheiro. As alegações dos fornecedores nos rankings são carregadas de marketing (todo mundo é estado da arte no benchmark que escolheu), mas os benchmarks em si são a forma como você verificaria qualquer alegação sobre memória, incluindo a da OpenAI, se a avaliação fosse pública. Ela não é.
A ironia é difícil de não ver. O stack de desenvolvedores, construído por gente que precisa depurar esses sistemas, convergiu para a memória como dados legíveis, com timestamps e exportáveis, sob o controle da aplicação. O maior produto de IA de consumo acabou de mover seus 800 milhões de usuários na direção contrária.
A camada de memória que você pode realmente possuir
Então o que você faz, na prática, se quer os benefícios da memória de IA sem transformar o processo em segundo plano de um fornecedor no registro autoritativo da sua vida?
Você mantém um registro que o fornecedor não escreve. O artigo anterior chamou isso de memória controlada pelo usuário, e o Dreaming torna o argumento mais afiado, não mais fraco. Um estado de memória sintetizado é a interpretação que o fornecedor faz de você. Seus destaques, notas e anotações são a sua interpretação de você, e a diferença entre esses dois artefatos é a diferença entre um score de crédito e um diário.
Essa é a premissa de design por trás do marcador web do Glasp: enquanto você lê, você salva os trechos que te marcaram e as notas que anexou a eles, em texto simples, sob a sua conta, em uma forma que você pode exportar a qualquer momento. Nada infere. Nada reescreve da noite para o dia. O registro cresce apenas quando você age, o que significa que ele permanece contestável da forma mais simples possível: você o escreveu, então pode mudá-lo.
As duas camadas não são rivais; elas se compõem. Quando você faz uma pergunta ao chat de IA do Glasp, ele lê dos destaques que você explicitamente escolheu manter, que é o modelo de consentimento que as grandes plataformas abandonaram. E como o registro é texto portátil em vez de um estado sintetizado opaco, ele funciona como um corpus RAG pessoal para qualquer modelo que você apontar para ele: ChatGPT hoje, Claude amanhã, o que quer que seja lançado em 2027. Detalhamos o lado operacional disso no nosso guia sobre gerenciar contexto pessoal em um fluxo de trabalho centrado em IA.
Use o Dreaming. Ele é genuinamente bom no que faz. Só não deixe que ele seja o único registro. A memória de conveniência deve viver com o fornecedor; a cópia canônica do que você leu, pensou e decidiu deve viver em algum lugar onde você segura as chaves.
Perguntas frequentes
Como funciona a memória do ChatGPT depois da atualização Dreaming?
Um processo em segundo plano agora roda entre as suas conversas, lendo chats passados e sintetizando um estado de memória continuamente atualizado. As memórias se revisam com o tempo (uma viagem planejada vira uma viagem passada), e o contexto que você menciona naturalmente é capturado sem que você peça. Você revisa tudo por meio de uma página de resumo da memória nas configurações.
O ChatGPT removeu a lista de memórias salvas?
A lista não é mais o mecanismo principal. O anúncio da OpenAI descreve o novo sistema como construído sobre o dreaming, com uma página de resumo da memória substituindo o gerenciamento da lista para a maioria dos propósitos. Você ainda pode adicionar detalhes, corrigi-los e dispensar itens a partir do resumo, mas a memória subjacente é um estado sintetizado, não uma lista enumerável de fatos.
Posso ver tudo o que o ChatGPT lembra sobre mim?
Não. O resumo da memória é uma visão geral de alto nível, e a documentação da OpenAI reconhece que ele não necessariamente inclui tudo o que o ChatGPT pode lembrar de conversas passadas. Note também que excluir uma conversa não remove memórias já derivadas dela, e que "não mencione isso de novo" suprime um detalhe sem excluí-lo. Para assuntos sensíveis, use o Temporary Chat, que mantém a sessão fora da memória.
O Dreaming está disponível na camada gratuita?
Está em rollout. O lançamento de 4 de junho de 2026 cobriu primeiro os usuários Plus e Pro nos EUA, com contas gratuitas e do Go e mais países prometidos para as semanas seguintes. A OpenAI diz que um corte de aproximadamente 5x no custo de computação do processo de dreaming foi o que tornou a síntese na camada gratuita viável pela primeira vez.
Os números de recall de 82.8% são confiáveis?
Eles vêm da avaliação interna da OpenAI, sem metodologia publicada, então trate-os como direcionais. A progressão relatada (41.5% em 2024, 67.9% em 2025, 82.8% com o Dreaming V3) bate com a experiência amplamente compartilhada de que o sistema antigo era desatualizado e pouco confiável. Benchmarks públicos como LoCoMo e LongMemEval existem exatamente para esse tipo de alegação, mas a OpenAI não reportou resultados contra eles.
Conclusão
A memória do ChatGPT costumava ser uma lista. Agora é um processo. Essa única mudança explica tanto por que o produto melhorou quanto por que a pergunta no título deste artigo ficou urgente. Uma lista pode ser lida, contestada e exportada. Em um processo, só se pode confiar.
O panorama de junho de 2026 oferece três filosofias de fornecedor: a síntese opaca de alta qualidade da OpenAI, os arquivos legíveis do Claude, o alcance de todo o ecossistema do Gemini. As três são úteis. Nenhuma é sua. A memória que é sua é a que você mesmo escreve: os trechos que escolheu manter, as notas que escreveu na margem, o registro que não muda enquanto você dorme.
Comece a construir esse registro agora, enquanto seus dossiês de IA ainda são jovens. Instale o marcador web do Glasp, destaque o que realmente importa para você nesta semana e você terá começado a única camada de memória que nenhum processo em segundo plano pode reescrever e que nenhuma atualização de termos de serviço pode tirar. Sua IA já está sonhando com você. Garanta que você está fazendo as suas próprias anotações.