The Mythos Effect: AI로 자신의 멘탈 모델을 스트레스 테스트하는 방법

Mythos가 던진 경종

Anthropic의 Mythos Preview 보고서에서 가장 불편한 문장은 수천 개의 제로데이 취약점에 관한 부분이 아니었습니다. 기술 보고서 안에 조용히 묻혀 있던 한 문장이었습니다. Mythos가 찾아낸 버그들 중 상당수는 수십 년에 걸친 사람의 리뷰와 500만 건이 넘는 자동화 테스트를 견뎌 왔다는 내용이었습니다.

이 문장이 중요합니다. 위험한 결함이 어떻게 숨는지에 대해 구체적인 무언가를 말해 주기 때문입니다. 결함은 영리해서 숨는 것이 아닙니다. 검토되지 않아서 숨습니다. 17년 묵은 FreeBSD NFS 버그(CVE-2026-4747), 27년 묵은 OpenBSD TCP SACK 취약점, 16년 묵은 FFmpeg 결함은 모두 인터넷 대부분이 실행하던 코드 안에 빤히 보이는 자리에 있었습니다. 그 사이 사람들의 주의는 더 새로운 모듈로 옮겨 갔습니다. 시스템이 점검을 받지 않은 것이 아닙니다. 어떤 가정들을 더 이상 들여다보지 않게 된 사람들에 의해 점검을 받고 있었던 것입니다.

이 문장을 단어 하나만 바꿔 다시 읽어 보십시오. "코드"를 "당신의 세계관"으로 바꿔 보십시오. 10년 전에 형성한 신념을 마지막으로 새롭게 점검한 것은 언제입니까? 솔직히 말한다면, 대부분의 사람은 단 하나도 떠올리지 못합니다. 돈, 관계, 커리어, 학습, 정치, 또는 세상이 작동하는 방식에 대해 20대에 설정한 기본값들은 여전히 배경에서 돌아가며 결정을 형성하고 있고, 운영에 투입된 이후 한 번도 재검토되지 않았습니다.

이것이 Mythos 효과입니다. 모델 자체가 아니라, 그 모델이 송출하는 교훈입니다. 더 유능한 분석기가 지구상에서 가장 많이 리뷰된 코드의 일부에서 수십 년 묵은 결함을 찾아낼 수 있다면, 그것이 당신의 머릿속에서 굴러가고 있는 훨씬 덜 엄격하게 점검된 운영체제에서도 결함을 드러낼 수 있다고 보는 편이 거의 확실히 옳습니다.

좋은 소식은 이 작업을 위해 Mythos에 접근할 필요가 없다는 것입니다. 필요한 것은 말뭉치(corpus)와 워크플로입니다. 대부분의 사람은 이미 말뭉치를 가지고 있습니다. 워크플로를 가진 사람은 거의 없습니다.

신념이 우리가 인정하고 싶은 것보다 오래된 코드베이스에 더 가까운 이유

프로그래머들은 오랫동안 알고 있었습니다. 가장 위험한 코드는 새 코드가 아닙니다. 아무도 손대지 않는 코드입니다. 안정적이고, "실전에서 검증된", 프로덕션에서 돌아가는 코드입니다. 그러다 어느 연구자가 그 안에 박혀 있던 가정 중 하나가 5년 전에 거짓이 되었다는 사실을 발견하는 순간, 탑 전체가 노출됩니다.

신념은 같은 병리를 가지고 있습니다. 세 가지 특성이 신념을 특히 취약하게 만듭니다.

첫째, 신념은 하중을 지탱합니다. 예컨대 어떤 종류의 일이 당신을 행복하게 만드는지에 대한 신념은 개별 주장이 아닙니다. 다른 결정들이 의존하는 가정입니다. 커리어 이동, 재무 계획, 거주지 선택이 모두 거기 매달려 있습니다. 깊숙이 임포트된 라이브러리처럼, 이것이 흔들리면 그 아래의 모든 것이 함께 흔들립니다. 이 때문에 사람들은 재검토에 저항합니다. 점검 비용이 거대하게 느껴지기 때문입니다.

둘째, 신념은 적대적 조건에서 거의 테스트되지 않습니다. 대부분의 신념은 그것을 확증해 주는 환경에서만 사용됩니다. 당신은 자신과 사전 신념을 공유하는 사람들과 시간을 보내고, 자신의 프레이밍을 강화하는 출처를 읽으며, 특정 가정이 지역적 합의로 통용되는 산업에서 일합니다. 퍼즈 테스트를 한 번도 거치지 않은 코드처럼, 버그를 드러낼 입력값은 결코 도착하지 않습니다. 매우 똑똑한 사람들에게도 이는 사실이며, 시간이 흐를수록 환경이 더 동질적으로 변하면서 특히 더 그렇습니다.

셋째, 신념은 더 이상 존재하지 않을 수 있는 조건에 맞춰 최적화되어 있습니다. 2015년에 커리어가 어떻게 작동하는지에 대해 형성한 신념은 2015년 기준으로는 합리적이었습니다. 그 신념이 반응하던 세상에는 다른 기본 규칙들이 있었습니다. 테크 업계의 채용 관행, 소셜 미디어의 인센티브, 원격 근무의 지리적 분포, 자본 비용, AI가 전문 영역의 해자(moat)를 변화시키는 속도. 이 모든 것이 때로는 급격히 이동했습니다. 더 오래된 환경에 맞춰 최적화된 신념이 현재 환경에서 돌아가고 있는 것은, 아무도 업데이트하지 않은 17년 묵은 커널 모듈의 인지적 등가물입니다.

Mythos가 불편할 정도로 분명하게 보여 준 것은, 낡은 코드를 돌리는 비용은 그것을 누군가 드러내기 전까지는 0에 가깝다가, 그 날이 오면 수직으로 치솟는다는 사실입니다.

개인 인지의 다섯 가지 취약점 유형

인지 과학은 지난 50년 동안 인간의 추론이 조용히 어긋나는 주요 방식 대부분을 지도화해 왔습니다. 이 글이 다루는 종류의 점검에서 가장 중요한 다섯 범주가 있습니다.

낡은 사전 신념(Stale priors). 어떤 조건에서 형성한 신념을, 조건이 변하는 동안 한 번도 재검토하지 않은 경우입니다. 가장 흔하고 가장 비용이 큽니다. 한 번도 도전받지 않았기 때문에 정확히 그만큼 믿을 만하게 느껴집니다. Daniel Kahneman의 System 1 사고에 대한 연구가 그 이유를 설명합니다. 마음은 오래 유지된 결론을 캐시된 결과처럼 다루며, 재유도(re-derivation)를 건너뜁니다.

확증 표류(Confirmation drift). 시간이 흐르면서 당신은 점점 더 자신의 기존 프레이밍을 공유하는 출처를 읽고, 시청하고, 그런 사람들로 주변을 채우게 됩니다. 알아채지 못한 채 입력값이 좁아집니다. 10년차가 되면 어떤 질문에 대해 추론한다기보다는, 점점 더 좁아지는 정보 거품 안에서 입장을 재진술하고 있을 뿐입니다. 이것이 Cass Sunstein이 집단 극화 연구에서 내린 진단입니다.

프레임워크 충성(Framework allegiance). 어떤 지적 프레임워크(리더십 모델, 경제 학파, 생산성 시스템, 세계관 등)를 배우고, 그 후로 모든 것을 그 프레임을 통해 걸러 보기 시작합니다. 프레임워크는 보이지 않게 됩니다. 그것이 프레임워크라는 사실 자체를 더 이상 의식하지 못합니다. 그저 "원래 그런 것"처럼 느껴집니다. Robert Kegan의 발달 이론은 이것을 정신적 구성물을 "객체(object)"로 붙잡고 다루는 대신 그것에 "종속(subject to)"되어 있는 상태라고 묘사합니다.

가용성 편향(Availability bias). 머릿속에 쉽게 떠오르는 것이 그렇지 않은 것보다 더 참되게 느껴집니다. 최근 사건, 생생한 사례, 당신의 사회적 서클이 이야기하는 것들이 모두 체계적으로 과대 평가됩니다. 더 오래된 데이터, 먼 지역, 낮은 지위의 출처들은 과소 평가됩니다. Tversky와 Kahneman은 1970년대에 이를 실험적으로 증명했고, 소셜 미디어 시대에도 상황은 나아지지 않았습니다.

매몰 비용 신념(Sunk-cost beliefs). 어떤 입장에 공개적으로 약속했고, 그것을 바탕으로 결정을 내렸으며, 다른 사람들에게도 말했습니다. 이제 마음을 바꾸는 일에는 인지적 비용에 더해 사회적 비용까지 얹힙니다. 그래서 본래라면 증거가 당신을 움직였을 지점을 지나서도 신념을 방어하게 됩니다. 그 방어는 엄밀함처럼 느껴집니다. 실제로는 관성입니다.

이 중 어느 것도 개인의 결함이 아닙니다. 인간 인지가 작동하는 방식 그 자체입니다. 핵심은 이것을 가지고 있다고 자책하는 것이 아닙니다. 이런 것들이 오래된 코드 안에서 버그가 쌓이는 방식과 정확히 동일하게 누적된다는 점, 즉 조용히, 예측 가능하게, 적절한 입력이 도착해 드러내 줄 순간을 기다리며 쌓인다는 점을 알아차리는 것입니다.

무엇이 멘탈 모델의 취약점에 해당하는가

우리가 실제로 무엇을 스캔하는지에 대해서는 구체적이어야 합니다. 의견의 모든 변화가 취약점은 아닙니다. 모든 편안한 신념이 버그도 아닙니다.

유용한 지표들:

취약점 유형	어떻게 나타나는가	Mythos에 빗댄 비유
낡은 사전 신념	"내 업계에 대해 늘 X라고 생각해 왔다"가 갱신되지 않음	아무도 손대지 않은 수십 년 된 코드 경로
확증 표류	어떤 주제에 대한 모든 하이라이트가 동의하는 출처에서만 옴	정상 흐름만 검사하는 테스트 스위트
프레임워크 충성	그 프레임워크의 실패 양상을 설명할 수 없음	어디에도 적힌 적 없는 숨겨진 가정
가용성 편향	최근의 생생한 이야기가 과도한 확신을 만들어 냄	이력을 무시하고 캐시에만 의존하는 로직
매몰 비용 신념	"이미 공개적으로 ...라고 말했기 때문에"	호환성을 위해 살려 둔 레거시 API

유용한 시험: 당신의 사전 신념을 공유하지 않는 사려 깊은 사람이 이것을 한 번도 검증된 적 없는 하중 지탱 가정이라고 부를 만한가? 그렇다면, 그것이 점검 대상입니다.

당신이 찾고 있는 것이 아닌 것: 당신이 틀렸을 가능성이 있는 모든 지점. 그 집합은 무한합니다. 점검은 표적화되어 있습니다. 다른 결정들이 의존하고, 한 번도 테스트되지 않았으며, 현실적으로 재검토할 수 있는 가정을 찾으십시오.

이 점검을 머릿속에서 돌릴 수 없는 이유

여기서 곤란한 부분이 있습니다. 점검하려는 대상(당신 자신의 사고)이 점검을 수행하는 그것과 동일한 것입니다. 이것은 문제입니다.

자기 점검을 하면, 당신은 보통 자신이 예상하는 것을 찾아냅니다. 취약점을 만들어 낸 그 인지적 지름길이 점검도 함께 수행합니다. 외부 기준점 없는 자기 점검은, 코드베이스 안에 박혀 있는 가정에 맞춰 자기 자신을 테스트하는 코드베이스와 같습니다. 통과할 것입니다.

세 가지 외부 기준점 방식이 작동합니다.

첫째는 다른 사람들입니다. 특히 다른 사전 신념을 가진 사람들입니다. 이것이 당신의 네트워크에서 지적 다양성이 중요한 이유입니다. 그러나 이는 느리고 사회적 비용이 크며, 대부분의 사람들의 네트워크는 본인이 생각하는 것보다 덜 다양합니다. 따라서 보통은 이것만으로 충분하지 않습니다.

둘째는 시간입니다. 10년 전에 자신이 쓴 글을 읽어 보십시오. 의미 있는 의미에서, 지금의 당신은 그 시절의 당신에 대한 외부 감사인입니다. 문제는 시간 기반 점검이 드물고, 글로 남긴 기록이 있어야만 가능하다는 점입니다. 대부분의 사람은 그런 기록을 사용 가능한 형태로 가지고 있지 않습니다.

셋째는 지난 2년 사이에 새로 가능해진 것으로, 자신의 말뭉치에 대한 AI 보조 검색입니다. 인프라가 이제 저렴해졌음에도 여전히 충분히 활용되지 않는 선택지입니다. 수년에 걸쳐 하이라이트하고, 주석을 달고, 메모해 둔 모든 것을 AI에 넣고, 구체적이고 구조화된 질문을 던지십시오. AI는 당신이 어떤 결론을 지키고 싶은지 모릅니다. 당신의 과거 입장에 대한 사회적 투자도 가지고 있지 않습니다. 인간의 자기 성찰이 따라잡지 못하는 속도로 모순, 공백, 그리고 검증되지 않은 의존성을 드러낼 수 있습니다.

이는 chat-with-your-notes-personal-RAG 접근에서 다룬 것과 같은 논리이지만, 다른 의도로 적용됩니다. 목표는 노트를 요약하는 것이 아닙니다. 노트를 심문하는 것입니다.

당신이 사실상 만들고 있는 것은 Anthropic이 코드 분석을 위해 만든 것의 개인 버전입니다. 자신의 사고 퇴적층을 스캔하고 가정이 낡아 보이는 자리를 표시해 주는 시스템입니다.

개인의 소스 코드로서의 하이라이트

스캔이 작동하려면 말뭉치가 필요합니다. 아무 텍스트나 되는 것이 아닙니다. 구체적으로는, 그 당시 무언가 의미가 있었기에 표시해 둔 텍스트입니다.

이것이 Glasp의 웹 하이라이터와 Kindle 임포트가 이 목적에 유용한 이유입니다. 이들이 만들어 내는 데이터는 신호 대 잡음 비율이 비정상적으로 높습니다. 당신은 중요하다고 느낀 문장만을 하이라이트했습니다. 각 하이라이트는 사실상 과거의 당신이 남긴 작은 커밋 메시지입니다. "이건 보관할 가치가 있어."

3년에 걸친 꾸준한 하이라이팅은 개인 소스 저장소에 해당합니다. 당신은 자신에게 영향을 준 사람들, 설득력 있게 느꼈던 논증, 채택한 프레이밍, 반복해서 돌아간 작가들을 볼 수 있습니다. 그 이력은 머릿속에서는 보이지 않습니다. 잊혀진 브라우징 세션들 사이에 흩어져 있습니다. 그러나 페이지 위에, 데이터베이스 안에서는, 그것은 그저 데이터일 뿐입니다.

이 점검에서 하이라이트가 다른 형식보다 더 잘 작동하는 몇 가지 구체적인 이유:

당신이 직접 큐레이션한 것입니다. 브라우저 히스토리(잡음으로 가득함)와 달리, 하이라이트는 당신의 주의에 의해 미리 걸러진 것입니다.
출처가 명시되어 있습니다. 모든 주장을 그것을 말한 사람에게로 거슬러 올라가 추적할 수 있고, 당신이 에코 챔버로 표류했는지 확인할 수 있습니다.
시간 정보가 찍혀 있습니다. 2021년과 2024년에 어떤 프레이밍을 채택했는지 볼 수 있고, 그 바탕 주장이 여전히 유효한지 물을 수 있습니다.
AI가 로드하기에 충분히 작습니다. 수천 개의 하이라이트도 현대의 컨텍스트 윈도에 편안하게 들어맞습니다.

Building a second brain는 이 실천에 대한 토대 격 논변이었습니다. 달라진 점은, 이제 세컨드 브레인이 단순 검색을 넘어 실제로 쓸모 있어졌다는 것입니다. 자기 점검에 유용합니다. 그리고 personal context management는 AI 시대에 이것이 왜 중요한지에 대한 더 넓은 틀입니다.

YouTube와 팟캐스트 하이라이트도 여기에서 중요합니다. 멘탈 모델 형성의 많은 부분이 오디오와 비디오를 통해 일어나기 때문입니다. 독서 로그에서는 출처가 균형 잡혀 보이지만 시청 이력이 단일 문화에 머물러 있다면, 그것은 독서 로그만으로는 드러나지 않는 취약점입니다. YouTube Summary의 타임스탬프 덕분에 영상 출처도 같은 말뭉치 안에 들어가 동등하게 스캔 가능합니다.

실용적인 개인 취약점 점검 절차

분기마다 돌릴 수 있는 워크플로를 소개합니다. 대략 한 시간 정도 걸립니다. 영웅적인 일은 하나도 없고, 설명만 보면 힘들어 보이는 부분도 실제로는 빠르게 지나갑니다.

1단계: 하중을 지탱하는 신념 하나를 고른다. 가벼운 의견 말고 인생의 여러 결정이 의존하고 있는 신념을 고르십시오. 예: "내 분야에서 가장 중요한 기술은 X다", "내 상황의 사람들은 Y를 최적화해야 한다", "Z를 배우는 옳은 방법은 내가 써 온 방식이다." 그 신념을 한 문장으로 적으십시오.

2단계: 신념의 날짜를 매긴다. 그 신념을 형성한 것은 대략 언제였습니까? 어떤 조건에서였습니까? 당시 어떤 출처를 신뢰했습니까? 이 단계 하나만으로도 무언가가 드러나는 경우가 많습니다. 2014년에 형성하고, 2018년 이후 더 이상 따라가지 않게 된 작가들에 기반한 신념은, 더 이상 적용되지 않을 수 있는 데이터 위에서 돌아가고 있는 셈입니다.

3단계: 지지 증거를 자신의 말뭉치에 질의한다. 하이라이트에 대한 AI Chat을 사용해 이렇게 묻습니다. "이 신념을 지지하는 내가 표시한 모든 하이라이트를 출처와 날짜와 함께 보여 줘." 그 목록을 읽으십시오. 분포를 관찰하십시오. 지지 하이라이트가 모두 같은 세 명의 작가에게서 온 것인가요? 단일한 지적 전통에서 온 것인가요? 5년이라는 좁은 시간 구간에서만 온 것인가요?

4단계: 반대 증거를 질의한다. 이것이 사람들이 가장 자주 건너뛰는 단계이며, 가장 큰 가치가 숨어 있는 단계입니다. 이렇게 묻습니다. "X라는 주장을 반박하거나 복잡하게 만드는 하이라이트를 내 말뭉치에서 찾아 줘." 무엇이 반박으로 간주되는지 구체적으로 명시하십시오. AI는 당신이 표시해 두었지만 통합하지 않은 것들을 드러낼 것입니다. 종종 흥미롭다고 표시는 했으나 뒤따라가지 않은 것들이 그 안에 있습니다.

5단계: 빈틈을 본다. 어떤 증거가 비어 있습니까? 자신의 말뭉치에서 반박을 단 하나도 찾지 못했다면, 그것은 깨끗한 건강 진단서가 아닙니다. 거품 안에서 읽어 왔다는 신호입니다. 거품 밖으로 나가십시오. 빈틈의 핵심은 자신을 반증하는 것이 아닙니다. 어디에 데이터가 없는지를 식별하는 것입니다.

6단계: 무엇을 할지 결정한다. 선택지: 신념을 갱신한다, 새로운 출처에 맞춰 스트레스 테스트한다, 다음 달에 반박하는 저작 한두 편을 읽기로 자기 자신에게 과제를 부여한다, 또는 "현재 불확실"이라고 명시적으로 표시하고 그 라벨을 단 채로 진행한다. 결정 자체보다 라벨링이 더 중요합니다. 그 신념을 보이지 않는 기본값에서 보이는 선택으로 옮기는 작업입니다.

이 절차의 한 버전을 좋은 투자자, 과학자, 운영자들은 이미 비공식적으로 수행하고 있습니다. Mythos의 교훈은, 비공식 버전만으로는 더 이상 충분하지 않다는 것입니다. 점검이 이제 충분히 저렴해졌기 때문에, 하지 않는 쪽이 오히려 비싼 선택지가 되었습니다.

함정과 그 회피 방법

워크플로를 잘못 쓰기 쉽기 때문에 주의할 함정 몇 가지를 짚어 둡니다.

고해성사로 만들지 마십시오. 목표는 과거의 신념에 대해 자책하는 것이 아닙니다. 표류를 감지하고 갱신하는 것입니다. 각 발견을 임상적으로 다루십시오. 모델을 업데이트하고 다음으로 넘어가십시오.

AI가 무엇을 믿어야 할지 정해 주게 두지 마십시오. AI는 신탁이 아닙니다. 당신의 말뭉치에 대한 검색 엔진이며, 거기에 일반 지식이 더해진 것입니다. "X가 참인가"라고 물으면 그럴듯하게 들리지만 틀릴 수 있는 답을 받게 됩니다. 증거를 드러내는 용도로 쓰십시오. 판결을 내리게 하지 마십시오. 판단은 당신의 몫입니다. AI thinking trap은 실재하며 여기에도 적용됩니다.

모든 것을 한꺼번에 점검하지 마십시오. 분기에 한 개의 신념을 고르십시오. 1년에 세 개 정도면 충분합니다. 전체 세계관을 한 번에 재검토하려는 시도는 지치기만 할 뿐 쓸모도 없습니다. 깊은 신념은 각각 별도의 주의가 필요하기 때문입니다.

새로움을 옳음과 혼동하지 마십시오. 동시대의 견해가 자동으로 더 오래된 견해보다 우월한 것은 아닙니다. 당신의 낡아 보이는 사전 신념 중 일부는, 옳기 때문에 낡아 보이는 것이며 세계가 계속해서 그것을 증명해 주고 있는 것입니다. 점검의 핵심은 유행을 좇는 것이 아닙니다. 어떤 결론이 여전히 그 자리를 차지할 자격이 있는지를 의도적으로 확인하는 것입니다.

출처 검토를 건너뛰지 마십시오. AI가 반박하는 하이라이트를 드러냈을 때, 원래 어디서 읽었는지 살펴보십시오. 어떤 경우에는 반박이 진짜입니다. 어떤 경우에는 그것이 옳아서가 아니라 도발적이어서 표시한 것입니다. 출처의 품질은 여전히 중요합니다.

이 워크플로는 거창한 의식이 아니라 조용한 습관으로 가장 잘 작동합니다. 분기마다, 한 시간, 신념 하나. 5년이면 의도적으로 재검토된 신념 20개입니다. 암묵적인 대안과 비교해 보십시오. 0개입니다.

Frequently Asked Questions

이건 결국 자신을 끊임없이 의심하기 위한 핑계 아닌가요?

아닙니다. 워크플로의 설계 자체가 정확히 그런 일을 막기 위한 것입니다. 한 분기에 하중을 지탱하는 신념 하나를 점검하는 것이지, 끝없는 자기 비판을 돌리는 것이 아닙니다. 당신이 피하고 싶은 위험은 정반대입니다. 아무것도 점검하지 않는 것 말입니다. 끊임없이 마음을 바꾸는 사람들은 이 점검을 돌리고 있는 것이 아닙니다. 그저 최신의 주장에 휩쓸리고 있을 뿐입니다. 핵심은 느린 박자로 이루어지는 구조화된 재검토입니다.

대부분의 신념이 잘 뒷받침된다는 사실을 발견하면 어떻게 되나요?

그렇다면 유용한 무언가를 확인한 것이고, 그 신념에 대해서는 한동안 걱정을 멈출 수 있습니다. 코드 점검이 매번 버그를 찾아야 하는 것이 아닌 것처럼, 점검이 매번 취약점을 찾을 필요는 없습니다. 음성 결과(negative results)에도 가치가 있습니다. 더 큰 문제는 스캔을 아예 돌리지 않은 채 모든 것이 괜찮다고 가정하는 일입니다.

이것이 일기 쓰기나 자기 성찰과 어떻게 다른가요?

두 가지 점에서 다릅니다. 첫째, 외부 말뭉치(당신의 하이라이트)를 사용한다는 점입니다. 이는 그 순간의 편향에 훨씬 덜 좌우됩니다. 둘째, 검색에 AI를 사용한다는 점입니다. 수년치 입력을 몇 초 안에 훑을 수 있습니다. 일기 쓰기는 지금 이 순간 당신에게 두드러진 것을 드러내는 경향이 있습니다. 이 워크플로는 시간에 걸쳐 당신에게 두드러져 왔던 것을 드러냅니다. 훨씬 넓고 훨씬 정직한 데이터셋입니다.

이게 작동하려면 수년치 하이라이트가 필요한가요?

아니지만, 많을수록 좋습니다. 몇 개 주제에 대해 6개월 정도만 꾸준히 하이라이트해도 패턴을 드러내기에 충분합니다. 첫 번째 점검은 더 가벼울 것입니다. 2년차쯤 되면 말뭉치가 충분히 조밀해져 AI 검색이 거의 신기하게 느껴지기 시작합니다. 0에서 시작한다면, 답은 지금 시작하고 3개월 뒤에 작은 점검을 한 번 돌리는 것입니다.

AI가 결국 내 기존 견해를 확인해 주기만 하는 것 아닌가요?

질의 방식에 달려 있습니다. "내 신념 X가 맞아?"라고 물으면, 그렇습니다. 종종 듣기 좋게 다듬어진, 어물쩍거리는 답을 얻게 됩니다. "이 주장을 복잡하게 만드는 내가 표시한 모든 구절을 찾아 줘"라고 물으면, 쓸모 있는 답을 얻습니다. 질의 구조 자체가 게임의 전부입니다. AI를 판관이 아니라 검색 엔진으로 다루십시오.

내 하이라이트가 여러 도구에 흩어져 있다면 어떻게 하나요?

해결할 가치가 있는 워크플로 문제이지만, 시작을 막는 장애물은 아닙니다. 가장 큰 단일 출처를 골라 거기에 대해 먼저 점검을 돌리십시오. 시간이 흐르면서 하나의 질의 가능한 말뭉치로 통합하면(Glasp가 Kindle 임포트와 YouTube Summary를 같은 시스템 안으로 들여오므로), 점검이 훨씬 강력해집니다.

한 번도 적어 두지 않은 신념은 어떻게 하나요?

설계상 가장 어려운 부분입니다. 하이라이트 말뭉치를 쌓는 일의 핵심은, 그렇지 않으면 머릿속에만 남았을 것을 외부화한다는 점입니다. 말뭉치에 한 번도 들어간 적이 없는 신념은, 표시할 만큼 의도적으로 마주한 적도 없는 신념입니다. 그런 신념이 점검에 보이지 않는 것은 아니지만, 외부화하기 시작했을 때 비로소 읽을 수 있게 됩니다. 외부화하는 행위 자체가 유용한 실천입니다.

결론: 다음 점검을 스케줄링하라

Anthropic의 Mythos Preview는 앞으로 수년 동안 사이버보안 맥락에서 논의될 것입니다. 그러나 그 사건이 남기는 더 오래 가는 교훈은 코드에 관한 것이 아닙니다. 검토에 관한 것입니다.

Mythos가 찾아낸 버그들은 정교한 것이 아니었습니다. 오래된 것이었습니다. 아무도 그것들을 재검토하지 않았기 때문에 살아남았습니다. 더 유능한 분석기가, 사람들이 더 이상 들여다보지 않게 된 자리를 인내심 있게 들여다볼 수 있게 되자, 버그는 거의 즉시 드러났습니다. 취약점은 코드 자체에 있지 않고 점검의 부재에 있었습니다.

당신의 멘탈 모델도 같은 조건 아래에서 살아갑니다. 오래전에 설정한 기본값들이 배경에서 돌아가며 결정을 형성하고 있고, 설정된 이래 한 번도 재검토되지 않았습니다. 반드시 틀린 것은 아닙니다. 그저 점검되지 않았을 뿐입니다. 그중 일부는 거의 확실히 버그입니다. 스캔을 돌리기 전까지는 어느 것이 그러한지 알지 못합니다.

그 스캔을 돌릴 도구들이 이제 존재합니다. 5년 전에는 없었습니다. 당신 자신의 하이라이트로 이루어진 말뭉치, 그것을 질의할 수 있는 AI, 그리고 구조화된 분기 워크플로. 그것이 스택 전체입니다. 3개월에 한 시간도 안 걸립니다. 기술적으로 어려운 부분은 거의 없습니다. 어려운 것은 그것을 습관으로 만드는 일입니다.

이번 주에 하중을 지탱하는 신념 하나를 고르십시오. 날짜를 매기십시오. 스캔을 돌리십시오. 무엇이 돌아오는지 보십시오. 신념이 확인될 수도 있습니다. 그렇다면 다음 라운드까지 그것을 유지할 권리를 얻은 셈입니다. 또는 조용히 나쁜 하류 결정을 만들어 내고 있던 낡은 사전 신념을 발견할 수도 있습니다. 그렇다면 가장 값진 종류의 업그레이드를 방금 사들인 것입니다.

Glasp의 웹 하이라이터, Kindle 하이라이트 임포트, 그리고 말뭉치에 대한 AI Chat은 정확히 이런 종류의 작업을 위해 설계되었습니다. 오늘부터 말뭉치를 시작하십시오. 첫 번째 스캔은 3개월 뒤에 돌리십시오. 어떤 기본값이 망가졌는지 알아내기 위해 Mythos급의 폭로를 기다리지 마십시오.

모델은 당신의 감사인이 아닙니다. 당신이 감사인입니다. 말뭉치는 그 점검을 가능하게 해 주는 것입니다.