대부분의 프롬프트가 사고가 아닌 답을 주는 이유
사람들이 AI에 대해 하는 불만이 있습니다. 대략 이런 식입니다. "자신만만하고, 일반적이고, 살짝 틀린 것을 준다." 본능은 모델을 탓하는 것입니다. 솔직한 답은, 대부분의 프롬프트가 산출물을 요구하고, 모델은 산출물을 돌려준다는 것입니다. 요약을 요청하면 요약을 받습니다. 다섯 가지 팁 목록을 요청하면 다섯 가지 팁 목록을 받습니다. 결과가 얕게 느껴지는 이유는 요청이 얕았기 때문입니다.
프린스턴의 연구자들은 KDD 2024 논문(Aggarwal et al.)에서 프롬프트 구조의 인용 행동에 관한 이 격차를 정확히 연구했습니다. 그들이 발견한 것은, 프롬프트 구조가 모델이 무엇에 주목할지를 바꾼다는 것입니다. 모델이 무엇을 말할지뿐만 아니라요. 프레이밍의 작은 변화가 어떤 출처가 인용되는지, 어떤 반론이 떠오르는지, 어떤 가정이 명시되는지를 바꿉니다. 다시 말해, 프롬프트는 검색 쿼리가 아닙니다. 프레임입니다.
이 글은 그 프레임의 카탈로그입니다. 특정한 사고 작업을 위한, 구체적이고 이름 붙고 복사 붙여넣기 가능한 여덟 개의 프롬프트 패턴입니다. 관련된 Glasp 글 두 편이 옆에 있습니다. Context engineering은 AI가 일하는 방을 꾸리는 것에 관한 글입니다. 문서, 출처, 제약. The AI thinking trap은 AI가 너무 매끄럽게 느껴지기 시작할 때 자신의 비판적 태도를 유지하는 것에 관한 글입니다. 이 글은 움직임 카탈로그 자체입니다. 방, 태도, 그리고 움직임.
아래의 각 패턴은 같은 구조를 가집니다. 언제 쓸지, 어디서 왔는지, 정확한 프롬프트, 돌아오는 답의 예시, 그리고 왜 그것이 작동하는지. 체크리스트가 아니라 어휘로 다루세요.
패턴 1: 스틸맨 (Steel-Man)
**스틸맨 (Steel-Man)**은 반대 의견을 반박하기 전에 그 의견의 가능한 한 가장 강한 버전을 구성하는 훈련입니다. 짚허수아비(스트로맨)의 반대입니다. 약한 캐리커처를 공격하는 대신, 가장 강한 버전을 무너뜨립니다.
언제 쓸지: 입장을 옹호하기 전에, 논증을 발표하기 전에, 또는 이미 거의 마음을 굳힌 고위험 결정을 내리기 전에.
기원: 보통 1960년대 Anatol Rapoport의 건설적 토론 규칙으로 거슬러 올라갑니다. 이 규칙은 상대방의 입장을 너무 잘 다시 진술해서 상대가 "고마워요, 그렇게 표현했으면 좋았을 텐데"라고 말할 정도여야 한다고 요구합니다.
프롬프트:
[내 입장]에 대한 반대 의견을 스틸맨해 주세요. 내가 놓치고 있을 가능성이 있는
증거나 프레이밍을 포함해서, 가능한 한 가장 강한 주장을 만들어 주세요. 얼버무리지 마세요.
끝에 "그런데 사실은"을 덧붙이지 마세요. 그냥 주장을 만들어 주세요.
예시 출력: "이번 주에 MVP를 출시해야 한다"는 입장에 대해, 스틸맨된 응답은 이렇게 말할 수 있습니다. "이번 주에 출시하는 것은 고칠 수 있는 출시를 영구적인 첫인상과 맞바꾸는 일입니다. 첫 주에 떠난 고객은 거의 돌아오지 않습니다. 2주 지연의 비용은 작습니다. 손상된 평판에 맞서 재출시하는 비용은 큽니다."
왜 작동하는가: 대부분의 사람들은 상대가 똑똑해서 논쟁에서 지는 것이 아닙니다. 멍청한 버전에 대비했기 때문에 집니다. 스틸맨은 공개적으로 자기 진영에 헌신하기 전에 똑똑한 버전을 마주하도록 강제합니다.
패턴 2: 프리모템 (Pre-Mortem)
**프리모템 (Pre-Mortem)**은 사후 분석(post-mortem)을 시간상 뒤집습니다. 프로젝트가 왜 실패했는지를 분석하는 대신, 이미 실패했다고 상상하고 거기에 이른 경로를 재구성합니다.
언제 쓸지: 계획, 프로젝트, 또는 기능을 출시하기 전에. 특히 팀이 이미 자신감에 차 있을 때.
기원: Gary Klein, "Performing a Project Premortem," Harvard Business Review, 2007. Klein은 팀이 실패가 이미 현실이라고 가정했을 때 잠재적 실패 이유를 30% 더 많이 생성한다는 것을 발견했습니다.
프롬프트:
지금은 [지금부터 6개월 후 날짜]입니다. 제가 곧 설명할 계획은 처참하게 실패했습니다.
실패에 이른 가장 가능성 있는 사건의 순서를 안내해 주세요. 우리가 무엇을 놓쳤는지,
누가 너무 늦게 반대를 제기했는지, 어떤 초기 신호를 무시했는지에 대해 구체적이어야 합니다.
계획: [여기에 계획을 붙여넣기]
예시 출력: "두 번째 달까지, 출시 트래픽은 주별로 60% 떨어졌습니다. 팀은 추천에서 오는 자연 성장을 가정했지만, 추천 루프는 늦게 출시된 기능을 필요로 했습니다. 네 번째 달까지, 파트너 회사의 원래 챔피언은 떠났고, 후임자와 관계를 쌓은 사람은 아무도 없었습니다."
왜 작동하는가: 회고적 미래(prospective hindsight)는 뇌가 검색하는 방식을 바꿉니다. "무엇이 잘못될 수 있는가?"라고 묻는 것은 모호한 답을 얻습니다. "무엇이 잘못되었는가?"라고 묻는 것은 구체적인 답을 얻습니다. 허구의 확실성이 진짜 구체성을 풀어냅니다.
패턴 3: 핵심 가정 (Load-Bearing Assumption)
**핵심 가정 (Load-Bearing Assumption)**은 당신의 논증이 의존하는 침묵의 주장들을 표면화합니다. 대부분의 논증에는 거짓이라면 전체 구조를 무너뜨릴 한두 개의 가정이 있습니다. 대부분의 사람들은 그것들을 결코 명명하지 않습니다.
언제 쓸지: 결정에서 막혔을 때, 예산이나 인원을 투입하기 전에, 또는 계획이 명백히 옳게 느껴지는데 왜 그런지 말할 수 없을 때.
프롬프트:
이 논증에서 핵심 가정 3개를 식별해 주세요. 각각에 대해 알려 주세요:
1. 그것을 반증할 증거는 무엇인가
2. 하루 안에 어떻게 확인할 수 있는가
3. 그것이 거짓으로 드러나면 무엇이 바뀌는가
논증: [논증을 붙여넣기]
예시 출력: "가정 1: 사용자가 첫 방문 시 10초 로드 시간을 견딜 것이라는 가정. 반증 조건: 랜딩 페이지에서 60% 이상의 이탈률. 하루 점검: 프로토타입 URL의 지난주 분석을 가져옴. 거짓이라면: 전체 온보딩 흐름에 빠른 경로가 필요함."
왜 작동하는가: 가정은 보이지 않는 정도에 비례해 위험합니다. 그것들을 소리내어 명명하는 것은 주문을 깹니다. "하루 안에 확인" 제약이 이 연습을 정직하게 유지합니다. 확인할 수 없다면, 주장할 수 없습니다.
패턴 4: 반전법 (Inversion)
**반전법 (Inversion)**은 질문을 거꾸로 묻습니다. "X에서 어떻게 성공할까?" 대신, "어떻게 하면 X의 가능한 가장 나쁜 버전을 보장할 수 있을까?"라고 묻습니다. 그런 다음 그것들을 피합니다.
언제 쓸지: 문제가 막혔다고 느껴질 때, 그 주제에 대한 조언이 상투적인 말로 가득할 때, 또는 해야 할 일보다 피해야 할 일을 더 빨리 나열할 수 있을 때.
기원: Charlie Munger가 19세기 수학자 Carl Jacobi에게서 빌려왔습니다. Jacobi의 조언은 "뒤집어라, 항상 뒤집어라"였습니다. Munger는 이를 자신이 가진 가장 유용한 멘탈 모델 중 하나라고 불렀습니다.
프롬프트:
[문제]를 해결하는 대신, 이 결과의 최악 버전을 보장할 모든 행동을
나열해 주세요. 구체적이고 명확하게요. 그런 다음 당신의 목록에서
거꾸로 작업해 실제로 무엇을 해야 할지 알아낼 것입니다.
예시 출력: "어떻게 훌륭한 온보딩 이메일을 쓸까?"에 대해 반전법은 다음을 만들어 냅니다. "800단어를 쓰세요. 회사 역사로 시작하세요. 액션 버튼을 페이지 하단 아래에 묻으세요. 'we are excited'를 두 번 사용하세요. 금요일 오후 5시에 보내세요. 이름만 개인화하고 테스트는 잊으세요."
왜 작동하는가: 사람들은 성공을 설계하는 것보다 실패를 알아보는 데 더 능합니다. 반전법은 뇌에 실제로 잘 맞히는 구체적인 표적을 줍니다. 최악의 버전이 일단 종이에 적히면, 더 나은 버전은 대부분 그 부정입니다.
패턴 5: 악마의 감사 (Devil's Audit)
**악마의 감사 (Devil's Audit)**는 다른 누구도 보기 전에 자신의 초안에 대고 실행하는 움직임입니다. 모델에게 적대적 리뷰어 역할을 하라고 요청하고, 구체적이어야 한다고 요청합니다.
언제 쓸지: 초안을 쓴 뒤, 논증을 끝낸 뒤, 또는 덱을 조립한 뒤. 보내거나, 발표하거나, 발표하기 전에.
프롬프트:
이 초안을 적대적이지만 똑똑한 리뷰어로서 감사해 주세요. 구체적으로 나열해 주세요:
1. 가장 약한 주장
2. 가장 부당한 일반화
3. 독자가 나에게 동의한다고 가정하고 있는 부분
4. 편집자가 가장 잘라낼 가능성이 높은 부분
구체적이어야 합니다. 정확한 문장을 인용해 주세요.
초안: [초안을 붙여넣기]
예시 출력: "가장 약한 주장: '대부분의 팀은 문화 때문에 실패한다'(3번째 문단)는 인용이 부족하고, 당신이 나중에 인용한 McKinsey 2023 연구와 모순됩니다. 가장 부당한 일반화: '엔지니어는 문서를 읽지 않는다.' 가정된 동의: 5번째 문단은 비동기 작업을 명백히 더 낫다고 다루지만, 많은 독자가 그렇게 보지 않을 것입니다."
왜 작동하는가: 당신이 쓴 것과 낯선 사람이 읽는 것 사이의 격차는 거대합니다. 대부분의 작가는 자신의 가정이 마치 자신이 마시는 공기처럼 느껴지기 때문에 그것을 볼 수 없습니다. 적대적 리뷰어는 그 공기를 보이게 만듭니다. "정확한 문장을 인용하라" 제약은 구체성을 강제하는데, 그곳이 바로 가치가 사는 곳입니다.
패턴 6: 사전 브리프 (Pre-Reading Brief)
**사전 브리프 (Pre-Reading Brief)**는 콘텐츠를 소비하기 전에 마음을 준비시킵니다. 수동적으로 읽는 대신, 이미 무엇을 찾아야 할지 아는 사람으로서 읽습니다.
언제 쓸지: 긴 글, 빽빽한 논문, 중요한 영상, 또는 실제로 기억해야 하는 책 챕터를 읽기 전에.
프롬프트:
이것을 읽기 전에 알려 주세요:
1. 읽는 동안 마음에 담아둘 질문 3개
2. 주의해야 할 가장 강한 반론
3. 나머지를 잊더라도 기억해야 할 세 문장
출처: [붙여넣기 또는 링크]
예시 출력: "이 질문들을 담아두세요: (1) 저자의 가장 강한 증거는 무엇인가? (2) 사건의 시간선이 어디에서 흐릿해지는가? (3) 누구의 관점이 빠져 있는가? 주의할 반론: 저자는 두 번째 인용 연구에서 상관관계를 인과관계로 다룹니다. 기억할 세 문장: [...]"
왜 작동하는가: 이것은 인지적 점화(priming)입니다. Mayer의 멀티미디어 학습 인지 이론에 따르면, 구조적 미리보기를 받은 학습자는 읽거나 보는 내용의 약 30%를 더 많이 기억합니다. 들어오는 정보를 작업 기억에 차갑게 담아두는 대신 비계에 붙일 수 있기 때문입니다. 브리프가 그 비계입니다.
패턴 7: Synthesis-from-N
Synthesis-from-N은 한 주제에 대해 여러 출처를 모았고 그것들 전반에서 구조를 추출해야 할 때의 패턴입니다. 각각의 요약이 아닙니다. 합의, 갈등, 그리고 공유된 사각지대를 표면화하는 종합입니다.
언제 쓸지: 한 주제에 대해 여러 글, 논문, 또는 트랜스크립트를 읽은 뒤. 특히 모아 온 Glasp 하이라이트 라이브러리가 있을 때 유용합니다.
프롬프트:
이 N개 출처를 다음으로 종합해 주세요:
1. 핵심 합의 (모두가 동의하는 것)
2. 가장 큰 의견 차이 (그들이 서로 명시적으로 모순되는 곳)
3. 모든 출처가 공유하지만 아무도 의문을 제기하지 않는 가정
출처: [하이라이트, 링크, 또는 인용 붙여넣기]
예시 출력: "핵심 합의: 다섯 출처 모두 작업 기억이 학습의 병목이라는 데 동의합니다. 가장 큰 의견 차이: 출처 2와 4는 분산 반복이 인터리빙을 능가하는지에 대해 갈립니다. 공유된 의심받지 않는 가정: 모든 출처가 동기를 외생적인 것으로 다루며, 형식 자체가 참여를 어떻게 형성하는지 무시합니다."
왜 작동하는가: 대부분의 사람들은 N개 출처를 읽고 N개 요약으로 끝납니다. Synthesis-from-N은 하나의 지도를 강제합니다. 세 번째 항목, 의심받지 않는 가정이 보통 실제 통찰이 사는 곳입니다. 그것이 바로 그 분야에서 아직 아무도 묻지 않는 질문이기 때문입니다. 읽기-하이라이트-종합 순환에 대한 더 긴 설명은 the synthesis loop을 참고하세요.
패턴 8: 실패 모드 헌터 (Failure-Mode Hunter)
**실패 모드 헌터 (Failure-Mode Hunter)**는 시스템 사고 패턴입니다. 그 무언가가 망가질 수 있는 방식을 나열하고, 확률과 심각성으로 순위를 매기고, 각각을 일찍 잡을 수 있는 것이 무엇인지 묻습니다.
언제 쓸지: 시스템, 프로세스, 제품, 또는 신규성보다 신뢰성이 더 중요한 도구를 설계할 때.
프롬프트:
[시스템]의 상위 7개 실패 모드를 나열해 주세요. 각각에 대해 알려 주세요:
1. 확률 (낮음 / 중간 / 높음)
2. 심각성 (낮음 / 중간 / 높음)
3. 한 시간 안에 그것을 잡아낼 가장 저렴한 탐지 메커니즘
시스템: [시스템을 설명]
예시 출력: "실패 모드 1: 트래픽 스파이크 시 데이터베이스 연결 풀 고갈. 확률: 중간. 심각성: 높음. 탐지: 연결 대기 시간이 200ms를 초과할 때 알림. 실패 모드 2: 서드파티 API가 오류 없이 조용히 속도 제한을 거는 경우. 확률: 높음. 심각성: 중간. 탐지: 5분마다 알려진 픽스처와 응답 페이로드를 비교하는 합성 점검."
왜 작동하는가: 실패 모드는 보통 누군가에게는 알려져 있습니다. 문제는 그것이 당신에게, 일이 일어나기 전에 알려져 있는가입니다. 확률, 심각성, 그리고 저렴한 탐지 메커니즘을 강제하는 것은 모호한 걱정을 우선순위가 매겨진 체크리스트로 바꿉니다. "한 시간 안에" 제약이 진짜 모니터링과 연극을 갈라냅니다.
한 페이지 치트 시트 (그리고 패턴을 외우는 방법)
전체 카탈로그를 한 곳에 모았습니다.
| 패턴 | 언제 | 트리거 문구 |
|---|---|---|
| 스틸맨 (Steel-Man) | 견해를 옹호하기 전에 | "나에게 가장 강한 반대를 만들어 주세요." |
| 프리모템 (Pre-Mortem) | 계획을 출시하기 전에 | "이미 실패했습니다. 무슨 일이 있었나요?" |
| 핵심 가정 (Load-Bearing Assumption) | 막혔거나 헌신할 때 | "이것을 떠받치는 가정 3개는 무엇인가요?" |
| 반전법 (Inversion) | 성공이 모호하게 느껴질 때 | "어떻게 최악을 보장할 수 있을까요?" |
| 악마의 감사 (Devil's Audit) | 초안을 쓴 후에 | "적대적 리뷰어가 되어 주세요." |
| 사전 브리프 (Pre-Reading Brief) | 콘텐츠를 소비하기 전에 | "어떤 질문 3개를 담아둬야 하나요?" |
| Synthesis-from-N | 여러 출처를 읽은 후에 | "합의, 갈등, 공유된 사각지대." |
| 실패 모드 헌터 (Failure-Mode Hunter) | 시스템을 설계할 때 | "상위 7개 실패 모드, 순위 매김." |
이를 외우는 비결은 자신의 작업에서 그것들을 이름 부르는 것입니다. 다음에 자신의 입장에 대한 가장 강한 반론을 요청할 때, 그냥 타이핑하지 마세요. "이거 스틸맨 돌리는 중이야"라고 말하세요. 초안을 마쳤을 때, "악마의 감사 돌리는 중"이라고 말하세요. 움직임을 명명하는 것은 그것을 일회성 프롬프트에서 일관되게 집어들 수 있는 도구로 바꿉니다.
Glasp의 웹 하이라이터와 잘 작동하는 실용적인 리듬: 먼저 하이라이트, 그다음 패턴. 읽으면서 중요해 보이는 구절을 저장하세요. 그런 다음 하이라이트 라이브러리에 대고 패턴을 돌리세요. 동의하지 않는 출처에서 가져온 하이라이트로 자신의 입장을 스틸맨 처리하고, 모은 하이라이트에 대고 초안을 악마의 감사 처리하고, 주제 클러스터 전반에 Synthesis-from-N을 돌리세요. 하이라이트는 원재료입니다. 패턴은 그 재료에 가하는 움직임입니다. Glasp의 AI 채팅 기능은 이 리듬을 중심으로 만들어졌습니다. 당신의 하이라이트는 이미 컨텍스트 안에 있으므로, 패턴은 모델이 추측한 것이 아니라 당신이 실제로 읽은 것 위에서 작동합니다.
이것에 능숙해진 사람들 대부분은 한 주에 여덟 가지를 모두 쓰는 일이 없습니다. 자신의 사고 방식에 맞는 두세 가지를 골라 유창해집니다. 그것이 목표입니다. 외운 여덟 가지 패턴이 아니라, 자동조종으로 돌아가는 두세 가지 패턴.
자주 묻는 질문
이 패턴들이 어떤 LLM에서도 작동하나요?
네. GPT-5, Claude 4.6, Gemini 2.5에서 테스트되었고, 모델별 트릭이 아니라 프롬프트 구조에 관한 것이기 때문에 통합니다. 위의 예시 출력들은 세 모델 모두에서 비슷한 품질로 생성되었습니다. 더 작은 모델은 같은 형태의 더 얕은 버전을 만들겠지만, 형태는 유지됩니다.
여덟 개를 모두 외워야 하나요?
아니요. 두 개부터 시작하세요. 대부분의 지식 노동에서 가장 큰 레버리지를 가진 것은 스틸맨과 프리모템입니다. 스틸맨은 실제로 압력 시험하지 않은 입장을 옹호하지 않도록 막아 줍니다. 프리모템은 실패 모드가 회고적으로 이미 명백한 계획을 출시하지 않도록 막아 줍니다. 상황이 생길 때 다른 것들을 추가하세요. 사람들이 세 번째로 채택하게 되는 것은 보통 반전법입니다.
이건 그냥 프롬프트 엔지니어링 아닌가요?
관련이 있지만, 목표가 다릅니다. 프롬프트 엔지니어링은 모델의 산출물을 최적화합니다. 더 나은 답, 더 적은 환각, 더 깨끗한 형식. 사고 패턴은 당신의 인지를 최적화합니다. 자신의 사각지대를 잡고, 자신의 가정을 표면화하고, 자신의 논증을 날카롭게 합니다. 산출물은 부수 효과입니다. 요점은 당신이 패턴을 돌릴 때 당신의 머릿속에서 무엇이 일어나는가입니다.
chain-of-thought 또는 단계별 프롬프트는 어떤가요?
Chain-of-thought는 이것들과 쌓일 수 있는 메타 패턴입니다. 위 여덟 가지 패턴 중 어느 것에든 "단계별로 생각해 주세요"를 덧붙일 수 있고, 보통 더 엄밀한 응답을 얻습니다. 특히 기본적으로 추론을 하지 않는 모델에서요. 하지만 CoT 단독으로는 특정한 표적이 없는 장황한 사고를 만들어 내는 경향이 있습니다. 위 여덟 가지 패턴은 사고를 구체적인 무언가로 향하게 합니다. 위험도가 추가 토큰을 정당화할 때 그것들을 함께 쓰세요.
결론
AI가 "얕다"는 불만은 대부분 얕은 프롬프트에 대한 불만입니다. 위의 패턴들은 모델을 더 똑똑하게 만들지 않습니다. 당신의 요청을 더 똑똑하게 만들고, 그곳에 실제 레버리지가 삽니다.
여덟 개의 이름 붙은 움직임. 반대 의견에는 스틸맨. 계획에는 프리모템. 결정에는 핵심 가정. 막혔을 때는 반전법. 초안에는 악마의 감사. 콘텐츠에는 사전 브리프. 출처들 전반에는 Synthesis-from-N. 시스템에는 실패 모드 헌터. 이름이 중요한 이유는, 그것이 그 순간에 실제로 기억할 것이기 때문입니다. "이거 스틸맨 돌려 봐"는 자신에게 할 수 있는 말입니다. "프롬프트에 더 비판적인 프레이밍을 사용하라"는 그렇지 않습니다.
이 카탈로그에서 한 가지를 가져간다면, 이것을 가져가세요: 목표는 AI로부터 더 나은 답을 얻는 것이 아닙니다. 목표는 당신으로부터 더 날카로운 사고를, 자신에게 묻는 것을 잊은 질문을 묻는 파트너로서의 AI와 함께 얻는 것입니다. 여덟 개의 패턴은 그 파트너십이 작동하게 만드는 여덟 개의 신뢰할 만한 방법입니다. 두 개를 고르세요. 유창해지세요. 작업이 요구하면 더 추가하세요.