Learning

Mythos効果:AIで自分のメンタルモデルをストレステストする方法

もしClaude Mythosが、500万回のテストを生き延びた27年前のカーネル脆弱性を発見できたとしたら、20代の頃に形成されて以来一度も再検討していない信念の中には、いったい何が潜んでいるでしょうか。

13分で読める
重要なポイント
    • 古いコードと古い信念は、同じ失敗の型を共有しています:どちらも検証されないことで生き延びてきました。Mythosは広く普及したシステムに潜む数十年前のバグを暴き出しました。同じ「レビューの空白」が、多くの人のメンタルモデルの中にも存在しています。
  • メンタルモデルの脆弱性は実在し、測定可能です:認知科学はこの50年間、それらを記録し続けてきました。確証バイアス、利用可能性ヒューリスティック、現状維持バイアス、そして古い前提条件はいずれも、放置される期間が長いほど意思決定の質を下げていきます。
  • AIは今や個人用の脆弱性スキャナーとして機能できるレベルに達しました:何を考えるべきかを教えてくれるのではなく、あなた自身のハイライトやノートの間に潜む矛盾を、手作業で監査するよりはるかに速く浮かび上がらせてくれます。
  • ハイライトは、あなたの思考の監査ログです:何年にもわたって印を付けた一節には、暗黙の前提、特定のフレームワークへの傾倒、そして自分でも気付かなかった思考の変化が含まれています。その蓄積に対してAI Chatを使えば、ログを問い合わせ可能な対象に変えられます。
  • 監査は反応的ではなく、意図的に行うべきです:年に一度より四半期に一度の方が役立ちます。目的は自分を絶えず否定することではなく、ドリフトを早期に検出することです。
  • 「自分が間違っている証拠」を探しているわけではありません:あなたが探しているのは、推論がまだ検証していない何かに依存している箇所です。そこにこそ、安価なアップグレードの機会が眠っています。

Mythosが鳴らした警鐘

AnthropicのMythos Previewレポートで最も居心地が悪かったのは、何千件ものゼロデイ脆弱性に関する部分ではありません。技術的な詳細の中に静かに埋め込まれていた一文の方でした。Mythosが浮かび上がらせたバグの多くは、数十年にわたる人間によるレビューと、500万回を超える自動テストを生き延びてきたというのです。

この一文は重要です。危険な欠陥がどうやって隠れるのかについて、具体的なことを語っているからです。それらは巧妙さによって隠れているわけではありません。検証されないことによって隠れています。17年前のFreeBSDのNFSバグ(CVE-2026-4747)、27年前のOpenBSDのTCP SACK脆弱性、16年前のFFmpegの欠陥は、いずれもインターネットの大半が動かしているコードの中で目に見えるところにありました。一方で、人々の注意は新しいモジュールへと移っていったのです。これらのシステムは監査されていなかったわけではありません。ある種の前提を見ることをやめてしまった人たちによって、監査されていたのです。

「コード」を「あなたの世界観」に置き換えて、もう一度同じ文を読んでみてください。10年前に形成した信念に対して、新たに監査をかけたのはいつが最後でしょうか。正直に答えるなら、多くの人は一つも思い出せないはずです。お金、人間関係、キャリア、学び、政治、世界の仕組みについて20代で設定したデフォルト値は、いまだに背景で動き続け、意思決定を形作りながら、本番投入以降一度も再検討されていません。

これがMythos効果です。モデルそのものではなく、それが伝えてくれる教訓です。より高性能なアナライザーが、地球上で最も入念にレビューされてきたコードから数十年前の欠陥を見つけ出せるのであれば、それは間違いなく、あなたが頭の中で持ち歩いている、はるかに監査の甘いオペレーティングシステムの欠陥も浮かび上がらせられます。

良い知らせは、これをやるためにMythosへのアクセスは必要ない、ということです。必要なのはコーパスとワークフローです。コーパスはすでに多くの人が持っています。ワークフローを持っている人は、ほとんどいません。

信念が古いコードベースに似ている、認めたくない理由

プログラマーは長い間、最も危険なコードは新しいコードではないことを知っていました。誰も触らないコードの方が危険なのです。安定して「実戦投入済み」で、本番で動いている。研究者がある日、その中に組み込まれていた前提が5年前に成立しなくなっていたことを発見し、塔全体がむき出しになる瞬間まで。

信念にも同じ病理があります。三つの性質が、信念をとりわけ脆弱にしています。

第一に、信念は荷重を支える構造体です。たとえば「どんな仕事が自分を幸せにするか」についての信念は、個別の主張ではありません。それは、ほかの多くの意思決定が依存している前提です。キャリアの選択、資産設計、住む場所。深くインポートされているライブラリのように、それがずれると、下流のすべてもずれていきます。だからこそ人は再検討に抵抗します。監査のコストが、巨大に感じられるのです。

第二に、信念は敵対的な条件下でめったにテストされません。ほとんどの信念は、それを裏付ける環境でしか運用されません。同じ前提を持つ人たちと時間を過ごし、自分の枠組みを補強するソースを読み、ある種の前提がローカルな合意になっている業界で働く。ファズテストにかけられないコードのように、バグを露呈させる入力は決して届きません。これは非常に賢い人たちにも当てはまり、環境が時間とともに同質化していくほど顕著になります。

第三に、信念は、もはや存在しないかもしれない条件に合わせて最適化されています。2015年に形成した「キャリアの仕組み」についての信念は、2015年には妥当でした。その時に応答していた世界には、別の前提条件がありました。テック業界の採用慣行、ソーシャルメディアのインセンティブ、リモートワークの地理的分布、資本コスト、AIが専門職の堀を変えていく速度。これらはすべて、ときに急激にずれてきました。古い環境向けに最適化された信念を現在の環境で走らせるのは、誰もアップデートしなかった17年前のカーネルモジュールを動かしているのと、認知的には同じ意味を持ちます。

Mythosが居心地の悪い明瞭さで示したのは、古いコードを走らせ続けるコストは、何かがそれを暴く日まではゼロに近い、ということです。そして、その日になると一気に急上昇します。


個人の認知における5つの脆弱性クラス

認知科学はこの50年間で、人間の推論が静かに誤りに向かう主要な経路の大半を地図化してきました。本記事が対象とする監査にとって、特に重要なのは次の5つのカテゴリーです。

古い前提条件(Stale priors)。ある条件下で形成され、条件が変わっても再検討されていない信念です。これは最も一般的で、最もコストの高い種類です。一度も挑戦されていないからこそ、信頼できるように感じられます。Daniel KahnemanのSystem 1思考についての研究がその理由を説明しています。心は、長く保持された結論をキャッシュされた結果として扱い、再導出をスキップしてしまうのです。

確証ドリフト(Confirmation drift)。時間が経つにつれて、あなたは自分の既存の枠組みを共有するソースを読み、見て、周りに置くようになります。入力が知らないうちに狭まっていきます。10年目には、もはや問いについて推論しているのではなく、ますます狭くなる情報バブルの内側からポジションを再表明しているだけになります。これはCass Sunsteinが集団分極化に関する研究で診断した現象です。

フレームワーク忠誠(Framework allegiance)。あなたはある知的フレームワーク(リーダーシップモデル、経済学派、生産性システム、世界観)を学び、すべてをそれを通して濾過し始めます。やがてフレームワークは見えなくなります。それがフレームワークであることに気付かなくなり、ただ「世界とはこういうものだ」と感じるようになります。Robert Keganの発達理論は、これを心的構築物を「対象」として外から見るのではなく、その「主体」になってしまっている状態として描写しています。

利用可能性バイアス(Availability bias)。心に思い浮かびやすいものは、そうでないものよりも真実らしく感じられます。最近の出来事、鮮明な事例、自分の社会的サークルが話題にしていることが、体系的に過大評価されます。古いデータ、遠い地域、地位の低いソースは過小評価されます。TverskyとKahnemanが1970年代に実験的に示したこの現象は、ソーシャルメディアの時代に入ってからも改善していません。

サンクコスト的信念(Sunk-cost beliefs)。あなたはあるポジションを公に表明し、それに基づいて意思決定を下し、ほかの人にも伝えてきました。今となっては、考えを変えることには認知的コストに加えて社会的コストもかかります。そのため、その信念は、本来なら証拠によって動かされたはずの地点を越えて防衛され続けます。防衛は厳密さのように感じられます。実際にはただの慣性です。

これらはどれも個人的な欠陥ではありません。人間の認知はこのように働きます。重要なのは、これらを持っていることに自己嫌悪を感じることではありません。これらは古いコードの中でバグが蓄積するのとまったく同じ仕方で蓄積していく、ということに気付くことです。静かに、予測通りに、適切な入力が来てそれを暴くのを待ちながら。


何をもってメンタルモデルの脆弱性と呼ぶか

実際に何をスキャンしているのかを具体化しておくと役に立ちます。意見の変化がすべて脆弱性というわけではありません。心地よい信念がすべてバグだというわけでもありません。

参考になる指標は次の通りです。

脆弱性クラスどのように現れるかMythosでの対応
古い前提条件「自分の業界では昔からこうだと思っていた」が更新されていない誰も触らなかった数十年前のコードパス
確証ドリフトあるトピックに関するハイライトが、すべて同じ立場のソースから来ているハッピーパスしか確認しないテストスイート
フレームワーク忠誠そのフレームワークの失敗モードを言語化できない一度も書き出されなかった隠れた前提
利用可能性バイアス最近の鮮明な話が、不釣り合いに大きな確信を生み出している履歴を無視するキャッシュ専用ロジック
サンクコスト的信念「すでに公に発言してしまっているから……」互換性のために生かされ続けるレガシーAPI

役に立つテスト:あなたの前提を共有していない思慮深い人が、これを「あなたが一度も検証していない、荷重を支える前提」と呼ぶでしょうか。答えがイエスなら、それが対象です。

探しているのは、自分が間違っているかもしれないあらゆる箇所ではありません。その集合は無限です。監査は的を絞ったものです。ほかの意思決定が依存していて、まだテストされておらず、現実的に再検討できる前提を探しましょう。


このスキャンを頭の中だけで実行できない理由

ここからが厄介な部分です。あなたが監査しようとしているもの(自分自身の思考)は、監査を実行しているものと同じです。これは問題です。

自己検証を行うとき、人は予想していたものを見つけがちです。脆弱性を生み出したのと同じ認知的近道が、検査も走らせているのです。外部のグラウンディングを持たない自己監査は、コードベースが自分自身に焼き付けられた前提に対して、自分のテストを走らせているようなものです。テストは通ってしまいます。

外部のグラウンディングを与える仕組みは三つあります。

第一は、他者、特に異なる前提を持つ人々です。だからこそ、ネットワークにおける知的多様性が重要になります。ただしこれは時間がかかり、社会的コストが高く、多くの人のネットワークは本人が思っているほど多様ではありません。そのため、これだけで十分なことはめったにありません。

第二は、時間です。10年前の自分が書いたものを読み返してください。意味のある意味で、今のあなたは過去のあなたの外部監査人です。問題は、時間による監査が頻度が低く、使える形式で書き残されていることに依存することです。多くの人は、その記録を持っていません。

第三は、ここ2年で新たに登場した、自分自身のコーパスに対するAI支援検索です。これは、インフラが安価になった今でも、まだ十分に活用されていない選択肢です。長年ハイライトしたり注釈を付けたりノートにしたりしてきたものをすべてAIに渡し、具体的で構造化された質問を投げかけます。AIはあなたが残したい結論を知りません。あなたが過去のポジションに対して持つ社会的投資もありません。AIは、人間の自己内省が追いつけないペースで、矛盾、ギャップ、検証されていない依存関係を浮かび上がらせられます。

これはchat-with-your-notes-personal-RAGで論じたのと同じ論理を、別の意図で適用したものです。目的はノートを要約することではありません。それを問い詰めることです。

事実上あなたが構築しているのは、Anthropicがコード解析のために構築したものの、個人版です。自分自身の思考の蓄積をスキャンして、前提が古びて見える箇所にフラグを立てるシステムです。


ハイライトという、あなた自身のソースコード

スキャンを機能させるには、コーパスが必要です。テキストなら何でもいい、というわけではありません。具体的には、当時意味があると感じたから印を付けたテキストです。

これが、この目的においてGlaspのウェブハイライターKindleインポートを役立つものにしています。これらが生み出すデータは異例なほど高シグナルです。あなたは重要だと感じた文だけをハイライトしました。一つひとつのハイライトは、事実上、過去の自分からの小さなコミットメッセージなのです。「これは取っておく価値がある」というメッセージ。

3年間継続的にハイライトを続ければ、それは個人用のソースリポジトリに相当します。あなたの影響源、説得力を感じた論証、採用したフレーミング、何度も戻った書き手たちが見えるようになります。この履歴は頭の中では見えません。それは忘れ去られたブラウジングセッションの中に散らばっています。ですがページの上、データベースの中であれば、それはただのデータです。

ハイライトが、この監査にとってほかのフォーマットより優れている具体的な理由がいくつかあります。

  • あなた自身がキュレーションしています。ノイズだらけのブラウザ履歴と違って、ハイライトは事前にあなたの注意でフィルターされています。
  • 出典が紐付いています。あらゆる主張を誰が言ったかまで辿ることができ、自分がエコーチェンバーに流れ込んでいないかを確認できます。
  • タイムスタンプ付きです。2021年と2024年でそれぞれどんなフレーミングを採用したかが見え、その根底にある主張がまだ成立するかを問えます。
  • AIがロードできる程度に小さいです。数千件のハイライトでも、最近のコンテキストウィンドウに余裕で収まります。

Building a second brainは、この実践の基礎を打ち立てた文章でした。何が変わったかというと、セカンドブレインが取り出し以外の用途で実際に役立つようになった、ということです。自己監査に役立つようになりました。そしてpersonal context managementは、なぜこれがAI時代に重要なのかを示す、より広いフレームです。

YouTubeやポッドキャストのハイライトもここでは重要です。なぜなら、メンタルモデルの形成の多くは音声や映像を通じて起こるからです。読書ログのソースはバランスが取れているのに、視聴履歴が単一文化的だとしたら、それは読書ログだけでは暴けない脆弱性です。YouTube Summaryのタイムスタンプによって、映像ソースも同じコーパスの中に置かれ、同じ条件でスキャンできるようになります。


実践的な個人脆弱性スキャン

四半期ごとに走らせられるワークフローを紹介します。所要時間はおよそ1時間です。英雄的なことは何もありませんし、説明上は手間がかかりそうに見える部分も、実際にやってみるとすぐ終わります。

ステップ1:荷重を支える信念を一つ選ぶ。気軽な意見ではありません。あなたの人生のいくつかの意思決定が依存している信念です。例:「自分の分野で最も重要なスキルはXだ」「自分の状況にいる人はYを最適化すべきだ」「Zを学ぶ正しい方法は、これまで使ってきたやり方だ」。その信念を一文で書き出してください。

ステップ2:信念に日付を付ける。それをだいたいいつ形成しましたか。どんな条件下で。当時、どんなソースを信頼していましたか。このステップだけで何かが浮かび上がってくることがよくあります。2014年に形成された信念で、根拠が2018年以降フォローをやめた書き手たちにあるとしたら、それはもはや当てはまらないかもしれないデータの上で動いています。

ステップ3:コーパスを支持証拠で検索するハイライトに対するAI Chatを使って、こう尋ねてみてください。「この信念を支持するハイライトを、出典と日付付きですべて見せて」。リストを読みましょう。分布に注目してください。支持しているハイライトはすべて同じ3人の書き手から来ていませんか。単一の知的伝統に属していませんか。5年間に集中していませんか。

ステップ4:反対証拠を検索する。これは多くの人が飛ばすステップで、価値の大半はここに眠っています。「Xという主張を否定したり複雑化したりするハイライトを、コーパスの中から見つけて」と尋ねてください。何が反対に当たるのかを具体的にしておきます。AIは、あなたが印を付けたものの統合しなかったものを浮かび上がらせます。たいていは、興味深いと印を付けたものの、最後まで追わなかったものです。

ステップ5:ギャップを見る。どんな証拠が欠けていますか。自分のコーパスの中に何も反対が見つからなかったとしたら、それは健康診断で問題なしという意味ではありません。バブルの中で読んできた、というサインです。一歩外に出ましょう。ギャップを見る目的は、自分を否定することではなく、自分にデータがない場所を特定することです。

ステップ6:どうするかを決める。選択肢:信念を更新する、新しいソースに対してストレステストにかける、今後1か月の間に1〜2本の反対を扱う著作を読むよう自分に課す、あるいは「現時点では不確実」と明示的にラベルを付けてそのまま進む。決断そのものよりも、ラベリングの方が重要です。あなたは信念を「見えないデフォルト」から「見える選択」へと移しているのです。

このやり方の何らかの形は、優れた投資家、科学者、オペレーターがすでに非公式に行っていることです。Mythosの教訓は、非公式版ではもはや十分ではないということです。監査は今や十分に安く、行わない方が高くつく選択肢になっています。


落とし穴と、その回避方法

ワークフローは誤用されやすいので、気を付けたい罠をいくつか挙げておきます。

告解にしないこと。目的は過去の信念について自己嫌悪に陥ることではありません。ドリフトを検出して更新することです。一つひとつの発見を臨床的に扱いましょう。モデルを更新し、次へ進みます。

AIに何を信じるべきかを決めさせないこと。AIは神託ではありません。あなた自身のコーパスに対する検索エンジンで、そこに一般知識が乗っているだけです。「Xは正しいか」と尋ねれば、流暢に聞こえるけれど誤っている可能性のある回答が返ってきます。判決を下すためではなく、証拠を浮かび上がらせるために使いましょう。判断はあなたのものです。AI thinking trapは実在し、ここでも当てはまります。

一度にすべてを監査しないこと。四半期ごとに信念を一つ選んでください。多くても年に3つです。世界観全体を一度に再検討しようとするのは、消耗するうえに役にも立ちません。深い信念は、それぞれ別の注意を必要とするからです。

新しさと正しさを混同しないこと。現代的な見解が古い見解より自動的に優れているわけではありません。古びて見える前提の中には、正しいからこそ古びて見えるものもあり、世界はそれを証明し続けています。監査の目的は流行を追うことではありません。どの結論がまだ自分のポジションを得る価値を持つのかを、意図的に検証することです。

ソースの確認を飛ばさないこと。AIが反対のハイライトを浮かび上がらせたら、それをどこで最初に読んだのかを確認してください。本当に反対であることもあります。正しいから印を付けたのではなく、挑発的だったから印を付けただけのこともあります。ソースの質は依然として重要です。

このワークフローは、劇的な儀式としてではなく、静かな習慣として最もよく機能します。四半期に1時間、信念を一つ。5年で20の信念を意図的に再検討したことになります。それを、暗黙の代替案であるゼロと比べてみてください。


Frequently Asked Questions

これは結局、自分を常に疑い続ける言い訳ではありませんか

違いますし、ワークフローはまさにそれを防ぐように設計されています。永続的な自己批判を行うのではなく、四半期に荷重を支える信念を一つだけ監査します。避けたいリスクは逆の方です。何も監査しないことです。常に意見を変えている人はこの監査を実行していません。彼らはその時々の流行に揺さぶられているだけです。要点は、ゆっくりとしたリズムで、構造化された再検討を行うことです。

自分の信念のほとんどが十分に裏付けられていることが分かったら、どうなりますか

そうしたら、有用なことを確認したことになり、その信念についてはしばらく心配しなくて済みます。監査は毎回脆弱性を見つける必要はありません。コード監査が毎回バグを見つける必要がないのと同じです。否定的な結果にも価値があります。もっと大きな問題は、スキャンを一度も走らせずに、すべてが大丈夫だと決め込んでしまうことです。

これは日記や自己内省とどう違うのですか

二つの点で違います。第一に、外部のコーパス(あなたのハイライト)を使う点です。これは、その瞬間のバイアスに左右される内省よりはるかに揺らぎが少ないものです。第二に、検索にAIを使う点です。何年分もの入力を数秒でスキャンできます。日記は、今のあなたにとって顕著なものを浮かび上がらせがちです。このワークフローは、時間をまたいであなたにとって顕著だったものを浮かび上がらせます。それは、はるかに広く、はるかに正直なデータセットです。

これを機能させるには、何年分ものハイライトが必要ですか

必要ではありません。ただし多いほど良いです。いくつかのトピックに関する6か月分の継続的なハイライトでも、パターンを浮かび上がらせるには十分です。最初の監査は軽めになります。2年目に入ると、コーパスは密度が増し、AI検索が不気味に感じられるほどになります。ゼロから始めるなら、答えは「今日から始めて、3か月後に小さな監査を走らせる」ことです。

AIはデフォルトで、私の既存の見解を確認するだけではありませんか

それは質問の仕方によります。「私の信念Xは正しいか」と尋ねれば、もちろん、お世辞っぽく濁した答えがよく返ってきます。「これを複雑化するハイライトを、私がマークしたものの中から見つけて」と尋ねれば、有用なものが返ってきます。質問の構造がすべてです。AIを判定者ではなく、検索エンジンとして扱いましょう。

ハイライトが複数のツールに散らばっている場合はどうすればよいですか

それは解決する価値のあるワークフロー上の問題ですが、始めることの妨げにはなりません。最大の単一ソースを選んで、まずそれに対して監査を走らせましょう。やがて、問い合わせ可能な一つのコーパスに統合していけば(KindleインポートとYouTube Summaryが同じシステムに流れ込むGlaspの構成のように)、監査ははるかに強力になります。

一度も書き出したことのない信念についてはどうですか

それらは、設計上、最も難しい対象です。ハイライトコーパスを構築する意義そのものが、本来は頭の中だけにとどまっていたであろうものを外部化するところにあります。コーパスに入ってきたことのない信念は、印を付けるほど意図的に向き合ったことのない信念でもあります。それらは監査から不可視というわけではありませんが、外部化を始めてはじめて読み取れるようになります。その外部化自体が、有用な実践なのです。


結論:次のスキャンを予定に入れる

AnthropicのMythos Previewは、サイバーセキュリティの文脈で今後何年も議論されていくでしょう。ただし、それがもたらすより長く持続する教訓は、コードについてのものではありません。レビューについてのものです。

Mythosが見つけたバグは、高度なものではありませんでした。古いものでした。誰もそれを再検討しなかったから生き延びてきたのです。より高性能なアナライザーが、人間が見るのをやめた箇所をじっくり見る忍耐力を持って到着した途端、バグはほとんど即座に浮上しました。脆弱性はコードそのものではなく、監査の不在の中にありました。

あなたのメンタルモデルも、同じ条件下で生きています。何年も前に設定したデフォルトは背景で動き続け、意思決定を形作りながら、設定以来一度も再検討されていません。必ずしも間違っているわけではありません。ただ未検証なだけです。そのうちのいくつかは、ほぼ確実にバグです。どれがそうなのかは、スキャンするまで分かりません。

そのスキャンを実行する道具は、今や存在します。5年前にはありませんでした。自分のハイライトのコーパス、それを問い合わせられるAI、そして構造化された四半期ワークフロー。それがスタックのすべてです。コストは3か月に1時間未満。技術的に難しいことはほとんど何もありません。難しいのは、それを習慣にすることだけです。

今週、荷重を支える信念を一つ選んでください。日付を付け、スキャンを走らせ、何が返ってくるかを見てください。信念を確認することになるかもしれません。その場合、あなたはそれを次のラウンドまで保持する権利を得たことになります。あるいは、静かに下流の意思決定を悪化させてきた古い前提条件を見つけるかもしれません。その場合、あなたは最も価値の高い種類のアップグレードを手に入れたばかりです。

GlaspのウェブハイライターKindleハイライトのインポートコーパスに対するAIチャットは、まさにこの種の作業のために設計されています。コーパスを今日から始めてください。最初のスキャンは3か月後に。あなたのどのデフォルトが壊れているかを知るために、Mythos級の啓示を待つ必要はありません。

監査人はモデルではありません。あなた自身です。コーパスは、その監査を可能にするものです。

Start building your knowledge library

Highlight what matters as you read across the web. Save insights from articles, books, and YouTube videos in one place.

Get Started Free