同じ材料を渡しても、GPTとCodexで反応が違った

AI活用

※この記事は2026年5月時点の実運用メモです。  

※特定のAIサービスの性能比較ではなく、自分がブログ記事を作る中で感じた使い分けの記録です。

最近、Mythosに関する記事を書いた。

Claude Mythos Previewの話題を見て、

「Mythosを借りられるか」だけではなく、

借りた後に何を直すのか。

日本としてどう守るのか。

政府を待つだけでいいのか。

という方向でまとめた記事だ。

このテーマ自体は、かなり時事性が強い。

AI安全保障。

サイバー防衛。

政府対応。

民間企業の備え。

中国AIの話。

金融機関の話。

こういう要素が入ってくる。

なので、いつものブログ運用記事よりも、少し扱いが難しかった。

その時に面白かったのが、同じ材料をAIに見せても、GPTとCodexで反応がかなり違ったことだった。

GPTは、記事としての強さや流れを見て、かなり前向きに整理してくれた。

一方でCodexは、どちらかというと慎重だった。

出典は大丈夫か。

断定が強すぎないか。

政府批判だけになっていないか。

サイバー攻撃の話に寄りすぎていないか。

前回記事と差別化できているか。

そういうところに、かなりブレーキを踏んできた。

最初は少し不思議だった。

同じ材料を渡しているのに、片方はGOに近く、片方はSTOPに近い。

でも、実際に記事を仕上げてみると、この差がかなり役に立った。

今回は、その話を整理しておきたい。

## 同じ材料なのに、返ってくる反応が違った

今回の材料は、かなり強かった。

Mythosという新しいAIモデルの話題。

Anthropicの公式発表。

Red Teamの評価。

Reuters系の報道。

安野貴博氏の問題提起。

英国と日本の対応差。

民間企業が今すぐ何をするべきか。

記事のネタとしては、かなり引っかかりがある。

GPTに見せると、

「これは今日出すなら強い」

「出典があるなら本命にしていい」

「前回のアモデイ発言記事とは、切り口を変えれば差別化できる」

という方向で返ってきた。

たしかに、自分でもそう思った。

ただ、Codex側では少し違う反応が出た。

危険だから書くな、というより、

「書くならここを慎重に」

という反応に近かった。

攻撃手法に寄せない。

中国AIの話を断定しない。

政府批判だけで終わらせない。

Reuters/FT報道の扱いを強くしすぎない。

日本のAI防衛の話は、個人の違和感として書く。

こういう注意が出てきた。

同じ記事案なのに、見ている場所が違う。

GPTは、記事として成立するかを強く見ていた。

Codexは、公開物として危ういところがないかを強く見ていた。

そんな印象だった。

## GPTは、記事としての流れを作るのがうまかった

GPT側の良さは、記事の方向を決めるところだった。

今回、自分が最初に感じていた違和感は、

「みんなMythosそのものに目が行きすぎていないか」

というものだった。

でも、それだけだと少しぼんやりしている。

何が問題なのか。

どこに引っかかっているのか。

前回の記事と何が違うのか。

そこを言語化する必要があった。

GPTに相談すると、

「Mythosを借りられるかより、借りた後に何を直すのか」

「日本としてどう守るのか」

「Mythosありきではなく、防衛体制の話にする」

という形に整理してくれた。

これはかなり助かった。

自分の中では、いろいろな不満や違和感が混ざっていた。

Mythosの話題が過熱している。

政府の対応が遅い気がする。

日本は借りる側のままでいいのか。

民間企業は待つしかないのか。

AIが見つけた脆弱性を誰が直すのか。

こういうものが、頭の中に同時にあった。

GPTは、それを記事の流れとしてまとめるのがうまかった。

結論。

理由。

見出し。

前回記事との差別化。

タイトル案。

公開直前セット。

このあたりを、かなり前向きに組み立ててくれる。

記事を書く時の「進める力」としては、かなり強い。

## Codexは、公開前のブレーキ役になった

一方で、Codexは少し違う役割だった。

Codexに同じ話をすると、記事の勢いよりも、公開時の危うさに目が向いていた。

特に今回のようなテーマでは、それが効いた。

AI安全保障。

サイバー防衛。

政府対応。

中国AI。

金融機関。

こういう話は、強く書こうと思えばいくらでも強く書ける。

でも、強く書きすぎると危ない。

出典以上のことを断定してしまう。

国や企業のリスクを決めつけてしまう。

政府批判だけの記事に見えてしまう。

攻撃手法の話に近づいてしまう。

そうなると、自分のブログの本線からもズレる。

自分が書きたいのは、煽る記事ではない。

AI時代に、どう情報を見て、どう整理して、どう自分の運用に落とすか。

そこを書きたい。

Codexは、その方向に戻すブレーキ役になった。

「政府の対応が遅い」という話も、最初は少し強く出したくなった。

でも、Codex側で整理すると、

政府批判だけではなく、

民間側も今あるAIやツールで防衛プロセスを先に作る必要がある

という形に落とした方がいい、という方向になった。

これは、かなり良かったと思う。

ただ怒って終わる記事ではなくなった。

AIに何を見てもらい、

見つかったものを誰が読み、

どれを優先し、

どう直し、

どう再確認するのか。

この運用の話に戻せた。

## どちらが正しいというより、役割が違う

今回のことで思ったのは、GPTとCodexのどちらが正しいかではなかった。

役割が違う。

たぶん、これが一番近い。

GPTは、素材を記事として前へ進めるのがうまい。

ぼんやりした違和感を、読める形にしてくれる。

タイトルを出してくれる。

構成を整えてくれる。

公開用のパッケージも作ってくれる。

一方でCodexは、作業環境の中で文脈を見ながら、少し堅めに止めてくる。

この表現は強すぎないか。

出典は足りているか。

前回の記事と被っていないか。

公開済みの流れとつながるか。

Obsidianやblog_ideasにどう残すか。

そういう確認に向いている。

もちろん、これは自分の使い方での感覚だ。

AIの性格が固定でそうなっている、と言いたいわけではない。

同じAIでも、プロンプトや文脈、使っている場所、渡した資料、こちらが求めた役割によって変わると思う。

ただ、実運用としては、

前に進めるAI

止めて確認するAI

の両方があると、かなり助かる。

## AIの反応差は、邪魔ではなく確認材料になる

以前なら、AIごとに違うことを言われると、少し面倒に感じていた。

どっちが正しいのか。

どちらを信じればいいのか。

なぜ同じ材料なのに違うのか。

そう思っていた。

でも最近は、反応差そのものが確認材料になると感じている。

たとえば、GPTがかなり前向きで、Codexが慎重だった場合。

これは、記事としては強いけれど、公開時の扱いに注意が必要な素材かもしれない。

逆に、どちらも前向きなら、比較的出しやすい記事かもしれない。

どちらも止めるなら、まだ材料が足りないか、公開するには危うい可能性がある。

こう考えると、AIの反応差はノイズではない。

むしろ、素材の性質を見分けるためのサインになる。

今回のMythos記事は、まさにその例だった。

GPTは、時事性と記事としての強さを見ていた。

Codexは、出典、断定、政策批判、サイバー領域の危うさを見ていた。

その両方を見たことで、記事の形がかなり安定した。

## 片方のAIだけだと、たぶん偏っていた

もしGPTだけで進めていたら、もっと勢いのある記事になっていたと思う。

それはそれで、読まれやすかったかもしれない。

でも、少し強く言いすぎた可能性もある。

逆に、Codexだけで見ていたら、慎重になりすぎて、記事化を見送っていたかもしれない。

それもまた、もったいない。

今回の素材は、出典もあり、時事性もあり、自分の問題意識もはっきりしていた。

だから、本来は記事にしてよかった。

ただし、書き方には注意が必要だった。

つまり、

出すか出さないか

ではなく、

どう出すか

が問題だった。

ここで、GPTとCodexの反応差が効いた。

GPTで進める。

Codexで止める。

自分で判断する。

この順番が、かなりしっくりきた。

## 自分の判断を消さないために、AIを複数使う

AIを複数使うと、便利な反面、迷うこともある。

GPTはこう言っている。

Codexはこう言っている。

Geminiなら別の答えを出すかもしれない。

Claudeならさらに違うかもしれない。

全部を聞いていると、逆に進まなくなる。

でも、今回のように役割を分けると使いやすい。

GPTには、記事として成立するかを見てもらう。

Codexには、公開前のリスクや既存メモとの整合性を見てもらう。

最後に、自分がどちらを採用するか決める。

この流れなら、AIに振り回されにくい。

AIの意見を全部正解として扱うのではなく、判断材料として使う。

これは、最近ずっと書いている「AIに任せる範囲と、自分で握る範囲」の話にもつながる。

AIに記事案を見てもらう。

AIに出典やリスクを見てもらう。

AIに関連記事を選んでもらう。

でも、最後に公開するかどうかは自分が決める。

この線引きが、だんだん大事になってきた。

## AIごとの違いを、作業フローに組み込む

今回の経験から、記事作成の中でAIごとの違いをもう少し意識してもいいと思った。

たとえば、今後はこういう流れにできる。

まずGPTで、記事の芯を出す。

タイトル案。

構成案。

読者に伝わる結論。

公開直前セット。

次にCodexで、実際のファイルやObsidianの文脈に合わせて確認する。

既存記事と被っていないか。

blog_ideasに反映するか。

inboxやdailyに残すか。

出典や断定表現に危うさがないか。

最後に、自分が読む。

自分の実感に合っているか。

言いすぎていないか。

公開しても後悔しないか。

ブログ全体の流れに合うか。

この3段階にすると、かなり安定しそうだ。

AIをただ増やすのではなく、それぞれに違う役割を持たせる。

今回のGPTとCodexの反応差は、そのヒントになった。

## まとめ

同じ材料を渡しても、GPTとCodexで反応が違った。

GPTは記事として前へ進める力が強かった。

Codexは、公開前の危うさや文脈の整合性にブレーキを踏んでくれた。

どちらか一方が正しいというより、役割が違う。

今回のMythos記事では、その違いがかなり役に立った。

時事性のある強い素材を、ただ煽る記事にせず、AI防衛の運用や判断の話へ戻すことができた。

AIを複数使う時に大事なのは、答えを一つに絞ることではなく、反応差を見て素材の性質を知ることかもしれない。

前に進めるAI。

止めて確認するAI。

最後に判断する自分。

この形を作れると、AIを使った記事作成はかなり安定する。

## 関連記事

AIを複数使うと便利だけど、使い分けないと逆に散らかる

AIに任せる範囲と、自分で握る範囲を分けないと危ないと思った

AIにブログ記事を見てもらうなら、下書きだけでなく公開直前セットまで作る方が楽だった

Mythosを借りられるかより、日本がその後どう守るのかが気になった

コメント

タイトルとURLをコピーしました