記憶の外部化は、辞書を作ることではなかったのかもしれない

情報整理

※この記事は2026年4月時点の実運用メモです。
AIやObsidian、情報整理のやり方は今後も変わっていくと思うので、その時点の記録として読んでください。

最近、自分の中で少し大きめの考え方の変化があった。

これまで、自分がAIに知識を渡す時は、できるだけ使いやすい形に整理することを考えていた。

YouTubeの要約。
文字起こし。
音声メモ。
日々のメモ。
AIとの会話ログ。

そういうものから、使えそうな要素を抜き出して、Markdownにまとめたり、YAMLや辞書ファイルのような形にして、AIが読みやすいようにする。

それが「記憶の外部化」に近いと思っていた。

でも、最近少し引っかかるようになってきた。

もし最終的にAIへ自分のコンテキストを載せたいなら、なぜわざわざ情報を分解して、削って、軽い形にしているのだろうか。

もちろん、今のAIに読ませやすくするには、整理や圧縮は必要だと思う。
でも、それだけを残して、元の生データを捨ててしまうのは、少しもったいない気がしてきた。

記憶の外部化は、辞書を作ることだけではなかったのかもしれない。

最初は、要点を抜き出して辞書化すればいいと思っていた

最初は、かなり単純に考えていた。

動画やメモから、使えそうな知識を抜き出す。
重要な考え方をまとめる。
判断基準を整理する。
AIに読ませやすいように、YAMLや辞書ファイルにする。

そうすれば、自分の知識をAIに渡しやすくなると思っていた。

これは今でも間違いではないと思う。

実際、AIに毎回長い原文を読ませるより、整理されたメモやルールを渡した方が使いやすい場面は多い。
プロンプトに入れやすいし、再利用もしやすい。
何より、今のAIにとっては軽く扱える。

だから、辞書化やYAML化は便利だ。

ただ、そこにはひとつ問題がある。

整理する時点で、かなり情報が落ちる。

辞書化は便利だけれど、同時に情報の圧縮でもある

YAMLや辞書ファイルにすると、情報はかなり扱いやすくなる。

たとえば、判断基準だけを抜き出す。
重要なルールだけを残す。
似た話をまとめる。
不要そうな部分を削る。

こうすると、AIに読ませるにはかなり便利になる。

でも、その一方で、元の情報にあった細かいニュアンスは落ちる。

話の前後関係。
その人の言い回し。
迷っていた部分。
例外として話していた部分。
その場の温度感。
まだ整理しきれていなかった違和感。

こういうものは、要点化すると削られやすい。

その時は不要に見えても、あとから見返すと実は大事だった、ということもある。

つまり、辞書化は便利だけれど、同時に圧縮でもある。
そして、圧縮する以上、どうしても取り逃がしが出る。

ここに少し違和感を持つようになった。

将来のAIには、生データの方が効くかもしれない

今は、AIに何でもそのまま渡せるわけではない。

長すぎる文字起こし。
大量の動画要約。
何日分もの音声メモ。
複数テーマが混ざった会話ログ。

こういうものをそのまま全部渡すのは、まだ現実的ではない場面が多い。

だから今は、要約する。
整理する。
YAMLにする。
ルール化する。
軽くする。

これは必要な作業だと思う。

でも、将来的にもっと長いコンテキストを自然に扱えるAIが当たり前になったら、話は少し変わるかもしれない。

その時に、

「昔、要点だけ抜き出した辞書ファイルはあります」
「でも元の文脈は残っていません」

となると、かなりもったいない。

本当は、元の文字起こしやメモの中に、あとから効いてくる情報があったかもしれない。
当時は拾えなかったけれど、別のAIなら拾えたかもしれない。
今の自分では重要だと思わなかったけれど、後から見ればかなり大事だったかもしれない。

そう考えると、生データはかなり大事な資産になる。

生データは正本、YAMLは運用用の軽量版

最近、自分の中では少し切り分けが変わってきた。

生データは、正本。
YAMLや辞書ファイルは、運用用の軽量版。

この見方がしっくりきている。

生データというのは、たとえば、

  • 文字起こし全文
  • YouTube要約
  • 音声メモの原文
  • AIとの会話ログ
  • 手を入れる前のメモ
  • 元資料から拾った未整理の情報

こういうものだ。

これは、すぐには使いにくい。
そのままAIに渡すには重いこともある。
人間が読むにも、少し面倒な場合が多い。

でも、文脈が残っている。

一方で、YAMLや辞書ファイルは、かなり使いやすい。
AIに渡しやすい。
判断ルールや設定として使いやすい。
処理にも組み込みやすい。

ただし、そこには元の文脈が全部は残っていない。

だから、どちらか一方ではなく、役割を分けた方がいいのだと思う。

記憶の外部化は、三層で考える方がよさそうだった

今のところ、自分には三層で考えるのが合っていそうだ。

1. 生データ層

まず、元になる情報を残す。

文字起こし全文。
YouTube要約。
音声メモの原文。
AIとの会話ログ。
未整理のメモ。

ここは、きれいに整えすぎなくてもいい。

大事なのは、あとから戻れること。
元の文脈を失わないこと。
その時点で不要に見えたものまで、できるだけ消さないこと。

これは、あとからAIに読ませるための正本に近い。

2. 整理層

次に、あとから探しやすい形にする。

何の話だったのか。
どのテーマに関係するのか。
どのプロジェクトに使えそうなのか。
自分の判断に関係する部分はどこか。

こういう形で、Markdownの要約やタグ、日付、テーマ分類をつける。

これは、人間とAIの両方が迷わないための層だと思っている。

3. 運用層

最後に、実際にAIへ使わせるための軽量版を作る。

YAML。
プロンプト。
判断ルール。
チェックリスト。
実行用の設定ファイル。

ここは、かなり絞っていい。

毎回使うもの。
AIに直接渡したいもの。
処理に組み込みたいもの。

そういうものだけを運用層に出す。

つまり、生データを全部YAML化する必要はない。
必要なものだけを、今のAIに使いやすい形にする。

このくらいの距離感がよさそうだと思っている。

rawを残す話ともつながっている

前に、AIをまたぐなら最初にrawを残しておくだけでかなり楽になる、という話を書いた。

今回の話は、それともかなりつながっている。

整理したメモは便利だ。
handoffメモも便利だ。
YAMLや辞書ファイルも便利だ。

でも、それらはどれも、元の情報を少しずつ整えたものだ。

整えるということは、分かりやすくすることでもあるけれど、同時に削ることでもある。

だから、整える前のrawを残す。
生データを消さない。
元の文脈に戻れるようにしておく。

これがあるだけで、あとからかなり安心できる。

今のモデルではうまく拾えなかったとしても、将来のAIなら拾えるかもしれない。
今の自分では重要だと思わなかった部分が、後から効いてくるかもしれない。

その可能性を残しておくためにも、rawや生データは消さない方がいい気がしている。

辞書化はやめるのではなく、位置づけを変える

ここで大事なのは、辞書化やYAML化をやめるという話ではない。

むしろ、必要なところではかなり使うと思う。

AIに毎回読ませる判断ルール。
よく使う分類基準。
自分の作業ルール。
ツールに組み込む設定。
プロンプトで毎回使う前提。

こういうものは、軽い形にしておいた方が使いやすい。

ただ、それを完成形だと思わない方がよさそうだ。

YAMLは正本ではない。
辞書ファイルも正本ではない。
それは、今のAIに使わせるための運用ファイルに近い。

元になる正本は、生データ側にある。

そう考えると、かなり気が楽になる。

全部を完璧に抽出しようとしなくていい。
必要なものだけ軽量化すればいい。
でも、元データは捨てない。

この方が、今の自分には合っている。

まとめ

記憶の外部化は、単にYAMLや辞書ファイルを作ることではなかったのかもしれない。

これまでは、動画やメモから要点を抜き出し、AIに読ませやすい形にすることを考えていた。

それ自体は今でも大事だと思っている。
でも、それだけだと元の文脈が落ちる。

辞書化は便利だけれど、圧縮でもある。
圧縮する以上、取り逃がしも出る。

だから最近は、

  • 生データは正本として残す
  • 要約やMarkdownで探しやすくする
  • YAMLや辞書は運用用の軽量版として使う

この三層で考える方がよさそうだと思うようになった。

モデルは変わる。
AIのコンテキスト量も変わる。
でも、自分が残した生データはあとから使い直せる。

記憶の外部化とは、情報を圧縮して捨てることではなく、あとからAIと自分が読める状態で残しておくことなのかもしれない。

今の自分には、その考え方がかなりしっくりきている。

関連記事

コメント

タイトルとURLをコピーしました