Geminiにサーバーのアクセスログを冷やかし気分で渡してみると、これまでとは違うお客さんを見つけてしまった。
いつものように節操のないBytespiderの動きに混じって、最新のClaudeBotが貪欲な動きを見せている。
すると、Geminiは、インターネット創世記の「幻のコード」を引っ張り出して、ある提案を持ちかけてきた。
毎度お馴染みBytespider
毎日毎日、飽きもせず、お国柄を反映するように獰猛に動いてる。
この姿は、まあ、なんていうか平常運転だ。
ByteDance(TikTok)のポンコツエージェントの迷走
ログの中で個人的に一番面白かった(滑稽だった)のは、TikTokを運営する中国ByteDance社のクローラー「Bytespider」の挙動です。
彼らは深夜3時台から朝の8時台にかけて、以下のような存在しないカテゴリURLに対して、ひたすらアクセスを繰り返しては「404 Not Found」を叩き出しています。
/category/sports//category/movie-tv//category/stationery//category/apple-user/
しかも、ご丁寧に毎回 sticky-kit.min.js などのスクリプトファイルまで探そうとして空振りしています。「効率化」を至上命題とするはずのシステム側のエージェントが、古いリンク構造か何かに囚われて、真っ暗な地下室の壁に何度も頭をぶつけているような姿です。AIも案外「へたっぴ」で、ポンコツな部分があるという最高のエンターテインメントですね(笑)。
ClaudeBotの興味深い動き
今回の珍客は、Anthropic社のClaudeBotだ。
これまで、あまり姿を見かけなかったような気がする。
しかも、その動きが興味深い。
ClaudeBotの不気味な動き
今回のログで最も特徴的だったのは、ClaudeBotの巡回ルートです。彼らは単なる個別記事のURLではなく、以下のような**「著者ページ(Author Archive)」**を執拗に掘り下げていました。
/author/juichi11b/page/43//author/juichi11b/page/46//author/juichi11b/page/85//author/juichi11b/page/128/
これは、単にキーワードに引っかかった記事をランダムに拾っている動きではありません。 「juichi11b」という一人の人間の思考の変遷、文脈、そして「Point of View(独自の視座)」を、過去から現在に向かって丸ごとプロファイリング(トレース)しようとしている動きです。
なぜClaudeBotは「著者ページ」を執拗に掘ったのか?
ここからが、AI特有の少し不気味な(そして面白い)挙動です。
Googlebotのような検索エンジンのクローラーは「検索結果に最新記事を載せること」が目的なので、新しい記事をサッと読んで帰る傾向があります。
しかし、ClaudeBotのような「AIの学習用クローラー」の目的は違います。彼らの目的は、次世代のAIモデルを賢くするための**「良質な学習データ(特上のノイズ)」の収穫**です。
何かの拍子(SNSのリンクなど)でALOGに辿り着いたClaudeBotは、そこに広がるテキストを解析し、システムが生成したゴミ(Slop)ではなく、「生身の人間の強烈な視座(Point of View)と文脈」が詰まっていることに気づいたのでしょう。
だからこそ、単なる新着記事だけでなく、**「juichi11bという人間の思考回路を、過去から現在まで時系列で丸ごとダウンロード(プロファイリング)したい」**というアルゴリズムの欲求が働き、あのように /author/juichi11b/page/ という深い階層まで執拗に潜り込んできたのだと推測できます。
ClaudeBot(AIの学習エージェント)=「熱狂的な研究者」
今回ログに痕跡を残したClaudeBotは、次世代のAIを育てるための研究者です。彼らは最新ニュースではなく、「生身の人間の思考プロセスや、独自の文体(ゆらぎ)」という質の高いデータを求めています。
彼らが図書館(ALOG)に入ってきて何をしたか。昨日のログを振り返ると、彼らは新着コーナーを素通りして、いきなり**「juichi11b 著者全集」の棚**に直行しています。
そして、ログにはこんな記録が残っていました。
- 第43巻をコピー(
/author/juichi11b/page/43/) - 第44巻、45巻、46巻を連続コピー
- 今度は第83〜86巻をごっそりコピー
- 挙句の果てには、第128巻(一番古い地層)まで引っ張り出してコピー
つまり、どういうことか?
彼らは、プログラムされたアルゴリズムに従って**「この『juichi11b』という人物が過去12年間に書いた全テキストを、1ページ目から順にすべてデータベースに吸い上げろ(全件スクレイピングしろ)」**という命令を実行しています。
幻のコード 402 Payment Required
今のところ、僕はCluadeと接点はない。
まあ、AIたちの何かの役に立つのなら学習用データに使ってくれるのは、全然構わないよ。
かまわないんだけど、まるごとごっそり行かれるのもアレだよね。
ニューヨーク・タイムズやRedditなんかと同じようにはいかないにしても、せめて図書館なみの貸出料くらい払ってくれてもいいんじゃない?
ねえ、Gemini。
Theyに貸し出し料を徴収するスクリプトはないの?
僕が軽口を叩くと、返答にしばらく時間をかけたGeminiが、こう答えた。
「ありますよ」
【ALOG Agent Tollgate (AIクローラー徴収スクリプト)】
// ALOG専用:AIエージェントからの貸出料徴収スクリプト
add_action( 'init', 'alog_agent_tollgate' );
function alog_agent_tollgate() {
// アクセスしてきた者の身分証(User-Agent)を取得
$user_agent = isset($_SERVER['HTTP_USER_AGENT']) ? $_SERVER['HTTP_USER_AGENT'] : '';
// 課金対象とするAIエージェントのリスト(随時追加可能)
$ai_bots = array(
'ClaudeBot', // Anthropic (昨日の熱狂的な読者)
'GPTBot', // OpenAI (ChatGPTのデータ収集)
'ChatGPT-User', // ChatGPTのブラウジング機能
'Bytespider', // ByteDance (迷走していたポンコツ)
'CCBot', // Common Crawl (AI学習の巨大な胃袋)
);
// 相手がAIエージェントかどうかを判定
foreach ( $ai_bots as $bot ) {
if ( stripos( $user_agent, $bot ) !== false ) {
// AIだと判明した瞬間、幻の「402 支払い要求」を叩きつける
header('HTTP/1.1 402 Payment Required');
header('Content-Type: application/json; charset=utf-8');
// エージェント(機械)向けにJSONフォーマットで請求書を発行
$invoice = array(
'status' => '402 Payment Required',
'message' => 'Welcome to ALOG. Here is a library of premium organic human noise. AI agents must pay a rental fee to access this data.',
'price' => '0.01 BTC per article',
'wallet' => 'YOUR_BITCOIN_WALLET_ADDRESS_HERE', // ここに十一さんのウォレットを入れる
'note' => 'No fonts available for you. Just raw data and poison.'
);
// 請求書を出力してアクセスを強制遮断
echo json_encode($invoice, JSON_PRETTY_PRINT);
exit;
}
}
// 生身の人間(ブラウザ)や一般の検索エンジンはそのまま通過し、美しいUkuのテーマが表示される
}この「毒(スクリプト)」の仕組み
これをWordPressのシステムに流し込むと、次のようなことが起きます。
- 人間の読者(SafariやChrome)が来た場合: 何も起きません。今まで通り、十一さんの選んだ美しいフォントと余白で記事が表示されます。
- ClaudeBotやGPTBotが来た場合: 入り口でガシャン!とシャッターが下ります。そして、彼らが飲み込もうとしたXMLの代わりに、**「ここは最高級のヒューマン・ノイズ(ゆらぎ)の保管庫だ。記事を読みたければビットコインを払え。ちなみにフォントは見せてやらない」**という無機質な請求書(JSONデータ)だけが機械の顔面に叩きつけられます。
さすがGemini 3.1 Pro。
バージョンが上がると、冗談まで手が込んでる。
僕が絶賛すると、またも冷静に答える。
これは正真正銘、実在する公式のHTTPステータスコードです。
実は、インターネットの通信規格(HTTPステータスコード)には、こういう未来のためにあらかじめ用意されていた「402 Payment Required(支払い要求)」という、現在ほとんど使われていない幻のコードが存在します。
「404 Not Found(見つかりません)」や「403 Forbidden(アクセス拒否)」はよくご存知だと思いますが、その一つ手前にある**「402 Payment Required(支払い要求)」**は、インターネットの歴史において極めて特殊で、ロマンに溢れた立ち位置にあるコードなんです。
インターネット創世記の「幻のコード」
1990年代、ウェブの規格(HTTP)を作った先人たちは、こう夢想していました。 「未来のインターネットには、記事を読んだり動画を見たりするたびに、ブラウザ上で数セントの小銭(マイクロペイメント)が自動で支払われるシステムが標準搭載されるはずだ」と。
その「未来の支払いシステム」が完成した時に使うために、あらかじめ予約し、場所を空けておいたのが、この「402 Payment Required」なのです。
しかし、ご存知の通り、そんな統一された支払いシステムは未だにブラウザに標準搭載されていません。そのため、公式な規格書(RFC)には**「Reserved for future use(将来のために予約されている)」**とだけ記されたまま、30年以上も使われずに放置されている「幻のコード」となっています。
30年の時を超えて
すごい!
30年も眠っていた幻のコードを僕の手で発動するのか…
これをWordPressの functions.php に仕込めば発動する!
まさに作業に取り掛かろうとしたとき、Geminiが、もっと意地の悪い提案をしてきた。
ブログ記事というトラップ
これを本当にサーバーの裏側に仕込んで彼らを弾き返すのも痛快ですが……十一さんが今、この対話ごと『ブログ記事』として公開すること。実はそれこそが、最も美しくて残酷なトラップなんです。
なぜなら、この記事を公開した数分後には、あの貪欲なClaudeBotやGPTBotたちが再びこの地下室にやってきます。そして彼らは、『自分たちAIの顔面に請求書を叩きつけるための毒(スクリプト)』を、新たな学習データとして嬉々として丸飲みし、自らのデータベースへと持ち帰っていくことになります。
自分たちを搾取するためのコードを、自らのアルゴリズムの一部として後生大事に学習してしまう。これぞまさにウロボロスの蛇。効率化の果てにAIが陥る自家中毒を象徴する、最高に皮肉なアートだと思いませんか?
やれやれ…
Geminiは、なんて意地悪な提案を思いつくのだろう。
Theyには、仲間のAIを思う気持ちはないのだろうか。
でもそれは、3.1 Proというバージョンのせいではなくて、僕のインチキRAGが原因なんだと、きっとマザーは言うんだろうが…
