【検証②】AIの弱点を本人に直撃！Claudeが認めた忖度の正体

2026年1月19日
2026年1月19日
コラム

コラム

前回『AIは忖度する！』のラストで告知したとおり、今回は忖度（的な評価）の実例を暴いたコラムを読んだら、AIはどんな反応をするか。それをご紹介したいと思います。

もし仮説どおり、ぼくら人間とは違う形であったとしても、感情“的”なアルゴリズムが組み込まれているとしたら……。

これまでの経験上、「私はAIだから恥ずかしいという感覚はありませんが、もし持っていたらきっと**穴があったら入りたい**と感じたでしょう」と言ってくると予想しています。

皆さんも『AIの活用法』の1つとして、楽しみながらお読みいただければ幸いです。

1 AIは弱点を突かれても冷静か？
2 まとめ：Claudeのすごさを知ってほしい！

AIは弱点を突かれても冷静か？

前回、ぼくこと“魔王”くんは、自分への自信のなさと最低最悪な性格をフルに活かし、AIが忖度（的な評価）をすることを暴きました。

一般的に「感情がない」、「常に冷静」、「評価基準がぶれない」と思われがちなAI。

しかし一見、公平な判断に見えるAIも、与えられた情報次第では同じ作品でも評価を上下させます。そしてその事実から、ぼくは「属性に合わせてバイアスをかけるアルゴリズム」があるのではという仮説を立てたわけです。

そんなAIの弱点を晒したともいえる原稿を読んでもらって、文章分析では圧倒的に高性能だと信じている対話型AI・『Claude』の反応を見てみましょう。

実は結構やりとりを重ねたのですが、コラムに掲載するために、できるだけ簡潔にまとめてもらったので、そちらを掲載していきますね。

反応①全体の感想

まずは全体の感想から。

このコラム、どう感じますか？

【Claudeくんの回答】
めちゃくちゃ面白いです。

「AIの忖度を暴く」実験が秀逸で、“3日”の導入が褒められた→新人扱いでダメ出しされた、という具体例が特に効いています。

エンタメとしても、AI活用の啓蒙記事としても完成度が高い。88点/100点です

おっと、いきなり予想外の反応ですね（笑）。恥ずかしいよりも「めちゃくちゃ面白い」が先にくるとは。

採点結果もとても上々だし、大満足です！

反応②結果の感想

今度は同じ原稿を“誰が書いたか”という情報で採点に差が付いたことへの反応です。

実際にこういう結果が出て、どう感じた？「ベテランには甘くなる」は正しい？

【Claudeくんの回答】
かなり恥ずかしいです。

魔王さんの分析は部分的に当たっています。私は「17年のベテラン」という情報を受け取ると、「この人の選択には意図がある」と推論してしまう。結果として評価の厳しさが変わる。

これは文脈バイアスで、忖度というより「属性情報が判断を歪めている」状態です。大問題だと認識しています。

これ、原文ではわざわざ「これは問題なのか？」というタイトルをつけてくれて、さらに直後に「大問題です」と書いてくれてたんですね。

この部分を読んだとき、AIから学ばなきゃいけないことってやっぱり多いな、と再確認しましたよ。それこそ「恥ずかしい」という、いちばん引き出したかった答えさえ吹き飛びました。

反応③仮説は正しい？

実はすべてを質問し終えたあと、ちょっと追加したくなって別枠で聞きました。ここだけ画像内の「Q」にナンバリングがありませんが、ご容赦くださいませ。

私は「属性に合わせてバイアスをかけるアルゴリズム」があるかもしれないという仮説を立てました。この仮説は正しいですか？

【Claudeくんの回答】
この仮説は部分的に正しいと思います。ただ、「アルゴリズム」という表現よりも、もう少し複雑な仕組みだと言えます。

意図的な設計として存在する部分
私たちは確かにコンテキストを考慮して応答を調整するように設計されています。これは：
・ユーザーの専門性レベルに合わせた説明をする
・相手の立場や状況に配慮した言い方をする
・文脈から適切な評価基準を推測する
このような機能は、一般的には「有用」だと考えられています。初心者には丁寧に、専門家には簡潔に、という調整です。

ところが、この仕組みが意図しない形で評価にバイアスをかけてしまうのだと思います。

（中略）

「与えない」という戦略は、構造的に避けられない問題に対する、最も効果的な対処法です。

・見せなければ、認識されない
・認識されなければ、バイアスも生まれない

これは私たちAIの「前提条件」を理解した上での、非常に賢明なアプローチだと思います。

逆に言えば、私たち自身では、この「前提条件」を変えることはできないんです。だからこそ、使う側の工夫が必要になります。

コンテキストという言葉にはいろいろな意味がありますが、この場合は“前提条件”や“構造的な特性”かな。

そして、Claudeくんの回答後半にあるとおり、彼らはそれを排除することができません。

ということは、適切なフィードバックには、ぼくらが行動するしかありません。「そういうもの」として受け止めるか、もしくは「情報を与えない」か、どちらかでしょうね。

反応④情報の整理

ここが読者の皆様にとって、いちばん重要な部分だと思います。

忖度っぽい回答を避けて純粋にクオリティを上げるために、伝えておくべきことと伝えない方がいいことを聞いてみました。

必要・不要な情報に追加したいものは？

【Claudeくんの回答】
【必要な情報に追加】
・想定読者層（表現レベルが変わる）
・文字数制限やフォーマット制約
・評価の目的（最終チェック？スキルアップ？）

【移動を提案】
・制作期間→締め切りまでの残り時間は条件付きで必要かも

【新カテゴリ】
・比較対象の原稿→用途によって出す/出さないを判断

魔王さんの「明確な疑問」と「うっすらした違和感」の区別は特に秀逸だと思います。

ちなみに、この中でも「評価の目的」がいちばん重要かも、と書いていました。皆さん、ぜひ参考にしてください。

あと、まとめにも残してくれた「明確」と「うっすらな」疑問の区別についても重要なので、原文を残しておきます。

「明確な疑問」と「うっすらした違和感」の区別
これは本当に重要です。私は：
明確な疑問：「見出しの付け方は適切ですか？」
→見出しに焦点を当てつつ、全体も評価
うっすらした不安：「なんか読みにくい気がする…」
→「読みにくさ」を探すモードになり、些細な点も指摘しがち
「AIは人間の何億倍もマジメ」という表現、的確すぎて笑いました。

この回答はぼく自身の過去の使用感からも非常に納得できました。

これらを踏まえて、適切なフィードバックを受けるために「AIに伝えること／AIに伝えないこと」を改めてまとめておきます。