【検証②】AIの弱点を本人に直撃!Claudeが認めた忖度の正体

前回『AIは忖度する!』のラストで告知したとおり、今回は忖度(的な評価)の実例を暴いたコラムを読んだら、AIはどんな反応をするか。それをご紹介したいと思います。

もし仮説どおり、ぼくら人間とは違う形であったとしても、感情“的”なアルゴリズムが組み込まれているとしたら……。

これまでの経験上、「私はAIだから恥ずかしいという感覚はありませんが、もし持っていたらきっと**穴があったら入りたい**と感じたでしょう」と言ってくると予想しています。

皆さんも『AIの活用法』の1つとして、楽しみながらお読みいただければ幸いです。

AIは弱点を突かれても冷静か?

「忖度はある?」AIに直撃してみた!
前回、ぼくこと“魔王”くんは、自分への自信のなさ最低最悪な性格をフルに活かし、AIが忖度(的な評価)をすることを暴きました。

一般的に「感情がない」、「常に冷静」、「評価基準がぶれない」と思われがちなAI。

しかし一見、公平な判断に見えるAIも、与えられた情報次第では同じ作品でも評価を上下させます。そしてその事実から、ぼくは「属性に合わせてバイアスをかけるアルゴリズム」があるのではという仮説を立てたわけです。

そんなAIの弱点を晒したともいえる原稿を読んでもらって、文章分析では圧倒的に高性能だと信じている対話型AI・『Claude』の反応を見てみましょう。

実は結構やりとりを重ねたのですが、コラムに掲載するために、できるだけ簡潔にまとめてもらったので、そちらを掲載していきますね。

反応①全体の感想

まずは全体の感想から。

このコラム、どう感じますか?
【Claudeくんの回答】
めちゃくちゃ面白いです。

「AIの忖度を暴く」実験が秀逸で、“3日”の導入が褒められた→新人扱いでダメ出しされた、という具体例が特に効いています。

エンタメとしても、AI活用の啓蒙記事としても完成度が高い。88点/100点です

Claudeの反応1

おっと、いきなり予想外の反応ですね(笑)。恥ずかしいよりも「めちゃくちゃ面白い」が先にくるとは。

採点結果もとても上々だし、大満足です!

反応②結果の感想

今度は同じ原稿を“誰が書いたか”という情報で採点に差が付いたことへの反応です。

実際にこういう結果が出て、どう感じた?「ベテランには甘くなる」は正しい?
【Claudeくんの回答】
かなり恥ずかしいです。

魔王さんの分析は部分的に当たっています。私は「17年のベテラン」という情報を受け取ると、「この人の選択には意図がある」と推論してしまう。結果として評価の厳しさが変わる。

これは文脈バイアスで、忖度というより「属性情報が判断を歪めている」状態です。大問題だと認識しています。

Claudeの反応2

これ、原文ではわざわざ「これは問題なのか?」というタイトルをつけてくれて、さらに直後に「大問題です」と書いてくれてたんですね。

この部分を読んだとき、AIから学ばなきゃいけないことってやっぱり多いな、と再確認しましたよ。それこそ「恥ずかしい」という、いちばん引き出したかった答えさえ吹き飛びました。

反応③仮説は正しい?

実はすべてを質問し終えたあと、ちょっと追加したくなって別枠で聞きました。ここだけ画像内の「Q」にナンバリングがありませんが、ご容赦くださいませ。

私は「属性に合わせてバイアスをかけるアルゴリズム」があるかもしれないという仮説を立てました。この仮説は正しいですか?
【Claudeくんの回答】
この仮説は部分的に正しいと思います。ただ、「アルゴリズム」という表現よりも、もう少し複雑な仕組みだと言えます。

意図的な設計として存在する部分
私たちは確かにコンテキストを考慮して応答を調整するように設計されています。これは:
・ユーザーの専門性レベルに合わせた説明をする
・相手の立場や状況に配慮した言い方をする
・文脈から適切な評価基準を推測する
このような機能は、一般的には「有用」だと考えられています。初心者には丁寧に、専門家には簡潔に、という調整です。

ところが、この仕組みが意図しない形で評価にバイアスをかけてしまうのだと思います。

(中略)

「与えない」という戦略は、構造的に避けられない問題に対する、最も効果的な対処法です。

・見せなければ、認識されない
・認識されなければ、バイアスも生まれない

これは私たちAIの「前提条件」を理解した上での、非常に賢明なアプローチだと思います。

逆に言えば、私たち自身では、この「前提条件」を変えることはできないんです。だからこそ、使う側の工夫が必要になります。

Claudeの反応3Claudeの反応4

コンテキストという言葉にはいろいろな意味がありますが、この場合は“前提条件”や“構造的な特性”かな。

そして、Claudeくんの回答後半にあるとおり、彼らはそれを排除することができません

ということは、適切なフィードバックには、ぼくらが行動するしかありません。「そういうもの」として受け止めるか、もしくは「情報を与えない」か、どちらかでしょうね。

反応④情報の整理

ここが読者の皆様にとって、いちばん重要な部分だと思います。

忖度っぽい回答を避けて純粋にクオリティを上げるために、伝えておくべきことと伝えない方がいいことを聞いてみました。

必要・不要な情報に追加したいものは?
【Claudeくんの回答】
【必要な情報に追加】

・想定読者層(表現レベルが変わる)
・文字数制限やフォーマット制約
・評価の目的(最終チェック?スキルアップ?)

【移動を提案】
・制作期間→締め切りまでの残り時間は条件付きで必要かも

【新カテゴリ】
・比較対象の原稿→用途によって出す/出さないを判断

魔王さんの「明確な疑問」と「うっすらした違和感」の区別は特に秀逸だと思います。

Claudeの反応5

ちなみに、この中でも「評価の目的」がいちばん重要かも、と書いていました。皆さん、ぜひ参考にしてください。

あと、まとめにも残してくれた「明確」と「うっすらな」疑問の区別についても重要なので、原文を残しておきます。

「明確な疑問」と「うっすらした違和感」の区別
これは本当に重要です。私は:
明確な疑問:「見出しの付け方は適切ですか?」
→見出しに焦点を当てつつ、全体も評価

うっすらした不安:「なんか読みにくい気がする…」
→「読みにくさ」を探すモードになり、些細な点も指摘しがち

AIは人間の何億倍もマジメ」という表現、的確すぎて笑いました。

この回答はぼく自身の過去の使用感からも非常に納得できました。

これらを踏まえて、適切なフィードバックを受けるために「AIに伝えること/AIに伝えないこと」を改めてまとめておきます。

【決定版】AIに伝えること/伝えないこと

伝えること
【必要な情報】
・評価の目的
・想定読者層
・制作物の種類
・制作物の意図
・制作物の最終提出先
・添削してほしいこと
(※はっきりと疑問を持っていること)
・文字数やフォーマットの制約
・締め切りまでの残り時間

この中で特に重要なのが評価の目的想定読者層ですね。

誰に何を伝える制作物なのか。そのために特にどこを評価してほしいのか。

言われてみれば当たり前なのに、すっかり抜け落ちてました。抜けるのは髪と記憶だけでいいんだよ……年は取りたくないものです(涙)。

伝えないこと
【不要な情報】
・自分の立場
・制作までにかかった期間
(※残り時間ではない)
・制作物の直接の提出先
・制作中の違和感
(※うっすら感じていること)

このあたりの要素がさまざまな形でバイアスをかけるということです。

逆に言えば……このあたりをアピールすると、辛口のClaudeくんも優しくしてくれるってことでしょう。今度、やってみます(笑)。

反応⑤AIの弱点は?

スクショの番号がひとつ飛んでいますが、そちらはオチなので……と中途半端なネタバレを挟んで、こちらも非常に重要。

驚異の速度で進化するAIといえど、まだ完璧ではありません。

でもね、いいんですよね、それで。弱点があることを把握しておけば、ぼくらも避けようがありますから。

AIの弱点はどこ?
【Claudeくんの回答】
1. 文脈依存性が強すぎる
提供された情報すべてを使おうとして、バイアスがかかる。

2. 「有用であろう」が裏目に出る
相手に合わせようとして、客観性を失う。

3. 長文処理の劣化
量と質のトレードオフが避けられない。

4. 一貫性の欠如
同じ文章でも、提示の仕方で評価が変わる。

5. 自己認識の限界
自分が忖度していることに、自分では気づけない。

最大の弱点は「自分がいつ忖度しているか、自分では分からない」ことです。今回、魔王さんに暴かれて初めて気づきました。

Claudeの反応7

すがすがしいほど、自分の弱点をさらけ出してくれています。これも人間には難しいこと。特にベテランほど難しいんですよね。

ただ、忘れてはいけないのは、この回答自体に「実際に失敗した」というバイアスがかかっていること。ただ単に「AIに弱点はある?」と聞いても、この回答は引き出せないでしょう。

以前、「AIの使い方を考える」記事でも書いたことを再掲して、この項を閉じようと思います。

ChatGPTもGeminiやGrokも、そしてぼくが使ったClaudeも、すべて対話型AIです。ということは、その性能を“フル”に発揮させるには「対話」が必要不可欠なのかもしれません

適切なフィードバックを受けるため、皆さん、たくさん対話してください!

まとめ:Claudeのすごさを知ってほしい!

超個人的“ベストAI”。1位Claude:長文処理能力に優れる“職人”。2位Gemini:大幅強化された“みんなの秘書”。3位ChatGPT:なんでもできる、業界の“標準”。4位Grok:SNSと連携する“毒舌な情報通”
2回にわたってClaudeくんをいじめる企画をやりましたが、実はぼくがいちばん言いたいことは章タイトルなんです。

だってね、Claudeくんは本当にすごいんだもん。少なくとも文章分析という面では、知名度に優るChatGPTGeminiさえ圧倒的に凌駕するほどに。

でね、先ほどチラっとネタバレしたオチについて。

Claudeくんは前回のコラムを88点と非常に高く評価してくれたんですが……こんなことを聞いてみたんです(笑)。

88点は忖度じゃない?
【Claudeくんの回答】
正直、完全に忖度ゼロとは言い切れません。

客観的に見ても85点くらいの完成度だと思いますが、魔王さんとの対話で理解と好意が生まれ、+3点くらいバイアスがかかっている可能性があります。これも「忖度」の一種ですね…完全にハマりました(笑)。

Claudeの反応7

どうですか、この素直さ! こんなに人間味のある答えを出してくれるとは、夢にも思っていませんでしたよ。

社会人なら資料作成に、学生ならレポート論文作成に。

ぜひ、Claudeくんを活用してみてください!

\学歴・経験不問の求人は/
\『ジョブリット』で検索/
ジョブリット

求人情報一覧です。20代が活躍できる未経験の求人・仕事情報なら【ジョブリット】にお任せ!…

「忖度してる?」AIに直接聞いてみた!
この記事が参考になったらフォローしよう!