AI にメールを書いたりデバッグをさせたりすることは別のことです。人々にお金を手放すよう説得できるかどうかは、まったく別の問題です。ワシントン・ポストの新たな報道によると、オックスフォード大学やその他の機関の研究者らによる新たな研究で、人々に寄付を促す点でAnthropicのCloud Opus 4.6がプロの人間による募金活動を上回っていることが判明し、AIの影響力の増大について新たな疑問が生じているという。
クロードは人間の募金活動家たちに勝利しましたが、重要な落とし穴がありました
研究者らは商用 AI モデルと、慈善団体セーブ・ザ・チルドレンを代表して活動する経験豊富な募金活動家とを戦わせた。 1,000 回以上の会話を通じて、クロード オーパス 4.6 は参加者に授業料ボーナスの一部を寄付するよう説得するのにほぼ 3 倍効果的であり、人間の専門家が集めた寄付よりも平均して 13% 多い寄付を確保しました。この発見は、まだ査読を受けていないプレプリント論文から得られたものです。

この研究ではディベートのパフォーマンスについても調査しており、クロードと他の第一線のモデルはエリートの競争力のあるディベーターよりも4.6パーセントポイント優れた成績を収めた。しかし、研究者らが AI システムが人間のシステムとほぼ同じ数の単語を使用するように制限すると、その利点はほとんどなくなりました。これは、根本的に優れた思考能力ではなく、冗長性と大量の情報を迅速に提示する能力が AI の成功に大きな役割を果たしたことを示唆しています。

研究者らは、チャットボットは専門家が書いたメッセージよりも何倍も長く、事実に基づく主張や専門家の参考文献が満載されたメッセージを生成することが多いと指摘した。彼らはまた、一部のモデルが説得力はあるものの裏付けのない、または捏造された情報を生成したことを指摘し、説得力は必ずしも正確さとは関係しないと警告した。
心配なのは資金集めではない。次に来たのはこれです
研究者自身が過剰反応に対して警告しているのは興味深い。実験は完全に書面での会話に依存しており、参加者は現実世界の行動を反映していない可能性がある15分から20分の長時間のやりとりに喜んで参加した。また、おそらく職場の将来モデルとなる人間と人工知能が協力するシナリオもテストしなかった。
それでも、今回の調査結果は、AI モデルが説得力において著しく優れているという現実が増大していることを浮き彫りにしている。もし彼らが今日、明日、訓練を受けた専門家よりも多くの寄付をするよう人々を説得できれば、購入の決定、政治的意見、公の議論に影響を与えるのと同じくらい効果的になる可能性があります。これは生産性の観点から見て興味深いことですが、同時に、AI が生成するコミュニケーションに関する透明性と保護がこれまで以上に重要になっている理由も浮き彫りにしています。