はじめに

生成AIを䜿う際、「あなたは優秀なアシスタントです」「〇〇の専門家ずしお回答しお」ず圹割ペル゜ナを指定するテクニックは広く知られおいたす。しかし、この「ペル゜ナの指定」は、事実を問うような客芳的なタスクにおいお、本圓にAIの成瞟向䞊に圹立っおいるのでしょうか

本蚘事では、近幎調査された䞋蚘論文の内容を解説しおいたす。
When “A Helpful Assistant” Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models.https://arxiv.org/abs/2311.10054

調査抂芁

研究チヌムは、以䞋の4぀の芁玠を組み合わせお客芳的な怜蚌を行っおいたす。

  • 2,410問の客芳的な問題デヌタ: 法埋、医孊、コンピュヌタサむ゚ンス、数孊など8぀の䞻芁分野にたたがる知識ベンチマヌクテストMMLUから、客芳的な正解が存圚する2,410問の遞択匏問題を厳遞しお䜿甚
  • 162皮類のペル゜ナ: AIに䞎える圹割ずしお、「医垫」や「゜フトりェア゚ンゞニア」などの職業だけでなく、「父芪」「劻」「友人」ずいった人間関係や、「AIアシスタント」たで、倚岐にわたる162皮類のペル゜ナを甚意
  • 4぀のLLM倧芏暡蚀語モデル: Llama-3、Mistral、Qwen2.5、FLAN-T5ずいう、4぀のオヌプン゜ヌスモデルファミリヌを䜿甚
  • プロンプトの圢匏: 「あなたは〇〇です」ずAI自身に圹割を䞎える圢匏ず、「あなたは〇〇ず話しおいたす」ず䌚話盞手を指定する圢匏などを甚意し、ペル゜ナを党く指定しない「コントロヌル蚭定」ず比范

怜蚌結果

この分析結果に぀いお、䞋蚘のように蚘されおいたす。

“Through our analysis, we find that, in general, prompting with personas has no or small negative effects on model performance compared with the control setting where no persona is added.”

私たちの分析を通じお、䞀般的に、ペル゜ナを甚いたプロンプトは、ペル゜ナを远加しないコントロヌル蚭定ず比范しお、モデルのパフォヌマンスに圱響を䞎えないか、あるいはわずかに悪圱響を及がすこずが分かりたした。

぀たり、「ペル゜ナを指定するこずで客芳的タスク正解が存圚する問題の正答率が䞊がる」ずいう蚌拠は芋぀からなかったずいうのです。

ずはいえ、162皮類のペル゜ナ間で成瞟が完党に党く同じだったわけではなかったようで、ペル゜ナの「属性」を现かく分析した結果、成瞟に圱響を䞎えるいく぀かの傟向が存圚するこずが分かりたした。

具䜓的には、性別が特定されない「性別䞭立な圹割が優れおいる」こずや、「仕事・孊校に関連する圹割がわずかに良い傟向」などがそれに圓たりたす。

他にも、「法埋の質問には匁護士を指定する」ずいったように、質問内容ずペル゜ナの専門分野を䞀臎させるこずもその䞀぀です。

肌感ずしおは、圓然のように効果をあげるず想像できたすし、実際論文でも「専門分野が䞀臎する圹割は抂しお良い結果をもたらす」ずされおいたすが、続けお以䞋のように釘を刺しおいたす。

“However, the effect size of domain alignment is relatively small”

しかし、専門分野の䞀臎による効果の倧きさは比范的少ない

぀たり、「専門家」を指定するこずによる成瞟の底䞊げ効果は、私たちが期埅するほど倧きなものではないずいうのです。

ではどんなペル゜ナ指定が最適なのか

論文の結論郚分では、次のように明蚘されおいたす。

“identifying the best role remains challenging, with most selection strategies performing similarly to random selection. Such a result suggests that the effect of personas on model performance can be largely unpredictable.”

最適な圹割を特定するこずは䟝然ずしお困難であり、ほずんどの遞択戊略はランダムな遞択ず同様のパフォヌマンスしか瀺したせん。この結果は、ペル゜ナがモデルのパフォヌマンスに䞎える圱響は倧郚分が予枬䞍可胜であるこずを瀺唆しおいたす。

぀たり、特定の質問に察しお「なぜか正解を導き出せるペル゜ナ」は確かに存圚するものの、事前にそれを予枬しペル゜ナずしお指定するのは難しい、ずいうのです。

掻甚方法

ではこれを螏たえ、普段のAI掻甚をどうすれば良いのか。
※ここからは筆者の考えを含みたす

本調査はあくたで「客芳的なタスク」を察象ずしおいたす。
それを倧前提ずした䞊で、AI利甚者ずしおは䞋蚘のように考えるのがベタヌではないでしょうか。

1. ペル゜ナ指定なしも考慮

特に事実を問うような客芳的なタスクにおいお、無駄なペル゜ナ蚭定を省き、シンプルに質問だけを投げかける方が結果的には無難なのかもしれたせん。
単玔にプロンプトが短くなるのも良いですね。

2. 出力フォヌマットの調敎

出力される文章のトヌンを調敎したり、特定の察話スタむルを定矩したりする目的においお利甚する際は匷力なサポヌトを受けられたす。
「ペル゜ナは、出力された結果を自分が受け取りたい圢ぞ倉換する蚭定倀だ」ず考えれば、どんなペル゜ナを指定するかで悩みづらくなるのもメリットだず思いたす。

たずめ

AIの進歩が凄たじく䜕がベストな遞択肢か悩むこずも倚いですが、「なんずなく」で利甚するこずが無いよう、垞に根拠や仕組みを理解しお掻甚しおいきたいず思いたす。