2023.04.11
自社データ活用で生成AIの利用を加速する RAG/Fine-tuningとは?
生成AIによる業務効率化において「自社データの活用」が一つのキーワードとなっています。生成AIはインターネット上に存在する幅広い情報源から精度の高い出力を行うことができますが、一方で自社のルールや手順に沿った出力までは実現できません。生成AIに自社データを学習させることで、自社業務も含めて活用の幅を広げられます。
生成AIで自社データを活用するために、押さえておきたいのが「RAG」と「Fine-turning」という2つの手法です。この記事では、AI技術に詳しくない方でも理解しやすいように、自社データの利用メリットやその実現方法をご紹介します。
なお、生成AIの基本的な内容については以下の記事で詳しく解説しています。本記事と併せてご覧ください。
※参考記事:生成AIのビジネス活用 何から始めるべき?事例と合わせて紹介
生成AIにおいて自社データを活用すべき理由
なぜ、生成AI活用において自社データを利用する手法が注目されているでしょうか。端的に言えば、自社データにより生成AIのユースケースが広がるためです。以下では、生成AIと自社データの組み合わせが有効である理由についてご紹介します。
一般的な情報のみで生成AIを利用する限界
ChatGPTをはじめとした生成AIに注目が集まる一方で、せっかく生成AIを導入しても活用率が上がらないケースも散見されます。これには様々な原因が考えられるものの、よくあるのが「生成AIが社内コンテキストを理解できないため、活用の幅が狭まっている」というものです。
データ分析のサポートやプログラミングの支援など、インターネット上に存在する一般的な情報を基に行える作業は生成AIでカバーしやすいといえます。一方で、社内ルールや業務フローなどを生成AIが理解しているわけではありません。よって、バックオフィス業務や社内での決裁取得、社内での申請などの領域では生成AIの活用は難しいといえます。
このような社内業務は効率化の余地が大きいものの、生成AIでのサポートは難しい領域です。結果として文章の下書きや要約といった汎用的な作業にのみ生成AIが活用されている企業も多い状況です。
自社データで広がる活用の幅
このような生成AIの限界を突破するためには、生成AIに社内のコンテキストを理解してもらう必要があります。そこで、社内規程や業務プロセス、作業マニュアルなどの社内データを生成AIに追加でインプットする手法が注目されるようになりました。
これにより、生成AIは社内業務に関する知識を踏まえた出力を行えるようになります。汎用的な作業だけでなく、社内業務に対しても生成AIの活用を広げることができるのです。
自社データ活用のための2つの手法 「RAG」と「Fine-turning」
具体的に、どのように生成AIに自社データをインプットさせるのでしょうか。自社データの活用手法として、大きく「RAG」と「Fine-turning」という2つが知られています。以下では、それぞれの手法について解説します。
RAGとは?
RAGはRetrieval-Augmented Generationの略称であり、日本語では検索拡張生成などと訳されます。RAGを一言で言えば「生成AIに指示を与える際に、追加で社内データを与えることで、社内のコンテキストを踏まえた出力を作成する」という手法です。
具体的には、以下のフローで処理を行います。
〇プロンプト入力
ユーザーは、生成AIに処理してほしい内容にあたるプロンプトを入力します。たとえば「560万円の発注を行う際には、誰に承認をとればよいのか」といった内容を確認するイメージです。
〇社内データ取得
入力された質問内容の回答に必要となる社内データを、あらかじめ構築したデータベースから取得します。先ほどの質問であれば「職務権限規程」などの社内規程のうち、発注に関する項目を取得することとなります。
〇生成AIへの入力
「①で入力したプロンプト」と「②でデータベースから取得した社内データ」を合わせて、生成AIへ入力します。こうすることで、生成AIは社内データを加味して出力を作成できます。
〇生成AIの出力
生成AIは、職務権限規程を踏まえて560万の発注における承認者を出力します。たとえば「560万円の発注を行う場合、決裁者は部長です。職務権限規程には1000万未満の発注については部長が権限者となることが記載されています」といった内容が回答として表示されます。
RAGは生成AI自体に対して追加学習を行うことなく社内データを活用できる手法であり、低コストで手軽に実現できるというメリットがあります。
Fine-turningとは?
生成AIにおいて社内データを活用するためのもう一つの手法がFine-turningと呼ばれるものです。「Fine-turning」は日本語で「微調整」を意味します。
Fine-turningとRAGの大きな違いは「生成AI自体の学習内容を社内データで上書きするどうか」というものです。RAGでは生成AIの利用時に都度データベースから取得した社内データを与えていましたが、Fine-turningでは事前に社内データにより生成AI自体を再学習させます。
ユーザーがFine-turningを行った生成AIを利用する際には、プロンプトのみを与えます。生成AIは既に社内のコンテキストを学習しているため、追加で社内データを与えなくとも、出力内容は社内のルールやマニュアル等に沿ったものとなります。
これだけ聞くとFine-turningとRAGにはあまり違いがないように聞こえるかもしれませんが、コストや性能は大きく変わってきます。Fine-turningを行うためには、生成AIへの社内データの学習というコストのかかる開発作業を行う必要があります。一方で、ランニングコストは抑えられます。生成AIは一般的に入力するプロンプトの量で課金されますが、Fine-turningでは都度社内データを入力する必要がないので、プロンプト量を減らすことができるのです。それ以外にも、生成AIに処理させるデータ量が減るために、回答作成速度の向上も期待できます。
このように、Fine-turningとRAGにはメリット・デメリットがあり、用途に合わせて選択する必要があります。このあたりの判断は専門的な技術・ノウハウも必要となるところですので、知見のあるベンダーに相談してみてもよいでしょう。
自社データ活用のユースケース
最後に、生成AIと自社データの組み合わせで実現できるユースケースを簡単に紹介します。社内データとの組み合わせにより、生成AIの活用の幅は大きく広がります。
〇社内制度検索サービス
人事制度などの諸制度について手軽に回答してくれるチャットボットを提供します。
〇社内ヘルプデスク
過去の回答例やFAQ等を学習させた生成AIにより、問い合わせに対する回答を自動で生成します。
〇顧客サポート
顧客との過去のやり取りを学習させた生成AIにより、過去のコンテキストを踏まえた対応を実現します。
まとめ<
この記事では、生成AIにおける自社データの活用というテーマで、RAGとFine-turningという2つの手法についてご紹介しました。自社データの利用により生成AIの活用の幅は大きく広がります。「生成AIを利用してみたものの業務での活用イメージが湧かなかった」という方も、生成AIと自社データの組み合わせにより社内業務の効率化を実現できるかもしれません。
この記事を書いた人
KJ@DXコラム編集長
エンジニア出身で現在は現在は営業窓口全般を担当しています。 お客様とのファーストタッチのタイミングからスピーディーに技術的な原因とその対応を行います。 DXの取組に興味を持たれたお客様と一緒になってゴールまで走り抜ける経験を2025年まで培っていきたいと思っています。 このコラムで2025年までの軌跡をお客様と作っていければと思っております
関連記事
2022.12.22
ビジネスでIT化が進められるようになってから、日本では多くがITエンジニアをSIerやフリーランス、システムのベンダーか…
2022.12.20
ビジネスでは、DX推進のためにシステムの構築を外注するのではなく、社内で内製化する企業が増加の傾向にあります。その一方で…