ファインチューニングとは?AIへ追加学習する仕組みをわかりやすく解説

まずは、これだけ

ファインチューニングは、学習済みのAIモデルへ追加の例を学ばせ、特定用途に合う振る舞いへ調整する方法。
新しいAIをゼロから作るのではなく、基本モデルを目的に合わせて仕上げます。

基本モデルへ例を追加学習し、用途に合う振る舞いへ調整する流れ
追加学習:望ましい入力と出力の例を学ばせる調整後:特定用途に合う答え方をしやすくする

既存モデルを、目的に合う振る舞いへ調整する

LLMなどの基本モデルは幅広い質問へ答えられます。ファインチューニングでは、そのモデルへ追加の学習データを与え、特定の回答形式や文章の傾向を身につけさせます。

たとえば、問い合わせ文を決められたカテゴリーへ分類する例を多数学ばせると、同じ形式の分類を安定して行いやすくなります。単にプロンプトへ一度指示するのではなく、モデルの振る舞い自体を調整する方法です。

基本モデル

幅広い用途に対応できる学習済みモデル。

追加の例

望ましい入力と出力の組み合わせを用意する。

調整後モデル

目的に合う形式や傾向で回答しやすくなる。

対応サービスへ学習データを渡して行う

ファインチューニングは、AIとの会話画面で「この回答を覚えて」と頼む作業ではありません。一般的には、追加学習に対応したサービスや開発環境を使います。

AI提供会社の機能

入力と望ましい出力の例をアップロードし、対応モデルを追加学習する。

クラウドのAI開発サービス

モデル、学習データ、学習方法を設定して調整する。

オープンモデルとGPU環境

公開モデルを自分で調整する。自由度は高いが、専門知識も必要になる。

基本的な流れは、回答例を用意する → 対応サービスへアップロードする → 学習を実行する → 調整後モデルをAPIから利用する、となります。

RAGは資料を渡す、ファインチューニングは振る舞いを学ばせる

RAGとファインチューニングは、どちらもAIを用途に合わせる方法ですが、役割が異なります。RAGは回答時に関連資料を探して渡し、ファインチューニングは事前の追加学習で答え方や判断傾向を調整します。

最新の商品情報や社内規程を答えさせたいなら、資料を更新しやすいRAGが向いています。決まった形式で分類・出力させたいなど、繰り返す振る舞いを整えたい場合はファインチューニングが候補になります。

回答時に資料を渡すRAGと、例を追加学習して振る舞いを調整するファインチューニングの比較
知識を参照させたいのか、振る舞いを調整したいのかで使い分けます。

何でも覚えさせるための方法ではない

ファインチューニングへ大量の資料を入れれば、その内容を正確に暗記していつでも答えられる、というものではありません。学習した情報をどのように保持・再現するかは保証されず、更新も簡単ではありません。

文章のトーン、出力形式、分類方法など、何度も使う振る舞いの調整に向いています。まずプロンプトやRAGで解決できないかを確認し、それでも安定しない場合に検討されることが多い方法です。

向いている

一定の形式、分類、文章傾向を繰り返したい。

向いていない

頻繁に変わる事実を正確に覚えさせたい。

先に試すこと

プロンプト改善やRAGで目的を満たせるか確認する。

学習データの品質が、振る舞いに影響する

追加学習に使う例が間違っていたり、偏っていたりすると、その傾向もモデルへ反映される可能性があります。望ましい回答例を用意するだけでなく、調整後モデルを別のデータで評価することが必要です。

個人情報や機密情報を学習データへ含めないこと、想定外の質問で危険な回答をしないか確認することも重要です。

良い例を用意する

目的に合う、正確で一貫した学習データを使う。

別データで評価する

学習に使っていない入力でも期待どおりか試す。

安全性を確認する

機密情報や望ましくない回答傾向を見直す。

ここまでのまとめ

ファインチューニングは、学習済みモデルへ例を追加学習させ、特定用途に合う振る舞いへ調整する方法です。資料の内容を参照させるRAGとは役割が異なります。

ファインチューニングは、AIへ資料を持たせる方法ではなく、仕事のやり方を追加で練習させる方法です。