Azure OpenAI ServiceによるRGA構築【コスト編】

最近、Azure OpenAI Service（AOAI）を使う機会が多いので、自己学習のためにコストの考え方について整理しておきます。※基本的な情報しか記載しません。基本中のキのみです。

マルチンゲール

PoCに幾らかかるのか？、お客さんに聞かれることが多いです。コスト試算方法を理解しておくことが重要です。

本記事の内容

1 RAGとは
2 トークンとは
3 言語モデルの価格
4 最も簡単なRAGにおけるコスト計算事例
5 コスト試算例　言語モデル：GPT-4-Turbo
6 コスト管理の方法
7 うっかり予算オーバーすることを防ぐ方法
8 まとめ

RAGとは

RAG（Retrieval-Augmented Generation：検索拡張生成）はLLMが備える知識に加えて、社内情報等の検索結果を回答生成に生かす手法です。最も簡単なRAGの構成は以下の様になります。

クリックで拡大

learn.microsoft.com

RAG と生成 AI - Azure AI Search

https://learn.microsoft.com/ja-jp/azure/search/retrieval-augmented-generation-overview

Azure AI Search ソリューションで生成 AI と取得拡張生成 (RAG) パターンがどのように使用されるかについて説明します。

ここでかかる費用は、大きく以下の2つに大別されます。

Azure OpenAI Serviceの言語モデル使用料
周辺リソース（Azure AI Search　等）の使用料

それぞれについて、確認していきます。

トークンとは

言語モデルはトークンという概念に基づいて課金されます。
トークンは、自然言語処理モデルがテキストを処理する際の基本単位で、英語の場合には、単語を分割したものと考えることができます。日本語の場合には、単語単位で分割されません。OpenAIのサイトでトークンを計算できます。

＜トークンの目安＞

英語と日本語のトークン

英語　1単語　＝　1トークン
日本語　ひらがな・カタカナ1文字　＝　1～2トークン、
漢字1文字　＝　1～3トークン

platform.openai.com

Just a moment...

~~https://platform.openai.com/tokenizer~~

マルチンゲール

日本語の場合は英語よりもややこしいですね(;^_^A

言語モデルの価格

モデルごとに価格が異なるため、目的や要求精度に応じて使い分けることがコストを抑える上でのポイントになります。言語モデルの価格は以下で確認できます。以下の画像は、スウェーデン中央リージョンの価格表です。モデルによって大きな価格差があります。GPT4はGPT3.5よりも高く、生成文はプロンプトよりも高い傾向があります。

クリックで拡大

表の金額は1000トークンあたりの値であることに注意してください。

azure.microsoft.com

Azure OpenAI Service - Pricing | Microsoft Azure

https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/

Azure OpenAI Service pricing information. Try popular services with a free Azure account, and pay as you go with no upfront costs.

マルチンゲール

日本語版のドキュメントは英語版に比べて更新が遅いので、極力英語版を確認することをお勧めします！

最も簡単なRAGにおけるコスト計算事例

RAGを実施する際は、トータルコストを把握しておくことが大切です（事業部のDX予算には、限りがあるので、、）。コストは料金計算ツールを使って見積れます。これが、かなり便利です。

以下のユースケースで、1カ月間（営業日数：20日）のRAGのコストを試算してみます。RAGにはいくつかのリソースを使うのですが、キーとなるAzure AI SearchとAzure OpenAI Serviceにフォーカスしてコスト試算します。

100人の社員がいます
1日に1人あたり10回RAGを実行します

その上で、1回の実行で消費するトークンは6000とします。内訳は、プロンプト5000、生成1000です。

マルチンゲール

実際の営業活動でもこの様に、仮定を置いて試算することが多いです。

クリックで拡大

azure.microsoft.com

Pricing Calculator | Microsoft Azure

https://azure.microsoft.com/en-us/pricing/calculator/

Configure and estimate the costs for Azure products and features for your specific scenarios.

コスト試算例　言語モデル：GPT-4-Turbo

＜計算式＞

Azure AI Search：定額課金の考え方
1カ月のトータル時間　×　ユニット数　×　1時間あたりの1ユニットの使用料
Azure OpenAI Service：従量課金の考え方
1回の実行で消費するトークン数　×　1日あたりの実行回数　×　営業日数　×　1トークンあたりの使用料