生成 AI のコラム
COLUMN

AWS AI エージェント入門|Bedrock Agents の構築とコスト

生成 AI の導入・活用に関する
ご相談を受け付けています。

簡単60秒入力・無料相談

生成 AI 活用を相談する(無料)

ChatGPT の登場から3年以上。生成 AI は「質問に答える」段階から、「タスクを実行する」段階へと進化しています。

単純な質問応答では解決できない業務が多数存在します。社内の複数システムから情報を収集し、データベースを更新し、外部 API を呼び出して処理を完了させる。こうした複雑なワークフローを、人間のように自律的に実行できるのが AI エージェントです。

Amazon Bedrock Agents を使えば、コードをほとんど書かずに、設定ベースで AI エージェントを構築できます。会議室の予約、カスタマーサポートの自動化、レポート作成など、月額数千円から始められ、24時間365日稼働し続ける AI アシスタントを実現できます。本記事では、AI エージェントの基本概念から、AWS での構築方法、具体的な料金体系と3つのユースケース別コスト試算(月額3,370円〜315,000円)、活用事例まで、実践的な情報を解説します。

AI エージェントとは

AI エージェントは、ユーザーの指示を理解し、自律的にタスクを実行するシステムです。ここでは、AI エージェントの基本概念と特徴について解説します。

参照 URL:https://aws.amazon.com/bedrock/

AI エージェントの概念

AI エージェントは、単なる質問応答システムを超えた機能を持ちます。

自律的なタスク実行

AI エージェントは、ユーザーから与えられた目標に対して、どのような手順で達成するかを自分で考え、実行します。単純に回答を返すだけでなく、複数のステップを経て、目標を達成します。

例えば、「来週の会議室を予約して」という指示に対して、エージェントは会議室の空き状況を確認し、適切な部屋を選択し、予約システムに登録するという一連の作業を自動的に実行します。

ユーザーは細かい手順を指示する必要がなく、最終的な目標を伝えるだけで済みます。エージェントが必要な判断を行い、適切なアクションを実行します。

通常の AI との違い

通常のチャットボットや AI アシスタントは、ユーザーの質問に対して回答を返すことが主な機能です。一方、AI エージェントは、回答だけでなく、実際のアクションを実行します。

質問応答型の AI は、情報を提供するだけです。「会議室はどこが空いていますか」という質問には答えられますが、実際に予約することはできません。

AI エージェントは、情報の提供だけでなく、外部システムと連携して、実際の業務を遂行します。データベースを検索し、API を呼び出し、結果を確認して次のアクションを決定します。

AI エージェントの構成要素

AI エージェントは、いくつかの要素で構成されています。基盤となる大規模言語モデル(LLM)が、ユーザーの意図を理解し、タスクを計画します。

ツールは、エージェントが実行できるアクションを定義します。データベース検索、API 呼び出し、計算の実行など、様々なツールを組み合わせて、複雑なタスクを実現します。

ナレッジベースは、エージェントが参照する情報源です。社内文書、製品マニュアル、FAQ などを格納し、エージェントが正確な情報に基づいて行動できるようにします。

AI エージェントの特徴

AI エージェントには、いくつかの重要な特徴があります。

マルチステップタスクの実行

AI エージェントは、複数のステップを含むタスクを実行できます。各ステップの結果を確認しながら、次のアクションを決定します。

例えば、旅行の予約では、目的地の天気を確認し、ホテルの空室を検索し、予算に合う部屋を選択し、予約を確定するという一連の流れを自動的に実行します。

各ステップで得られた情報を基に、最適な判断を行います。もし予算内のホテルが見つからなければ、別の日程を提案するなど、柔軟に対応できます。

外部ツールの活用

AI エージェントは、様々な外部ツールを呼び出すことができます。データベースへのクエリ、Web API の呼び出し、ファイルの読み書きなど、必要に応じてツールを使用します。

ツールの組み合わせにより、複雑な業務プロセスを自動化できます。在庫確認、顧客情報の取得、注文処理、メール送信など、複数のシステムにまたがる処理を統合的に実行します。

エージェントは、どのツールをどの順番で使うかを自分で判断します。タスクの内容に応じて、最適なツールの組み合わせを選択します。

自己判断による行動

AI エージェントは、状況に応じて自分で判断を下します。すべての行動が事前にプログラムされているわけではなく、その場の状況に応じて適切な行動を選択します。

エラーが発生した場合、代替手段を試みます。一つの方法がうまくいかなければ、別のアプローチを取るなど、柔軟に対応できます。

目標を達成するまで、試行錯誤を繰り返します。中間的な結果を評価し、目標に近づいているかを確認しながら、次のステップを決定します。

AWS の AI エージェントサービス

AWS は、AI エージェントを構築するためのサービスを提供しています。ここでは、Amazon Bedrock Agents の特徴と動作原理について解説します。

Amazon Bedrock Agents

Bedrock Agents は、AWS が提供する AI エージェント構築サービスです。

Bedrock Agents の概要

Bedrock Agents は、Amazon Bedrock の基盤モデルを活用して、自律的にタスクを実行するエージェントを構築できるサービスです。コードを記述することなく、設定ベースでエージェントを作成できます。

参照 URL:https://aws.amazon.com/bedrock/agents/

エージェントに対して、どのような役割を持たせるか、どのようなツールを使えるようにするか、どのナレッジベースを参照するかを定義します。これらの設定に基づいて、エージェントが自律的に動作します。

マネージドサービスとして提供されるため、インフラの管理が不要です。スケーラビリティも自動的に確保され、需要に応じて対応能力が調整されます。

基盤モデルとの統合

Bedrock Agents は、Bedrock で利用可能な基盤モデルと統合されています。Claude などの大規模言語モデルを使用して、ユーザーの指示を理解し、タスクを計画します。

参照 URL:https://aws.amazon.com/bedrock/claude/

モデルの選択により、エージェントの性能や特性を調整できます。より高度な推論が必要な場合は、上位のモデルを選択します。コストを抑えたい場合は、軽量なモデルを選択します。

基盤モデルは継続的に改善されており、エージェントの能力も向上します。モデルのバージョンアップにより、より正確な理解や、より適切な判断が可能になります。

エージェントの機能

Bedrock Agents は、多様な機能を提供します。自然言語での指示を理解し、タスクに分解します。必要なツールを選択し、順序を決定します。

ツールを実行し、結果を評価します。目標が達成されたか、追加のステップが必要かを判断します。複数のツールの結果を統合し、最終的な回答を生成します。

エラーが発生した場合、適切に処理します。エラーメッセージをユーザーに分かりやすく伝えたり、代替手段を試みたりします。

エージェントの動作原理

Bedrock Agents がどのように動作するかを理解することは、効果的なエージェントを構築する上で重要です。

タスクの理解と分解

ユーザーからの指示を受け取ると、エージェントはまずその内容を理解します。何を達成すべきか、どのような情報が必要か、どのような制約があるかを把握します。

複雑なタスクは、複数のサブタスクに分解されます。例えば、「今月の売上レポートを作成して」という指示は、「売上データを取得する」「データを集計する」「グラフを作成する」「レポートを整形する」といったサブタスクに分解されます。

各サブタスクの依存関係も考慮されます。あるサブタスクの結果が、次のサブタスクの入力として必要な場合、適切な順序で実行されます。

アクションの計画

サブタスクが決まったら、それぞれをどのように実行するかを計画します。利用可能なツールの中から、各サブタスクに適したものを選択します。

ツールの実行順序を決定します。並行して実行できるものは同時に処理し、順序が重要なものは適切な順番で実行します。

予想される問題や例外についても考慮します。特定のツールが失敗した場合の代替手段や、データが見つからなかった場合の対応を事前に計画します。

ツールの呼び出し

計画に基づいて、実際にツールを呼び出します。ツールには、必要なパラメータを渡します。データベースクエリであれば検索条件を、API 呼び出しであれば必要な引数を指定します。

ツールの実行結果を取得し、評価します。期待した結果が得られたか、エラーが発生していないかを確認します。

結果が不十分な場合、パラメータを調整して再試行したり、別のツールを試したりします。柔軟に対応することで、目標達成の確率を高めます。

結果の統合

すべてのサブタスクが完了したら、それぞれの結果を統合します。複数のデータソースから得られた情報を組み合わせて、一貫性のある回答を生成します。

結果を分かりやすい形式で提示します。単にデータを羅列するのではなく、ユーザーにとって理解しやすい説明や、適切な可視化を提供します。

必要に応じて、推奨事項や次のステップを提案します。単に情報を提供するだけでなく、ユーザーがどのような行動を取るべきかを示します。

AI エージェントの構築

Bedrock Agents を使用して、実際に AI エージェントを構築する手順について解説します。

構築の流れ

エージェントの構築は、いくつかのステップに分かれます。

エージェントの設計

まず、エージェントの役割と目的を明確にします。どのようなタスクを実行させるか、どのような質問に答えさせるかを定義します。

エージェントのペルソナを設定します。フォーマルな口調で対応するのか、フレンドリーな口調なのか、専門的な知識を持つアシスタントなのかを決定します。

実行できるアクションの範囲を定義します。読み取り専用の操作のみか、データの更新や削除も許可するかを決めます。セキュリティやコンプライアンスの観点から、適切な制限を設けます。

ツールの定義

エージェントが使用できるツールを定義します。各ツールは、特定の機能を提供します。データベース検索、計算の実行、外部 API の呼び出しなど、必要なツールをリストアップします。

各ツールには、名前、説明、入力パラメータ、出力形式を定義します。エージェントは、この情報に基づいて、適切なツールを選択し、正しいパラメータで呼び出します。

ツールの説明は重要です。エージェントが理解できるよう、明確で具体的な説明を記述します。どのような状況で使うべきか、どのような結果が得られるかを示します。

ナレッジベースの準備

エージェントが参照する情報を準備します。製品マニュアル、FAQ、社内文書など、必要な情報をナレッジベースに格納します。

ドキュメントは適切にフォーマットし、構造化します。見出し、段落、リストなどを使用して、情報を整理します。これにより、エージェントが必要な情報を効率的に取得できます。

ナレッジベースは定期的に更新します。古い情報は削除し、新しい情報を追加することで、エージェントが常に最新の情報を提供できるようにします。

エージェントの作成

Bedrock のコンソールまたは API を使用して、エージェントを作成します。設定した役割、ツール、ナレッジベースを登録します。

エージェントに指示(インストラクション)を与えます。どのような行動をすべきか、どのような制約があるかを記述します。この指示が、エージェントの判断基準となります。

エージェントのバージョンを管理します。設定を変更した際には、新しいバージョンを作成し、テストしてから本番環境にデプロイします。

ツールとアクションの定義

エージェントが実行するツールを実装します。

Lambda 関数の作成

多くの場合、ツールは Lambda 関数として実装されます。Lambda 関数は、サーバーレスで実行され、必要な時だけ起動するため、コスト効率が高くなります。

各ツールの処理ロジックを Lambda 関数に実装します。データベースへのクエリ、外部 API の呼び出し、計算処理など、必要な機能を実装します。

エラーハンドリングを適切に実装します。予期しない入力や、外部システムのエラーに対して、適切なエラーメッセージを返します。

API の定義

ツールの API 仕様を定義します。OpenAPI(Swagger)形式で、エンドポイント、メソッド、パラメータ、レスポンスを記述します。

パラメータには、型、必須/任意、説明を明記します。エージェントがツールを正しく呼び出せるよう、明確に定義します。

レスポンス形式も明確にします。成功時のレスポンス、エラー時のレスポンスをそれぞれ定義し、一貫性のある形式を保ちます。

ツールの登録

定義したツールを、エージェントに登録します。API 仕様を Bedrock に提供し、エージェントがツールを認識できるようにします。

ツールの権限を設定します。エージェントが Lambda 関数を呼び出せるよう、IAM ロールを適切に設定します。最小権限の原則に従い、必要な権限のみを付与します。

ナレッジベースの統合

エージェントに知識を与えるため、ナレッジベースを統合します。

RAG の実装

RAG(Retrieval-Augmented Generation:検索拡張生成)は、外部の知識ベースから情報を取得し、それを基に回答を生成する技術です。Bedrock Agents は、RAG を組み込みでサポートしています。

参照 URL:https://aws.amazon.com/what-is/retrieval-augmented-generation/

ナレッジベースから関連する情報を検索し、その情報をコンテキストとして基盤モデルに渡します。モデルは、この情報に基づいて、正確で詳細な回答を生成します。

RAG により、エージェントは自社固有の情報に基づいて回答できます。一般的な知識だけでなく、組織特有のポリシーや、製品の詳細な仕様についても正確に答えられます。

ベクトルデータベース

ナレッジベースは、ベクトルデータベースに格納されます。ドキュメントは、埋め込みベクトルに変換され、意味的な類似性に基づいて検索できるようになります。

ユーザーの質問も同様にベクトル化され、関連するドキュメントを効率的に検索します。キーワード検索では見つけられない、意味的に関連する情報も取得できます。

Bedrock では、Amazon Bedrock Knowledge Bases を使用して、ベクトルデータベースを簡単に構築できます。S3 にドキュメントを配置するだけで、自動的にインデックスが作成されます。

参照 URL:https://aws.amazon.com/bedrock/knowledge-bases/

情報の取得と活用

エージェントは、必要に応じてナレッジベースから情報を取得します。ユーザーの質問に答えるため、または、タスクを実行するための情報を得るために使用します。

取得した情報は、エージェントの判断材料となります。ポリシーに基づいた判断、製品仕様に基づいた提案など、正確な情報に基づいて行動します。

情報源を明示することもできます。回答に対して、どのドキュメントを参照したかを示すことで、信頼性を高められます。

テストと改善

エージェントを構築したら、テストと改善を繰り返します。

エージェントのテスト

様々なシナリオでエージェントをテストします。想定される質問やタスクを試し、正しく動作するかを確認します。

エッジケースもテストします。曖昧な指示、予期しない入力、エラー状態など、通常とは異なる状況での動作を確認します。

複数のユーザーでテストし、フィードバックを収集します。実際のユーザーがどのように使用するかを観察し、改善点を発見します。

精度の向上

テスト結果に基づいて、エージェントを改善します。誤った回答をした場合、原因を分析し、修正します。

ツールの定義を見直します。説明が不明確だった場合、より具体的な説明に修正します。パラメータの型や制約を調整します。

ナレッジベースを拡充します。不足している情報を追加し、誤った情報を修正します。ドキュメントの構造を改善し、検索しやすくします。

継続的な改善

エージェントは、一度構築したら終わりではありません。継続的に改善を重ねることで、より有用なシステムになります。

ユーザーの利用状況をモニタリングします。どのような質問が多いか、どのタスクがよく実行されるかを把握します。頻繁に使用される機能を優先的に改善します。

フィードバックを積極的に収集します。ユーザーが満足しているか、改善してほしい点はないかを定期的に確認します。

AWS サービスとの連携

AI エージェントは、他の AWS サービスと連携することで、実際の業務システムと統合できます。

Lambda との連携

Lambda は、エージェントのツールを実装する最も一般的な方法です。

関数の実装

Lambda 関数は、サーバーレスで実行されるため、インフラの管理が不要です。必要な時だけ起動し、使用した分だけ課金されるため、コスト効率が高くなります。

参照 URL:https://aws.amazon.com/lambda/

Python、Node.js、Java など、様々な言語で実装できます。既存のライブラリを活用して、効率的に開発できます。

Lambda 関数内で、他の AWS サービスや外部 API を呼び出すことができます。DynamoDB からのデータ取得、S3 へのファイル保存、外部システムとの連携など、柔軟な実装が可能です。

エージェントからの呼び出し

Bedrock Agents は、定義されたツールを必要に応じて呼び出します。エージェントから Lambda 関数に、必要なパラメータが渡されます。

Lambda 関数は処理を実行し、結果を返します。結果は JSON 形式で返され、エージェントが理解できる構造になっている必要があります。

エージェントは、Lambda 関数の実行結果を評価し、次のアクションを決定します。期待した結果が得られなかった場合、別のアプローチを試みることもあります。

データベースとの連携

エージェントは、データベースと連携することで、永続的なデータを扱えます。

DynamoDB の活用

DynamoDB は、フルマネージドの NoSQL データベースです。高速で、スケーラブルなため、エージェントのバックエンドとして適しています。

参照 URL:https://aws.amazon.com/dynamodb/

ユーザーの設定、会話履歴、タスクの状態など、様々な情報を保存できます。エージェントは、過去の会話を参照して、文脈を理解した対応ができます。

Lambda 関数から DynamoDB にアクセスし、データの取得、更新、削除を行います。必要な権限を IAM ロールで設定し、セキュアにアクセスします。

データの取得と更新

エージェントは、ツールを通じてデータベースからデータを取得します。顧客情報、在庫状況、予約状況など、必要な情報を検索します。

データの更新も行えます。注文の作成、予約の変更、ステータスの更新など、実際の業務処理を実行します。

トランザクション処理を適切に実装することで、データの整合性を保ちます。複数の操作をアトミックに実行し、途中で失敗した場合はロールバックします。

その他のサービスとの統合

様々な AWS サービスと連携することで、エージェントの機能を拡張できます。

S3

S3 は、オブジェクトストレージサービスです。エージェントは、S3 にファイルを保存したり、既存のファイルを読み取ったりできます。

参照 URL:https://aws.amazon.com/s3/

生成したレポートを S3 に保存し、ユーザーにダウンロード URL を提供することができます。アップロードされたファイルを分析し、内容を要約することもできます。

API Gateway

API Gateway を使用すると、エージェントを HTTP API として公開できます。Web アプリケーションやモバイルアプリから、エージェントを呼び出せるようになります。

参照 URL:https://aws.amazon.com/api-gateway/

認証、レート制限、ログ記録などの機能を API Gateway で実装できます。エージェント自体はビジネスロジックに集中し、API 管理の機能は API Gateway に任せられます。

SQS / SNS

SQS や SNS を使用すると、非同期処理を実現できます。時間のかかる処理を SQS キューに入れ、バックグラウンドで処理できます。

参照 URL:https://aws.amazon.com/sqs/
参照 URL:https://aws.amazon.com/sns/

処理が完了したら、SNS で通知を送信できます。ユーザーにメールで結果を通知したり、他のシステムに完了を知らせたりできます。

AI エージェントの活用事例

AI エージェントは、様々なビジネスシーンで活用されています。

カスタマーサポート

AI エージェントは、カスタマーサポートの効率化と品質向上に貢献します。

問い合わせ対応の自動化

顧客からの一般的な問い合わせに、AI エージェントが自動で対応できます。営業時間外でも即座に回答を提供し、顧客の待ち時間を削減します。

製品の使い方、料金プラン、配送状況など、よくある質問に対して正確に回答します。ナレッジベースから最新の情報を取得し、一貫性のある対応を提供します。

必要に応じて、システムと連携して情報を取得します。注文履歴を確認したり、配送状況を追跡したりして、顧客固有の情報を提供します。

複雑な質問への対応

単純な FAQ を超えた、複雑な質問にも対応できます。複数の情報を組み合わせて、包括的な回答を生成します。

例えば、「予算5万円で3泊4日の北海道旅行を計画したい」という質問に対して、交通費、宿泊費、観光費を考慮した提案ができます。

顧客の過去の履歴や好みを考慮して、パーソナライズされた提案も可能です。以前に購入した製品に基づいて、関連商品を推薦するなど、より価値の高いサポートを提供します。

予約・注文の自動化

AI エージェントは、予約や注文のプロセスを自動化できます。

予約システムとの連携

レストラン、ホテル、会議室などの予約を、会話形式で行えます。顧客は希望する日時や条件を伝えるだけで、エージェントが空き状況を確認し、予約を完了します。

予約の変更やキャンセルも、エージェントに依頼できます。「来週の予約を1日遅らせて」といった指示に対して、現在の予約を確認し、新しい日程で空きがあるかを確認し、変更を実行します。

確認メールの送信、リマインダーの設定なども自動化できます。顧客体験を向上させながら、予約管理の手間を削減します。

在庫確認と注文処理

EC サイトでの注文を、AI エージェントが処理できます。「赤いTシャツのMサイズを2枚注文したい」という指示に対して、在庫を確認し、注文を作成し、配送手配を行います。

在庫がない場合、代替商品を提案したり、入荷予定を伝えたりします。顧客のニーズに最大限応えるよう、柔軟に対応します。

注文後の問い合わせにも対応します。配送状況の確認、返品の手続き、請求内容の説明など、注文に関する様々な質問に答えます。

社内業務の効率化

AI エージェントは、社内の様々な業務を効率化できます。

情報検索の自動化

社内文書、ポリシー、手順書などから、必要な情報を検索できます。「出張申請の手順は?」という質問に対して、関連する文書を検索し、手順を説明します。

複数の文書にまたがる情報も統合して提示します。例えば、経費精算のポリシー、承認フロー、申請フォームの場所など、関連する情報をまとめて提供します。

専門用語や略語も理解します。ナレッジベースに用語集を含めることで、社内特有の表現にも対応できます。

レポート作成

データを収集し、分析し、レポートを作成することもできます。「先月の売上レポートを作成して」という指示に対して、データベースから売上データを取得し、集計し、グラフを生成し、レポート形式にまとめます。

定期的なレポート作成を自動化することで、担当者の負担を軽減できます。毎週、毎月のレポートを自動生成し、関係者にメールで送信することもできます。

データ分析

AI エージェントは、データ分析を支援します。

データの収集と分析

複数のデータソースからデータを収集し、統合できます。データベース、API、ファイルなど、様々な場所からデータを取得します。

データを分析し、傾向やパターンを発見します。売上の増減、顧客の行動パターン、異常値の検出など、データから洞察を得ます。

分析結果を可視化し、分かりやすく提示します。グラフ、チャート、ダッシュボードなど、適切な形式で情報を表現します。

洞察の提供

単にデータを提示するだけでなく、洞察や推奨事項を提供します。「売上が減少している理由は?」という質問に対して、データを分析し、考えられる要因を提示します。

予測分析も可能です。過去のデータから将来の傾向を予測し、ビジネスの意思決定を支援します。

AI エージェント構築のポイント

効果的な AI エージェントを構築するためのポイントについて解説します。

適切なスコープ設定

エージェントの能力には限界があります。適切なスコープを設定することが重要です。

実現可能な範囲

すべてを自動化しようとせず、実現可能な範囲から始めます。明確に定義されたタスクから着手し、確実に機能するエージェントを構築します。

複雑すぎるタスクは、複数のエージェントに分割することも検討します。各エージェントが特定の領域に特化することで、精度が向上します。

PoC 段階から本番運用を見据えた設計を行うことで、検証で得られた成果をそのまま本番環境に活かすことができます。効果が確認できた機能のみを本格環境に展開するアプローチにより、二重投資を避けながら確実な投資対効果の確保が期待できます。

段階的な拡張

最初は限定的な機能から始め、段階的に拡張します。基本的な質問応答から始めて、徐々にアクションの実行、複雑なタスクの自動化へと進めます。

各段階で効果を測定し、フィードバックを収集します。ユーザーのニーズを理解し、最も価値のある機能を優先的に開発します。

継続的な改善により、エージェントの能力を向上させます。新しいツールの追加、ナレッジベースの拡充、プロンプトの改善などを重ねて、より有用なシステムにします。

ユーザー体験の設計

エージェントのユーザー体験は、採用率に大きく影響します。

自然な会話

ユーザーが自然に会話できるよう、設計します。専門用語を避け、分かりやすい言葉で対応します。ユーザーの意図を正しく理解できない場合は、明確化のための質問をします。

会話の文脈を保持します。過去の発言を参照し、「それ」「あれ」などの代名詞も理解します。複数のターンにわたる会話をスムーズに進めます。

適切なトーンで対応します。フォーマルな場面ではビジネスライクに、カジュアルな場面ではフレンドリーに、状況に応じて調整します。

エラー処理

エラーが発生した場合、ユーザーにわかりやすく伝えます。技術的なエラーメッセージではなく、何が問題で、どうすれば解決できるかを説明します。

代替手段を提案します。一つの方法がうまくいかなかった場合、別のアプローチを試みたり、人間のサポートにエスカレーションしたりします。

エラーから学習します。頻繁に発生するエラーを分析し、根本原因を解決します。エージェントの堅牢性を継続的に向上させます。

セキュリティとアクセス制御

エージェントは、機密情報にアクセスし、重要な操作を実行する可能性があります。適切なセキュリティ対策が必要です。

権限の設定

エージェントに必要最小限の権限のみを付与します。すべてのデータやシステムにアクセスできるのではなく、業務上必要な範囲に限定します。

参照 URL:https://aws.amazon.com/iam/

ユーザーの認証と認可を適切に実装します。誰がエージェントを使用できるか、どのような操作を実行できるかを制御します。

監査ログを記録します。エージェントが実行したすべてのアクションを記録し、後から確認できるようにします。問題が発生した際の調査に役立ちます。

データ保護

機密情報を適切に扱います。顧客情報、個人情報、企業秘密などは、暗号化して保存し、アクセスを制限します。

データの保持期間を定義します。必要以上に長くデータを保持せず、適切なタイミングで削除します。プライバシー規制やコンプライアンス要件に準拠します。

コストと導入効果

AI エージェントの導入には、コストと効果の両面を考慮する必要があります。ここでは、具体的な料金体系と、ユースケース別のコスト試算について解説します。

(本記事の日本円換算は $1 = ¥140 で試算しています。実際の金額は為替レートにより変動します。また、料金は米国東部リージョンの例であり、プランの改定によって価格が変わる場合があるため、最新の料金は公式料金ページでご確認ください)

参照 URL:https://aws.amazon.com/bedrock/pricing/

料金体系

AWS の AI エージェントサービスは、従量課金制で、使用した分だけ支払う仕組みです。

参照 URL:https://aws.amazon.com/bedrock/pricing/

Bedrock Agents の料金モデル

Amazon Bedrock Agents の料金は、主に以下の要素で構成されます:

料金項目 課金単位 詳細
基盤モデル利用料 トークン数 入力トークンと出力トークンで異なる単価。エージェントは1回のリクエストで複数回モデルを呼び出すため、通常の API 利用よりトークン消費が多くなる
Knowledge Base 検索回数とストレージ Retrieve API の呼び出し回数と、保管データ量

基盤モデルの料金(例:Claude Sonnet 4.6)

モデル 入力トークン単価 出力トークン単価
Claude Sonnet 4.6 $3.00 / 100万トークン $15.00 / 100万トークン
Claude Haiku 4.5 $1.00 / 100万トークン $5.00 / 100万トークン
Claude Opus 4.7 $5.00 / 100万トークン $25.00 / 100万トークン

トークン数の目安:
- 日本語 1文字 = 2〜3トークン
- 英語 1単語 = 1.3トークン
- 平均的な会話 1往復 = 500〜1,000トークン

参照 URL:https://aws.amazon.com/bedrock/pricing/

Amazon Bedrock Knowledge Bases の料金(Managed Knowledge Base)

項目 料金
Index Storage $5.00 / GB(raw data)/ 月
Standard Retrieval(Retrieve API) $1.00 / 1,000 API calls

Managed Knowledge Base では、ドキュメントの解析、埋め込みベクトルの生成、Re-ranking が料金に含まれています。

データ量の目安:
- 10ページの PDF 文書 約50KB〜200KB
- 100件の FAQ ドキュメント = 約1〜5MB
- 社内文書一式(中規模) = 約1〜10GB

参照 URL:https://aws.amazon.com/bedrock/pricing/

Lambda の料金

エージェントのツール(アクション)を Lambda で実装する場合の料金:

項目 料金 無料枠
リクエスト数 $0.20 / 100万リクエスト 月間100万リクエスト
実行時間 $0.0000166667 / GB秒 月間40万GB秒

実行時間の計算例:
- 512MB メモリ、500ms 実行 = 0.25GB秒
- 月間10,000回実行 = 2,500GB秒(無料枠内)

参照 URL:https://aws.amazon.com/lambda/pricing/

その他の AWS サービス料金

サービス 料金(目安)
DynamoDB(オンデマンド) 書き込み: $0.625/100万リクエスト、読み取り: $0.125/100万リクエスト
S3(標準ストレージ) $0.023 / GB / 月
API Gateway $3.50 / 100万リクエスト

ユースケース別のコスト試算

実際のビジネスシーンでの月額コストを試算します。

ケース1:カスタマーサポートエージェント(小規模)

前提条件:
- 月間1,000件の問い合わせ対応
- 平均3往復の会話(1往復 = 800トークン)
- Knowledge Base から平均2回の検索
- 使用モデル:Claude Sonnet 4.6

コスト内訳:

【基盤モデル料金】
- 入力:1,000件 × 3往復 × 800トークン × 0.5(入力比率) = 1.2M トークン
- 出力:1,000件 × 3往復 × 800トークン × 0.5(出力比率) = 1.2M トークン
- 入力料金:$3.00 × 1.2 = $3.60
- 出力料金:$15.00 × 1.2 = $18.00

【Knowledge Base(Managed)】
- 検索クエリ:1,000件 × 2回 = 2,000 API calls = $2.00
- ストレージ(100MB = 0.1GB):$5.00 × 0.1 = $0.50

【Lambda(ツール実行)】
- 1,000件 × 平均2回のツール呼び出し = 2,000リクエスト(無料枠内)

【合計月額:約 $24.10(約3,370円)】

1件あたりのコスト:約 $0.024(約3.4円)

ケース2:社内情報検索エージェント(中規模)

前提条件:
- 従業員200名、月間5,000件のクエリ
- 平均2往復の会話(1往復 = 600トークン)
- Knowledge Base から平均3回の検索
- ドキュメント:10GB
- 使用モデル:Claude Haiku 4.5(コスト重視)

コスト内訳:

【基盤モデル料金(Haiku 4.5)】
- 入力:5,000件 × 2往復 × 600トークン × 0.5 = 3M トークン
- 出力:5,000件 × 2往復 × 600トークン × 0.5 = 3M トークン
- 入力料金:$1.00 × 3 = $3.00
- 出力料金:$5.00 × 3 = $15.00

【Knowledge Base(Managed)】
- 検索クエリ:5,000件 × 3回 = 15,000 API calls = $15.00
- ストレージ(10GB):$5.00 × 10 = $50.00

【Lambda】
- 5,000件 × 平均1回のツール呼び出し = 5,000リクエスト(無料枠内)

【合計月額:約 $83.00(約11,620円)】

1件あたりのコスト:約 $0.017(約2.3円)

ケース3:予約・注文処理エージェント(大規模)

前提条件:
- 月間50,000件の予約・注文処理
- 平均5往復の会話(1往復 = 1,000トークン)
- データベース連携(Lambda):平均5回のツール呼び出し
- 使用モデル:Claude Sonnet 4.6

コスト内訳:

【基盤モデル料金】
- 入力:50,000件 × 5往復 × 1,000トークン × 0.5 = 125M トークン
- 出力:50,000件 × 5往復 × 1,000トークン × 0.5 = 125M トークン
- 入力料金:$3.00 × 125 = $375.00
- 出力料金:$15.00 × 125 = $1,875.00

【Lambda(ツール実行)】
- 50,000件 × 5回 = 250,000リクエスト(無料枠 100万リクエスト以内)= $0
- 実行時間(平均300ms、512MB):250,000 × 0.15GB秒 = 37,500GB秒(無料枠内)

【DynamoDB】
- 書き込み:50,000 × 3回 / 1,000,000 × $0.625 = $0.09
- 読み取り:50,000 × 10回 / 1,000,000 × $0.125 = $0.06

【合計月額:約 $2,250.15(約315,000円)】

1件あたりのコスト:約 $0.045(約6.3円)

コスト最適化のポイント

1. モデルの選択

用途に応じて適切なモデルを選択することで、大幅にコストを削減できます:

  • 簡単な質問応答:Claude Haiku 4.5(Sonnet の 1/3 のコスト)
  • 複雑な推論が必要:Claude Sonnet 4.6(バランス型)
  • 最高精度が必要:Claude Opus 4.7(高精度)

コスト削減効果: Haiku を使用することで、基盤モデルコストを約 67% 削減可能

2. プロンプトの最適化

  • 簡潔な指示文:不要な情報を削除し、トークン数を削減
  • システムプロンプトの効率化:共通部分をキャッシュ活用
  • 会話履歴の管理:古い履歴を削除し、必要な情報のみ保持

コスト削減効果: トークン数を 30〜50% 削減可能

3. Knowledge Base の最適化

  • ドキュメントの事前処理:不要な情報を削除
  • 検索精度の向上:関連性の高い情報のみ取得
  • キャッシュの活用:頻繁に検索される情報をキャッシュ

4. Lambda の効率化

  • メモリサイズの最適化:適切なメモリ設定で実行時間を短縮
  • コールドスタート対策:Provisioned Concurrency の活用(高負荷時)
  • バッチ処理:複数の操作をまとめて実行

5. 段階的な展開

  • Phase 1:FAQ 応答のみの PoC(月額$25〜$100程度)
  • Phase 2:ツール連携を追加し、タスク実行まで拡張(月額$100〜$500程度)
  • Phase 3:マルチエージェント構成で本格展開(規模に応じて調整)

投資対効果: PoC で効果を確認してから本格展開することで、投資リスクを最小化

導入効果

AI エージェントの導入により、様々な効果が期待できます。

業務効率化

反復的なタスクを自動化することで、担当者の作業時間を大幅に削減できます。顧客対応、データ入力、情報検索など、手作業で行なっていた業務を自動化します。

担当者は、より付加価値の高い業務に集中できます。複雑な問題の解決、戦略立案、顧客との深い関係構築など、人間にしかできない業務に時間を割けます。

24時間365日の対応が可能になります。営業時間外でも顧客の問い合わせに対応でき、顧客満足度が向上します。

対応能力の拡大

人員を増やさずに、対応能力を拡大できます。エージェントは、同時に複数のリクエストを処理できるため、ピーク時の需要にも対応できます。

スケーラビリティが高く、ビジネスの成長に合わせて能力を拡張できます。新しい拠点の開設、新製品の発売など、需要が急増する場面でも、迅速に対応できます。

一貫性のある対応を提供できます。担当者によるバラつきがなく、すべての顧客に同じ品質のサービスを提供します。

最後に

Amazon Bedrock Agents を使えば、設定ベースで AI エージェントを構築でき、月額数千円から始められます。まずは限定的な業務で PoC を実施し、効果を確認しながら段階的に適用範囲を広げていくアプローチが、投資リスクを抑えつつ確実に成果を得る近道です。

cloudpack では、Amazon Bedrock Agents を活用した AI エージェントの構築を支援しています。要件定義から、アーキテクチャ設計、ツールの実装、Knowledge Base の構築、テストと改善まで、トータルでサポートいたします。コスト試算や段階的な展開計画の立案もご相談いただけます。

参照 URL:https://cloudpack.jp/service/generative-ai.html

お気軽にご相談ください