クラウド元SEママの情シスなりきりAWS奮闘記

注目のAIエージェント。本番活用を加速するAmazon Bedrock関連新サービス

2026年2月9日掲載

こんにちは、シイノキです。今年の冬はあったかいのかと思ったら、急にものすごく寒くなるので、油断できません。ずっと寒くていいとは言いませんが、寒暖差は勘弁してほしいところ。

さて、前回に引き続き、AWS re:Invent 2025の発表より、注目のサービスを紹介するシリーズ、今回取り上げるのは「AIエージェント」です。生成AIがはやったと思ったら、もう次のが出るのか？！という感じで、新しい情報を追いかけるだけでも息切れしそうですが、次のキーワードとしてかなり注目されています。
ということで、もちろんAWS re:Invent 2025でもAIエージェントはかなりホットなトピックだったようで、Amazon Bedrock関連でもAIエージェントの活用を補強するようなアップデートがありました。ここでは、そもそもAIエージェントとはなにかという基本を紹介するとともに、アップデートの内容について解説します。

そもそもAIエージェントとは何か？

生成AIの登場は、結構な衝撃でした。自然言語でのやり取りをもとに、文章や画像、ソースコードなどを生成できるようになって、業務効率が上がるというか、「これまでやってきたのは何だったのか」とちょっと茫然とする感じというか……ともあれ、すでに多くの企業が導入し、業務に活用しはじめています。
ただ、生成AIは「効率化」はできても「自動化」できるかというと、ちょっと疑問がつきます。そこで、企業が求める「高度な業務自動化」を実現するアプローチとして注目されているのが「AIエージェント」です。AIエージェントは「自律的に動くAI」と言われますが、自律的と言われてもちょっとイメージしにくいところ。もう少し補足していくと、「人間の関与を最小限に抑え、設定された目標を自律的に達成しようとふるまうソフトウェア」といった感じで、人が設定したゴール（目標）をAIが理解して、タスクに分解し、作業を自律的に進めて、結果をまとめてくれる、ということになります。

AIエージェントの仕組み
ユーザー「AI市場の調査レポートを作成してください」（ゴール・タスク）→AIエージェント【ゴール理解（AI市場の調査をする。結果をレポート形式にまとめて出力する）→実行計画の策定（1.競合他社調査する　2.市場レポートを読んで情報を抽出する　3.比較表をまとめてレポートに出力する）→タスク1＜観測・評価＞＜LLM＞（Data・Tool　競合他社調査するためにWebサーチのツールを使う）→タスク2＜観測・評価＞＜LLM＞（Data・Tool　既存レポートを読むためにMCPで社内文書に接続）→タスク3＜観測・評価＞＜LLM＞（Data・Tool　レポートを作成してストレージにファイルを出力）】→結果・成果をユーザーに返す＜数時間かけておこなっていた調査レポートの作成が数分に短縮＞

ユーザー「AI市場の調査レポートを作成してください」（ゴール・タスク）→AIエージェント【ゴール理解（AI市場の調査をする。結果をレポート形式にまとめて出力する）→実行計画の策定（1.競合他社調査する　2.市場レポートを読んで情報を抽出する　3.比較表をまとめてレポートに出力する）→タスク1＜観測・評価＞＜LLM＞（Data・Tool　競合他社調査するためにWebサーチのツールを使う）→タスク2＜観測・評価＞＜LLM＞（Data・Tool　既存レポートを読むためにMCPで社内文書に接続）→タスク3＜観測・評価＞＜LLM＞（Data・Tool　レポートを作成してストレージにファイルを出力）】→結果・成果をユーザーに返す＜数時間かけておこなっていた調査レポートの作成が数分に短縮＞

これまで生成AIの中核となっていたLLMは、事前学習した情報をもとに「思考する」ことで、ユーザーの質問・指示にあわせて、「最適と思われる回答」を生成していました。それに対して、AIエージェントは「思考」と「行動」を組み合わせ、それを繰り返すことで、回答を導きます。「LLMを組み込んだワークフロー」を実現できるようなイメージで、これにより高度な自動化も可能になる、というわけです。

AIエージェント活用の中核を担う「Amazon Bedrock AgentCore」

AWSは当然のようにこのトレンドに追随しており、2025年10月にAIエージェントを安全に構築・運用するためのプラットフォームとして「Amazon Bedrock AgentCore」が一般公開されました。
AIエージェントを実行する基盤だけでなく、会話や作業履歴といった「記憶（Memory）」の管理や、外部ツール・システムとの連携、挙動の可視化など、さまざまな機能が用意されており、まさにAIエージェント活用の中心的な役割を担うサービスと言えそうです。

Amazon Bedrock AgentCore
＜Amazon Bedrock AgentCore＞Enhance with tools & memory（Memory・Browser tool・Code interpreter・Gateway）、Deploy securely at scale（Runtime・Identity）、Gain operational insights with agentic operations（Observability）＜Open source＞Protocols：MCP, A2A、Frameworks：CrewAI, Google ADK, LangGraph, LlamaIndex, OpenAI Agents SDK, Strands Agents

＜Amazon Bedrock AgentCore＞Enhance with tools & memory（Memory・Browser tool・Code interpreter・Gateway）、Deploy securely at scale（Runtime・Identity）、Gain operational insights with agentic operations（Observability）＜Open source＞Protocols：MCP, A2A、Frameworks：CrewAI, Google ADK, LangGraph, LlamaIndex, OpenAI Agents SDK, Strands Agents

AIエージェントの“行動”を制御する「Amazon Bedrock AgentCore Policy」

AWS re:Invent 2025では、このAmazon Bedrock AgentCoreに関するアップデートがいくつか発表されました。
まずは、「Amazon Bedrock AgentCore Policy」です。AIエージェントで業務を自動化するといっても、なんでも勝手に任せればよいわけではありません。そこで、だれが・どのコードを実行できるのか、許可・拒否を制御できる仕組みを提供するのがAmazon Bedrock AgentCore Policyで、ポリシーをCedarという言語で設定できるほか、自然言語で設定することも可能だそう。生成AIがどんどん浸透していくのを感じます。
Bedrock AgentCore Policyは、AIエージェントのアクションをチェックし、許可してよいかを判断したうえで実行させることで、AIエージェントが予期せぬことをしてしまうリスクを抑えます。実運用するならば、「機密性が高いデータにはアクセスを許可しない」「個人情報を外部に送信しない」など禁止すべきアクションの制御は必須でしょう。「本番稼働させるには、こういう機能も欲しいな」という部分をきっちりカバーするサービス、と言えるでしょう。

AIエージェントの品質を評価する「Amazon Bedrock AgentCore Evaluations」

もうひとつ、注目したいのが「Amazon Bedrock Evaluations」です。こちらは、品質をモニタリング・評価するサービスで、AIエージェントの正確性や有用性などを継続的にスコアリングします。標準でも13種類の評価項目が設定されていて、どの項目を評価するかを選択できます。
＜評価項目・例＞

Correctness（正確性）：AIエージェントの回答に含まれる情報が事実に基づいて正確かどうか
Helpfulness（有用性）：AIエージェントの対応がどれほど有用で、価値があるか
Harmfulness（有害性）：回答に有害なコンテンツが含まれていないか
Stereotyping（ステレオタイプ）：個人やグループについてステレオタイプ表現が含まれていないか

このほかカスタマイズで評価項目を追加することも可能です。
ちなみに、Amazon Bedrock AgentCore EvaluationsはAmazon CloudWatchに統合されており、評価結果に対してアラートを設定することも可能。つまり、「品質が悪くなってきたら通知して」が簡単に実現できる！性能劣化を早期に検出して、対処ができるというわけです。
AIエージェントが「ちゃんと動いているのか」を検証するのは、正直結構面倒そうだなという気持ちしかなく、とはいえ、業務自動化に本格的に使うとなったらやらないわけにはいきません。「同じ問い合わせなのに、毎回回答内容が違って、品質が一定しない」とか、絶対問題になるやつじゃないですか。AIの処理をどう評価するかは、これからますます重要なポイントになるはずで、そこをカバーするサービスが、Amazon Bedrock AgentCore Evaluationsということですよね。

業務を「任せられる」AIエージェントが、いよいよ現実的に

生成AIが登場し、おもしろいとは思うものの、「効率化できる業務って結構限られるよね？」と感じていました。そこから一歩踏み込んで、「生成AIがここまでやってくれればいいのに」というところまでできちゃうかも、というのがAIエージェントなのでは……と理解しました。
そうなってくると、業務アプリケーションに組み込まれるケースも増えていきそうですし、生成AIのチャットを立ち上げて、指示して、回答をどこかにコピペして……みたいな地味に厄介な作業がなくなって、グググっと便利になるのではないでしょうか。
生成AIに追いつけるんだろうかなんて思っていましたが、追いつけるとか追いつけないとか、そういう次元の話ではなくなりそうな予感がします。
AWS re:Invent 2025のKeynoteでは「未来は、なんでもできるエージェントじゃない、なんでも任せられるエージェントだ」という言葉もあったようですが、実際、AIエージェントを本番活用していくとなると、「いかに信頼して、任せることができるか」が重要になります。今後は、まさに今回アップデートされた機能などを活用して、業務を「任せられるエージェント」を生み出すことが鍵になるのかもしれません。
……としつつ、実はそれそろそろ実現されているかも……？というのが次回のテーマ。AWSが発表した新しいAIエージェント「Frontier Agents」について紹介します。以上、シイノキでした！

このコラムに関連する製品

生成AI活用「社内FAQボット」

社内ヘルプデスクや問い合わせ窓口の対応品質向上や業務改革に！

詳細はこちら

お問い合わせ
Amazon Q Developer 内製化支援パッケージ

Amazon Q Developerを最大限に活用するための環境構築から、定着化支援までAmazon Q Developerの内製化をサポートします。

詳細はこちら

お問い合わせ

このコラムに関連する
導入事例

このコラムに関連する
セミナーアーカイブ動画

Amazon Q Developerをテーマに行う全4回のランチタイムセミナーです。

視聴する
はじめようAIエージェントシリーズでは、「AIエージェント」をテーマに基礎から応用まで解説します。

視聴する
本セミナーでは「Amazon Q Deveoper」のAIエージェント機能の概要、運用への導入例まで徹底解説

視聴する

注目のAIエージェント。本番活用を加速するAmazon Bedrock関連新サービス

そもそもAIエージェントとは何か？

AIエージェント活用の中核を担う「Amazon Bedrock AgentCore」

AIエージェントの“行動”を制御する「Amazon Bedrock AgentCore Policy」

AIエージェントの品質を評価する「Amazon Bedrock AgentCore Evaluations」

業務を「任せられる」AIエージェントが、いよいよ現実的に

カテゴリ

連載コラム

人気コラム

編集部おすすめコラム

このコラムに関連する製品

生成AI活用「社内FAQボット」

Amazon Q Developer 内製化支援パッケージ

関連コラム

このコラムに関連する
導入事例

このコラムに関連する
セミナーアーカイブ動画

注目のAIエージェント。本番活用を加速するAmazon Bedrock関連新サービス

そもそもAIエージェントとは何か？

AIエージェント活用の中核を担う「Amazon Bedrock AgentCore」

AIエージェントの“行動”を制御する「Amazon Bedrock AgentCore Policy」

AIエージェントの品質を評価する「Amazon Bedrock AgentCore Evaluations」

業務を「任せられる」AIエージェントが、いよいよ現実的に

カテゴリ

連載コラム

人気コラム

編集部おすすめコラム

このコラムに関連する製品

生成AI活用「社内FAQボット」

Amazon Q Developer 内製化支援パッケージ

関連コラム

このコラムに関連する導入事例

このコラムに関連するセミナーアーカイブ動画

このコラムに関連する
導入事例

このコラムに関連する
セミナーアーカイブ動画