クラウド 元SEママの情シスなりきりAWS奮闘記

障害の原因を自動で調査!AWSの運用管理も生成AIでラクしよう

2025年4月7日掲載

こんにちは、シイノキです。ここ数年いろいろ出ているオーディション番組、なんとなく遠巻きにしていたのに、ついうっかりハマってしまい、ファンクラブに入りそうな勢いです。

さて、今回のAWS re:Invent 2024レポートのテーマも生成AIではありますが、「生成AIを使った運用管理」にフォーカスしてお届けします。
生成AIも一般的な使い方としては、メールの下書きや議事録作成・要約、あとはイラスト生成などが取り上げられますが、システムの運用管理だとどんな使い方になるんでしょうか。

ここで活躍するのが、AWSの生成AIエージェント「Amazon Q」、なかでも開発者向けである「Amazon Q Developer」です。開発者向け、というだけあって、コード生成・レビュー、ドキュメント自動生成など開発支援系の機能がフォーカスされがちなのですが、運用管理でもかなり便利に使えそう、というわけで詳しく見ていきましょう!

障害が発生したら、自社環境を踏まえて自動で原因調査してくれる!

Amazon Q Developerのなかでも、運用に便利な機能としてAWS re:Invent 2024で発表されたのが「運用調査機能」です。ん?調査?そう、運用における「調査」を生成AIが手伝ってくれるよ、という機能です。

AWSのブログ(https://aws.amazon.com/jp/blogs/news/getting-started-with-amazon-q-developer-operational-investigations/)を見ると「生成AI技術の力を活用し、関連情報を浮き彫りにすることで、インシデントの迅速な調査と解決を支援します」とありますが、要するにインシデント=AWS上で障害やトラブルが発生したときに、生成AIが関連情報を調べて解決を手伝いますよ、ということ。特にこの関連情報というのがキーで、「一般論としてこういう原因が考えられますよ」ではなく、自社の環境や展開しているリソースの情報を踏まえて、調査してくれるのだとか。

これまでは、障害が発生し、なんらかのアラートが上がってきたとして、それをもとに自分でどこに原因がありそうかを考えながら、必要なログを参照して、さらにそこから影響していそうなポイントを探して、原因が分かったら対処方法を調べて考えて実施する、という流れでした。詳しい人ならばもしかしたらスムーズにいくのかもしれませんが、それでも結構時間がかかりそうです。ここを自動化してくれて、さらに問題解決のための次のアクションまで提示してくれるのだそう。調査結果とあわせて対処法としてのアクションが表示され、承認するか拒否するかを選ぶというイメージです。たとえば「インスタンスを再起動する」のようなアクションが提示されて、「再起動すれば大丈夫そうだな」と思えば承認する、という感じだと理解しました。これを使えば、障害が発生しても「承認」をポチっとひとつ押すだけで解決できるかもしれない、と。ちゃんと使いこなせればかなり理想ですよね。

ライトニングトークの様子

Amazon CloudWatchと連携して、さらに幅広い情報も参照

さらに、Amazon Q DeveloperはAmazon CloudWatchとも連携します。Amazon CloudWathと言えば監視系のサービスで、AWSの各種リソースからログまでまとめて監視できる、「AWS使うなら、まずはこれを使っておこう」となるサービスのひとつ。

Amazon Q DeveloperがAmazon CloudWatchと連携することで、Amazon CloudWatchのアラームをトリガーに障害調査・分析をスタートできるようになります。もちろんそれだけではなく、Amazon CloudWatchに集約している情報も調査対象になりますし、さらにAWSの操作ログなどを管理する「AWS CloudTrail」、AWSの障害情報を分析する「AWS Health」まで参照し、それぞれの関係性を分析して、調査結果に反映されます。

AWSに限った話ではないですが、障害は「どこか1カ所だけ見れば解決する」ものばかりではなく、横断的な調査が求められます。「自社のリソースについて一生懸命調べていたら、実はAWSの障害の影響でした」みたいなこともありそうですし、「AWSの障害をどこで調べるか」「それが自社システム・リソースにどう影響しているか」「本当に自社側では問題がないのか」を確認するとなるとかなり幅広い知識が求められます。

このあたりの効率化はもちろんですが、「障害が起きたときに、詳しい人がいないとどうにもならない」状況からの脱却、いわゆる属人化解消にも役立ちそうですし、運用のハードルが大きく下がりそうだと思いました。

「可観測性」が大きく強化され、セキュリティへの展開にも期待

障害なんて起きないにこしたことはないのですが、残念ながらシステム運用と障害対応は切っても切れないもの。この領域を生成AIで強力にアシストしてくれるというのは、かなり頼もしいなという印象でした。

きちんと監視して、なにか起きたときに迅速かつ的確に対処することが大事……とはいえ、この「迅速かつ的確」というのはかなりクセモノです。いろいろなところからログを参照して、原因を分析して……となると迅速さではAIにかなわないのでは?

今回は、運用管理という観点で紹介してきましたが、セキュリティについても同様で、「異常が起きていないか」「不審な挙動がないか」を横断的に監視して状況を把握することが重要であり、厄介。Amazon Q Developerのアップデートでは「Observability(可観測性)」(さまざまな情報を監視・分析して、状況を理解する力)がかなり強化されているので、これをセキュリティにも役立てるはず。ということで、AWSセキュリティコンピテンシーパートナーであるソニービズネットワークスでも、これを活かしたソリューションを出せないか検討していきたい、というお話でした。こちらも今後期待したいと思います。以上、シイノキでした!

お役立ち資料をダウンロード

マネージドクラウド with AWS_カタログ

「マネージドクラウド with AWS_カタログ」のダウンロードをご希望のお客様は、
以下必要事項をご入力ください。

関連コラム

このコラムに関連する製品

  • マネージドクラウド with AWS

    はじめてのAWSから
    一歩進んだ活用までトータルサポート

    詳細はこちら

  • AWS導入支援サービス

    リーズナブル&豊富なメニューで
    AWS導入をワンストップサポート

    詳細はこちら

  • AWS運用支援サービス

    手軽に運用できるツールから
    24時間365日有人監視まで3つのサービスで
    AWSの運用を支援

    詳細はこちら

  • AWS運用管理・自動化ツール「クラウドポータル」

    「はじめてでも運用できる」
    「もっと使いこなせる」
    独自開発ツール

    詳細はこちら

  • Windowsサーバー2012 AWS移行支援

    Windows Server 2012/2012Rは、2023年10月にサポート終了。この機会にAWS移行をご検討の方へ。
    はじめてのAWSの不安をクリアします!

    詳細はこちら

  • 運用内製化支援~セキュリティ改善サービス

    ベストプラクティスに沿った改善案を提案し、運用の内製化を支援します。


    詳細はこちら

  • DR対策ソリューション

    企業ごとの要件、ダウンタイム/データ損失の許容度にあわせて、AWSでのDR構成や環境構築をサポート

    詳細はこちら

  • 静的Webサイト構築パッケージ

    “サーバレス”で実現
    サーバ運用の負担が解消し、セキュリティ強化にも

    詳細はこちら

  • クラウドバックアップ付きファイルサーバ(NAS)構築パッケージ

    ファイルサーバのバックアップをクラウドに。
    NAS導入からAWSバックアップまでまとめてサポートします

    詳細はこちら

このコラムに関連する
導入事例

このコラムに関連する
セミナー・イベント

このコラムに関連する
セミナーアーカイブ動画

AWS運用管理/自動化ツール「クラウドポータル」活用セミナー 第3回 ~セキュリティ管理ー前編~

SHARE
シェアシェア ポストポスト
AWS運用管理/自動化ツール「クラウドポータル」活用セミナー 第3回 ~セキュリティ管理ー前編~
SHARE
ポスト シェア