運用自動化ツールで
実現していること
一次運用の
自動化
リソース情報の
出力
バックアップの
定期取得および複製
監視メトリクスの
強化
クラウドベンダー
からの
メール簡易解析
大規模障害の
対策
自社開発した
主な自動化ツール
AMS
(AdvancedMonitoringSystem)
監視業務の一次対応を自動化し、対応時間の短縮や対応レベルの均一化、対応ミスの防止を実現
クラウドの導入・運用におけるアイレットのフルマネージドサービス「cloudpack」では、24時間365日の有人監視を自社体制で実施しています。その監視業務の一次対応を自動化し、対応時間の短縮や対応レベルの均一化、対応ミスの防止を実現しているのが、AMSです。アラート発生時の動作確認や情報取得、復旧操作、二次対応担当者へのエスカレーションなどを自動化しており、現在は、AWSとGoogle Cloudに対応しています。
EC2-Connector
インシデント発生時に素早く確実にインスタンスに接続して操作が可能
AMS と連携してMSP作業者がインシデント発生時に素早く確実にインスタンスに接続して操作を行うためのサービスで、ブラウザ上で選択したインスタンスにSSM セッションマネージャーを利用してWebTerminal経由でShell操作を行う事ができます。
10分程度の短い時間の操作のサポートを目的としており、SSM セッションマネージャーで接続した後の入出力のRAWデータ(ANSIエスケープコードを含む)を記録しているので誰が何時どのような操作を行ったのかを後から確認することも可能です。
AWSアカウントと対象のリージョンを指定することで接続可能なインスタンスの情報を定期的に収集・蓄積するので適切な設定を行えば鍵管理や接続経路のWikiへの記載などが不要になります。
また、Private Subnet内のインスタンスであっても外部ネットワークに出る経路があればSSM セッションマネージャーで接続できるので構成によってはSSH接続用の踏み台(Bastion)インスタンスが不要になり運用コストを低減することができます。
Resource Visualizer
リソースの設定状況をBacklogのWikiに出力。意図せぬリソース変更の検知や変更履歴の追跡も可能。
お客様のAWS、または、Google Cloudアカウントのリソース設定状況を日次取得し、BacklogのWikiページに管理表を出力する構成管理ツールです。リソース設定に変更があった場合にWikiページを自動更新します。Backlogの「更新のメール通知」機能や履歴機能と組み合わせることで、意図せぬリソース変更の検知や変更履歴の追跡も可能です。
Backlog Wiki バックアップ
監視業務の運用手順書を定期的にboxに自動バックアップ
BacklogのWikiで管理している監視業務の運用手順書を、定期的にboxに自動バックアップしています。万が一、Backlogが参照できなくなった場合でも、運用が滞ることがないよう備えています。
Trusted Advisor Monitor
AWSのTrusted Advisorを監視して通知し緊急度の高い項目への対応漏れを防止
AWSのTrusted Advisorをチェックし、「Aciton reccomended」となっている項目をBacklogやAmazon SNSで通知します。平日毎日のチェックや通知項目の制御が可能で、緊急度の高い項目への対応漏れを防止します。
DirectConnectVIF監視
DirectConnectの仮想インタフェースの接続状態を24時間監視
DirectConnectの仮想インタフェースの接続状態(state)を24時間監視し、異常を検知した場合は、DirectConnect担当者にエスカレーションして、迅速に対応を実施します。
AWSサポート回答通知
AWSサポートからの回答を監視して申請の完了等を漏れなく迅速にお客様に連絡
AWSサポートに申請した緩和申請等について、AWSサポートからの回答を監視することで、申請の完了を漏れなく迅速にお客様に連絡します。
課題の監視
Backlog課題の更新を常時監視して課題やコメントへの対応遅れを防止
案件の課題を管理するBacklogやRedmineについて、課題の起票や担当者変更を常時監視してMSP担当者に通知することで課題やコメントへの対応遅れを防止します。
メンテナンスメールPD&Slack通知
AWSからのメンテナスメールを常時監視して通知し対応漏れを防止
AWSからのメンテナスメールを常時監視してMSP担当者に通知することで対応漏れを防止します。
警告メールの監視
AWSからの警告メールを常時監視して通知し迅速な対応を実施
AWSからの警告メールを常時監視してMSP担当者に通知することで、お客様へ連絡するなどの迅速な対応を実施します。
MSPカレンダー通知
カレンダーに登録されたMSP作業予定をSlackに通知しPagerDutyにも登録して対応漏れを防止
カレンダーに登録されたMSP作業予定をSlackに通知し、PagerDutyにも登録して対応漏れを防止します。また、PagerDutyに登録したインシデントのステータスをチェックし、未対応の場合はSlackで通知してリマインドします。