AIリテラシー 可用性(Availability)

カテゴリ: 品質指標・評価基準

可用性(Availability)とは

可用性とは、認可されたユーザーが、必要な時にいつでも情報システムやサービスにアクセスし利用できる能力のことです。SLA(サービスレベル契約)の文脈では、一般的に「稼働率(Uptime Percentage)」として定義され、例えば「月間稼働率99.9%(ダウンタイム約43分以内)」といった数値目標が設定されます。

AIエージェントの場合、可用性は単に「サーバーが落ちていない」こと以上の意味を持ちます。核となるLLM API(OpenAIやAzureなど)の応答遅延、レート制限(Rate Limit)への到達、またはハルシネーションによる機能不全状態も含めて、ユーザーから見て「サービスとして機能しているか」が問われます。

AI特有の「レジリエンス」維持

監査においては、外部APIへの依存度が高いAIエージェントが、障害発生時にどのような挙動をするか(回復弾力性)を検証します。

  • リトライ処理とバックオフ: 一時的なAPIエラーに対して、適切な間隔を空けて再試行するロジックが組み込まれているか。
  • モデルのフォールバック: プライマリ(例: GPT-4)がダウンした場合、セカンダリ(例: GPT-3.5やClaude)に自動的に切り替えて最低限の機能を維持できるか。
  • グレースフル・デグラデーション: AIが全停止しても、ルールベースのチャットボットや有人対応フォームに誘導するなど、サービスを完全に遮断しない設計になっているか。

実務での課題と対策

最も厄介なのは「サイレント障害」です。API自体は正常に応答している(HTTP 200 OK)ものの、生成される内容が無意味な文字列や空の回答であるケースです。これを検知するため、単純なPing監視だけでなく、定期的にテストプロンプトを送信し、回答内容の品質を簡易チェックする「シンセティック監視(外形監視)」の実装が推奨されます。

[PR] 【固定IPが月額490円から】ロリポップ!固定IPアクセス

失敗例・トラブル事例

  • レート制限によるサービス停止: ユーザー数が急増した際、LLMプロバイダーのトークン制限(RPM/TPM)に達してしまい、すべてのリクエストがエラー(429 Too Many Requests)となりました。クォータ管理と、ユーザーごとの利用制限(スロットリング)機能の実装漏れが原因です。
  • 単一障害点(SPOF)の放置: 特定のモデルAPIに全面的に依存していたため、そのプロバイダーの大規模障害時にサービスが半日間完全に停止しました。マルチモデル対応をしておけば回避できたダウンタイムでした。

関連リンク

関連キーワード

可用性 SLA レジリエンス フォールバック レート制限 外形監視