Private Preview PoCを相談する(15分)

運用で止めるための制御プレーン

制御不能なAIに、
ブレーキを。制御不能なAIに、ブレーキを。

GateはOpenAI互換APIの手前に置く逆プロキシ。observe→pause→stopを段階導入し、止めた理由はrequest_id起点で追えます。

  • 導入は最小変更:base_url差し替え + ヘッダ追加
  • 減速と停止を分離:PAUSE=429 + Retry-After / STOP=423(ラッチ)
  • 説明可能:request_id → Evidence で「なぜ止めたか」が追える
PAUSE=429 + Retry-After / STOP=423(ラッチ) request_id で理由が追える

複数の呼び出し元を一画面で俯瞰。異常だけを絞り込めます。

social@lunacast.io(メールでも相談可)

できること

いま何が起きているか、1画面で分かる

呼び出し元(クライアント/アプリ/サービス)ごとに、直近60秒の流量・失敗・予算・状態をまとめて表示。追跡せずに運用判断できる。

止め方が決まっている(減速と停止を分ける)

軽い混雑は PAUSE=429 + Retry-After で待たせる。危険な逸脱は STOP=423(ラッチ)で止める。

止めた理由が残る(request_id で追える)

request_id 起点で「何を」「なぜ」止めたかを記録。復旧判断と説明が1箇所で終わる。

どう動くか

Mode 実際の制御 返却 Evidence
observe_only 制御はしない(上流の応答をそのまま返却) パススルー 止めない。代わりに「止めるべきだったか」を記録。
pause_only 減速のみ。STOP条件は PAUSE にダウングレード 429 + Retry-After 止めずに“待たせる”。止めるべき理由も記録。
pause_and_stop 停止まで適用(逸脱はラッチ) PAUSE=429 / STOP=423(ラッチ) 止める。止めた理由と復旧の履歴が残る。

pause_only は「強制停止」せず、429で待たせます(後で再試行できます)。

複数の呼び出し元を一画面で俯瞰

推論/入力/出力など役割ごとにカードを並べ、どの呼び出し元が異常かを即座に特定します。

FlowMeter overview
呼び出し元別に OPEN/PAUSE/STOP を並列表示(実UI)

実UIの状態例(OPEN / PAUSE / STOP)

OPEN normal
OPEN(通常)通常通過。Gateは状況を観測します。
PAUSE 429 retry-after
PAUSE 429(減速)429 + Retry-After。少し待って再試行できます。
STOP 423 latch
STOP 423(ラッチ)423で停止。解除は運用操作のみ(安全のため)。理由はEvidenceに残ります。

request_id 起点で Evidence に辿れます。

このスクショは実UI(Ops UI)です

導入は最小変更(2行)

base_url = "https://gate.lunacast.io"
headers["X-Api-Key"] = "your_key"
headers["X-Agent-Id"] = "client-42"  # optional: client_id (agent_id)

ヘッダが難しければ「1キー=1呼び出し元」運用でも開始できます。

FAQ

影響は?

observe_only で開始し、ブロックせずに「止めるべき判断」を計測できます。

止まったら?

Evidence(request_id)で reason を確認し、必要なら allow-once で一時通過。恒久対応はモード/上限/ポリシーで調整します。

何を保存?

PoCでは request_id / client_id (agent_id) / decision / reason / mode など運用に必要な最小メタデータを保存します(詳細は Trust に記載)。

料金は?

PoC期間中はお問い合わせベースです。Pricing をご確認ください。

連絡先は?

social@lunacast.io

技術詳細は?

pause_only では「止める条件」も記録されます(Evidenceに would_stop として保存)。