Claude API 529 Overloaded：overloaded_error を 429 と誤診しない直し方

Claude API が HTTP 529 と overloaded_error を返したら、まず Anthropic 側の容量不足として扱います。自分のアカウントが 429 の rate limit に当たったと決めつけないでください。最初に Claude Status を確認し、即時リトライのループを止め、並列数を下げ、上限付きの指数バックオフと jitter で再試行します。検証中は endpoint、model、workspace、key、proxy、client library を同時に変えず、request_id と時刻を残します。

レスポンスの手掛かり	主な原因	最初の動き	止めどころ
HTTP 529 + `overloaded_error`	Anthropic の容量逼迫	status 確認、遅い retry、新規処理を queue	retry 予算を使い切ったら証拠保存
HTTP 429 + `rate_limit_error`	組織や workspace の limit	rate-limit header を読む	reset または limit 状態の変化まで待つ
HTTP 500 / 504	server error または timeout	status と小さな同経路 request を確認	継続再現なら request evidence で相談
Claude Code の repeated 529	Claude Code が自動 retry 済み	status、待機、必要なら model 切替	quota 消費と断定しない

529 の扱いは狭く決めます。再試行は可能ですが、遅く、上限付きで、同時に負荷を下げる必要があります。密な loop、key の入れ替え、429 用の quota 修復は診断を悪化させます。

529 は容量不足の分岐であり、quota 分岐ではない

Anthropic の API error reference では、429 は rate limit、500 は内部 API error、504 は処理 timeout、529 は一時的な overload として分けられています。したがって最初の対応も違います。429 なら header、reset、workspace limit を読みます。529 なら status、同じ request path、制限付き retry、queue を優先します。

status ページは単なる緑か赤ではありません。2026-04-30T13:42:00+08:00 時点では public Statuspage API の Claude API component は operational でしたが、同日早朝と前日に related incident が記録されていました。容量問題では、全体表示が復旧済みでも、特定 model、route、wrapper、地域的な経路で短い 529 window が残ることがあります。

症状を早く消さないでください。response body、HTTP status、error type、request_id、model、endpoint、workspace、provider route、local timestamp を保存します。後で成功した時にも、その記録が「待ったから成功したのか」「concurrency を下げたからか」「payload を小さくしたからか」を示します。

最初の五分は request path を固定する

まず evidence を集めます。body と headers、request id、model、endpoint、workspace、provider route、input size、concurrency、timezone 付き timestamp を記録します。Claude Status を開き、Claude API、Claude Code、または model-specific incident を確認します。Zapier、Make、custom proxy、hosted agent が間にある場合は、その layer を別に記録します。

次に同じ path で小さな request を送ります。API key、organization、model、endpoint、client library は同じまま、prompt を短くし、output cap を下げます。小さい request が通り、production burst が落ちるなら、修復対象は traffic shaping です。小さい request も 529 なら、capacity または provider route pressure の可能性が高まります。

stop rule を決めます。foreground request は三から五回の backoff で十分です。batch job はより長く待てますが、worker を占有せず durable queue に戻すべきです。予算を使い切ったら、temporary capacity state を返し、job と evidence を残します。

retry は遅く、上限付きにする

529 が retryable という意味は、容量が戻れば同じ request が通る可能性がある、ということです。すぐ何度も送れば成功するという意味ではありません。retry policy は load を分散し、worker を守り、診断を保つ必要があります。

hljs ts
function classifyClaude(status: number, type?: string) {
  if (status === 529 || type === "overloaded_error") return "slow_retry";
  if (status === 429 || type === "rate_limit_error") return "wait_for_limit";
  if (status === 500 || status === 504) return "server_or_timeout";
  return "do_not_retry_blindly";
}

重要なのは ceiling です。UI request は数回で temporary failure を返せます。batch worker は next retry time と attempt count を持って queue に戻せます。streaming UI は model path が一時的に overloaded であることを示し、沈黙したまま待たせないようにします。

529 と 429 を同じ修復に入れないでください。rate limit docs では 429 に retry-after や rate-limit headers が出ることがあります。529 では account bucket の reset が主役ではないため、backoff policy と service state で制御します。

診断を壊さずに負荷を下げる

負荷削減は、比較対象を保つ時に有効です。worker concurrency を下げ、speculative fan-out を止め、新規 job を queue に入れ、context を短くし、SDK と wrapper の二重 retry を避けます。SDK が transient failure を自動 retry するなら、外側の retry はさらに厳しい上限を持つべきです。

長い処理は synchronous request に押し込まないでください。即時応答が不要なら queue や batch に移し、長い出力では streaming を使うと idle timeout との混同を減らせます。大きな共有 context を繰り返すなら prompt caching は account-side token pressure に役立ちますが、529 の消滅を保証するものではありません。

model switch は continuity tactic です。品質や出力特性の変化を許容できる場合だけ使います。元の model が必須なら、静かに別 model に変えるより、待って後で同じ path を retry する方が安全です。

escalation 前に同じ path で検証する

最もきれいな検証は same-path small-load test です。key、organization、workspace、endpoint、model、client library、proxy、network path を固定し、小さい request と低 concurrency の production shape を比較します。これで provider pressure、payload size、burst pattern、wrapper layer を切り分けられます。

overload log は通常ログと分けます。request id、status、error type、model、endpoint、workspace、provider route、attempt、delay、input token estimate、output cap、final disposition を残します。Anthropic docs は request id が support の調査に役立つと説明しています。request ids、timestamps、status snapshot、same-path reproduction がある相談は、単なる terminal screenshot より強いです。

継続的で広範囲に再現する時だけ escalation します。Zapier、Make、proxy だけが落ち、direct Anthropic call が通るなら中間層を先に見ます。direct small request も 529 で、status が clean なら request id と時間帯を添えて support に出します。active incident があるなら、証拠を残し、queue が回復を待つようにします。

Claude Code、gateway、automation platform

Claude Code は独自の surface behavior を持ちます。error reference では server errors、overloaded responses、timeouts、temporary throttles、dropped connections が表示前に自動 retry されると説明されています。terminal に repeated 529 が出る時点で、すでに複数回試した後です。次は status、待機、必要なら model switch であり、Console API quota が尽きたと結論づける段階ではありません。

gateway と automation product は別分岐を増やします。Zapier、Make、proxy、hosted agent は error を replay、delay、transform することがあります。upstream Anthropic status と wrapper status を分けてください。platform が generic failure しか出さないなら、元の HTTP status と Anthropic error type を記録する logging を追加します。

production では小さな state machine が安定します。classify error、check service status、retry with cap、reduce pressure、queue deferred work、preserve request evidence。この順序の方が、key 変更、即時 loop、無言の model downgrade より安全です。

Production checklist

Control	529 での意味	実装
Error classifier	529 と 429/500/504 を分ける	HTTP status と error type を見る
Capped jittered retry	retry storm を防ぐ	foreground と batch で予算を分ける
Concurrency limits	worker が同時に起きない	model、endpoint、route 別に cap
Durable queue	foreground を守る	next retry time と attempt を保存
Same-path probe	小さい request の可否を見る	key、workspace、model、route を固定
Request id logging	support evidence になる	body と header の id を保存
Status observation	incident と local pressure を分ける	checked time と component を記録

復旧後には短い postmortem も必要です。attempt、delay、concurrency、input size、output cap、status snapshot、final disposition を同じ event に残します。次に 529 が出た時、担当者は queue を維持するのか、backoff window を広げるのか、特定 model の concurrency を下げるのか、support evidence を出すのかをすぐ判断できます。複雑な監視でなくても、request_id で検索できる structured log は最低限必要です。

複数の retry layer も確認してください。frontend、API gateway、worker、SDK、message queue がそれぞれ retry すると、三回のつもりが数十回になります。capacity branch で最も危険なのはこの隠れた増幅です。retry owner を一箇所に固定し、ほかの layer は temporary capacity state を伝えるだけにすると、負荷も診断も安定します。

よくある質問

Claude API 529 は quota を消費しますか？

まず capacity branch として扱います。Claude Code reference は repeated 529 を usage limit とは分けています。direct API では Billing と Usage も別途確認しますが、overloaded_error に 429 の修復を当てないでください。

overloaded_error はすぐ retry してよいですか？

いいえ。backoff、jitter、ceiling が必要です。即時 retry は、サービスが減速を求めている時に負荷を増やします。

model switch は修復ですか？

継続作業のための手段です。別 model の品質を許容できる場合だけ使い、元 model が必要な処理では待って retry します。

support には何を送るべきですか？

request ids、timezone 付き timestamps、model、endpoint、workspace、provider route、status-page state、retry schedule、same-path small request の結果を送ります。