AI Troubleshooting6 min

Claude API 529 Overloaded: как чинить overloaded_error без ошибки 429

Практический runbook для Claude API 529: статус, отличие overloaded_error от 429, retry с потолком и jitter, снижение давления и escalation с request_id.

AI API Team
AI API Team
YingTu Editorial
30 апр. 2026 г.
6 min
Claude API 529 Overloaded: как чинить overloaded_error без ошибки 429
yingtu.ai

Содержание

Заголовки не найдены

Если Claude API возвращает HTTP 529 с типом overloaded_error, сначала считайте это веткой перегрузки Anthropic, а не вашим лимитом 429. Откройте Claude Status, остановите плотный цикл повторов, уменьшите параллельные вызовы и повторяйте запрос только с ограниченным экспоненциальным backoff и jitter. Во время проверки не меняйте одновременно endpoint, модель, workspace, ключ, прокси и библиотеку клиента; иначе владелец сбоя станет неразличимым.

Сигнал ответаВероятный владелецПервое действиеКогда остановиться
HTTP 529 + overloaded_errorЕмкость AnthropicПроверить статус, замедлить повторы, поставить новую работу в очередьПосле исчерпания бюджета повторов
HTTP 429 + rate_limit_errorЛимит вашей организации или workspaceЧитать headers лимитов и снижать давлениеДо reset или изменения лимита
HTTP 500 или 504Внутренняя ошибка или timeout обработкиПроверить статус, отправить малый контрольный запросЭскалировать при устойчивом повторении
Claude Code показывает repeated 529Claude Code уже выполнил автоматические повторыПроверить статус, подождать, временно сменить модельНе считать это расходом quota

Правило ремонта узкое: 529 можно повторять, но медленно, с потолком и снижением давления. Немедленный цикл, ротация ключей или сценарий для 429 обычно ухудшают диагностику.

529 является веткой перегрузки, а не веткой quota

В справочнике ошибок Anthropic ветка 529 отделена от лимитов организации. 429 означает rate limit, 500 означает внутреннюю ошибку API, 504 означает timeout, а 529 означает временную перегрузку API. Поэтому первый шаг другой. Для 429 нужно читать лимитные headers и ждать reset. Для 529 нужно проверить состояние сервиса, удержать один стабильный путь запроса и ограничить повторные попытки.

Статусная страница важна не только как красный или зеленый индикатор. На 2026-04-30T13:42:00+08:00 публичный Statuspage API показывал компонент Claude API как operational, но в истории того же дня и предыдущего дня были инциденты. Для перегрузки это нормальная картина: общий компонент может уже восстановиться, а конкретная модель, региональный путь, gateway или автоматизация могут еще давать короткие окна 529.

Сохраните полный response body, HTTP status, error type, request_id, модель, endpoint, workspace, маршрут провайдера и локальное время. Если позже запрос пройдет, эти данные покажут, что помогло: ожидание, снижение concurrency, меньший payload или смена маршрута.

Первые пять минут: стабилизируйте путь запроса

Пяти минутная диагностика Claude API 529

Начните с фактов. Скопируйте тело ответа и headers, запишите request id, модель, endpoint, workspace, provider route, размер входа, уровень concurrency и timestamp с timezone. Откройте Claude Status и проверьте, затронут ли Claude API, Claude Code или отдельная модель. Если между вашим приложением и Anthropic есть Zapier, Make, прокси или hosted agent, зафиксируйте этот слой отдельно.

Затем отправьте маленький запрос по тому же пути. Оставьте тот же API key, organization, модель, endpoint и client library. Уменьшите prompt до короткого известного запроса и ограничьте max output. Если малый запрос проходит, а production burst падает, ремонт находится в shaping трафика. Если малый запрос тоже возвращает 529, больше похоже на емкость или давление маршрута.

Нужен stop rule. Для foreground запроса обычно достаточно трех-пяти попыток с backoff и jitter. Для batch работы можно ждать дольше, но job должен вернуться в durable queue, а не занимать worker и продолжать бить endpoint. После бюджета повторов покажите временное состояние capacity и сохраните evidence.

Повторяйте медленно и с жестким потолком

529 retryable только в том смысле, что тот же запрос может пройти после восстановления емкости. Это не приглашение делать больше немедленных попыток. Политика должна распределять нагрузку, защищать worker и не скрывать owner ошибки.

hljs ts
function classifyClaude(status: number, type?: string) {
  if (status === 529 || type === "overloaded_error") return "slow_retry";
  if (status === 429 || type === "rate_limit_error") return "wait_for_limit";
  if (status === 500 || status === 504) return "server_or_timeout";
  return "do_not_retry_blindly";
}

Главное — потолок. Пользовательский запрос может сделать несколько попыток и вернуть временную ошибку. Batch worker может сохранить job, next retry time и attempt count. Streaming UI должен сказать, что путь модели временно перегружен, а не зависать без объяснения.

Не смешивайте 529 с ремонтом 429. Документация по rate limits говорит, что 429 может иметь retry-after и rate-limit headers. При 529 reset вашего аккаунта обычно не является главным сигналом; расписание строится на вашем backoff и состоянии сервиса.

Снижайте давление без потери диагностики

Контроли давления для Claude API 529

Снижение давления полезно только тогда, когда оно не ломает эксперимент. Уменьшите worker concurrency, отключите speculative fan-out, поставьте новые задачи в очередь, сократите context и убедитесь, что SDK и внешний wrapper не создают два агрессивных retry слоя. Если SDK уже повторяет transient failures, внешний код должен иметь еще более строгий предел.

Для долгих задач используйте streaming или asynchronous queue. Streaming снижает путаницу с idle timeout, а очередь не дает короткому capacity spike остановить все foreground запросы. Prompt caching помогает с account-side token pressure и burst behavior, особенно для 429, но не гарантирует исчезновение 529.

Смена модели — это continuity tactic. Она допустима, когда product contract разрешает другой уровень качества. Если ответ обязан прийти от исходной модели, правильнее ждать и повторить позже, чем незаметно менять модель и выдавать другой результат.

Перед эскалацией проверьте тот же путь

Самая чистая проверка — same-path small-load test. Оставьте key, organization, workspace, endpoint, model, client library, proxy и network path неизменными. Сначала отправьте маленький запрос, затем production форму с меньшей concurrency. Пара результатов отделяет provider pressure от размера запроса, burst pattern и wrapper layer.

Ведите отдельный overload log. В нем должны быть request id, status, error type, model, endpoint, workspace, provider route, attempt, delay, input token estimate, output cap и final disposition. В документации Anthropic request id указан как полезный идентификатор для поддержки. Эскалация с request ids, timestamps, status snapshot и same-path reproduction намного сильнее, чем общий скриншот ошибки.

Эскалируйте при устойчивом, широком и воспроизводимом симптоме. Если падает только Zapier, Make или proxy, а прямой вызов проходит, начинайте с этой платформы. Если прямые маленькие запросы тоже получают 529 при чистой статусной странице, отправляйте support evidence. Если есть активный инцидент, сохраняйте доказательства и дайте очереди дождаться восстановления.

Claude Code, gateways и automation platforms

Разделение API, Claude Code и wrapper

Claude Code имеет собственное поведение. Его reference говорит, что server errors, overloaded responses, timeouts, temporary throttles и dropped connections автоматически повторяются до показа ошибки. Поэтому repeated 529 в терминале уже прошел несколько попыток. Следующий шаг — status, ожидание или временная смена модели для продолжения работы, а не вывод о том, что исчерпан Console quota.

Gateway и automation продукты добавляют новую ветку. Zapier, Make, proxy или hosted agent могут replay, delay или transform error. Разделяйте upstream Anthropic status и wrapper status. Если платформа показывает только generic failure, добавьте logging исходного HTTP status и Anthropic error type. Без этого 529, 429, timeout и wrapper quota выглядят одинаково.

Устойчивый production pattern — небольшая state machine: classify error, check service status, retry with cap, reduce pressure, queue deferred work, preserve request evidence. Это надежнее, чем менять ключи, сразу крутить loop или молча снижать качество модели.

Production checklist

КонтрольЗачем при 529Реализация
Error classifierНе смешивает 529, 429, 500 и 504Проверять HTTP status и error type
Capped jittered retryНе создает retry stormРазные бюджеты для foreground и batch
Concurrency limitsWorker не просыпаются одновременноЛимит по model, endpoint и provider route
Durable queueЗащищает пользовательский путьХранить next retry time и attempt
Same-path probeПоказывает, проходит ли малый запросНе менять key, workspace, model и route
Request id loggingДелает support actionableСохранять body field и header
Status observationОтделяет incident от local pressureЗаписывать checked time и component

Часто задаваемые вопросы

Claude API 529 расходует quota?

Сначала обрабатывайте 529 как capacity branch, а не как quota branch. Claude Code reference прямо отделяет repeated 529 от пользовательского usage limit. Для direct API все равно проверяйте Billing и Usage отдельно, но не применяйте 429 playbook к overloaded_error.

Можно ли сразу повторить overloaded_error?

Нет. Нужны backoff, jitter и жесткий ceiling. Немедленные повторы увеличивают нагрузку именно в тот момент, когда сервис просит клиентов замедлиться.

Смена модели является исправлением?

Это способ продолжить работу. Он подходит только там, где допустим другой model quality. Если требуется исходная модель, ждите и повторяйте позже.

Какие данные нужны support?

Request ids, timestamps с timezone, model, endpoint, workspace, provider route, status-page state, retry schedule и результат одного маленького same-path запроса.

Теги

Поделиться статьей

XTelegram