Генерация изображений ИИ25 min

Устранение неполадок Nano Banana Pro: исправление всех кодов ошибок с проверенными решениями (2026)

Полное руководство по исправлению ошибок Nano Banana Pro, включая ограничения скорости 429, серверные ошибки 500/502, блокировки IMAGE_SAFETY, пустые выходные данные и сбои API. Готовый к продакшену код на Python и стратегии предотвращения.

AI Free API Team
AI Free API Team

Ошибки Nano Banana Pro обычно делятся на пять категорий: ограничения скорости (ошибка 429, затрагивающая примерно 70% пользователей), серверные ошибки (500/502), блокировки фильтров безопасности (IMAGE_SAFETY), пустые выходные данные и проблемы с доступом. Большинство ошибок 429 разрешаются в течение 60 секунд ожиданием сброса лимитов RPM, тогда как ошибки IMAGE_SAFETY требуют различения между фильтрами Layer 1 (настраиваемыми) и Layer 2 (требующими промпт-инженерии). Этот комплексный центр устранения неполадок охватывает каждый код ошибки, с которым вы столкнётесь, с готовым к продакшену кодом на Python и стратегиями предотвращения, которых нет ни в одном другом руководстве.

Таблица быстрого исправления — найдите свою ошибку за 10 секунд

Диаграмма распределения ошибок Nano Banana Pro, показывающая, что ошибки 429 составляют 70 процентов всех сбоев

Когда генерация изображений в Nano Banana Pro прерывается в середине проекта, меньше всего хочется читать тысячи слов, прежде чем найти решение. Приведённая ниже таблица поиска ошибок сопоставляет каждый распространённый код ошибки с его значением и 60-секундным решением, чтобы вы могли как можно быстрее вернуться к генерации изображений. Каждый тип ошибки ссылается на подробный раздел далее в этом руководстве для пользователей, которым требуется более глубокое понимание.

Код ошибкиЗначение60-секундное исправлениеПодробнее
429 RESOURCE_EXHAUSTEDДостигнут лимит скорости (RPM, RPD или TPM)Подождите 60 секунд и повторите попыткуПодробно об ошибке 429
500 Internal Server ErrorСбой сервера GoogleПовторите через 30 секунд с экспоненциальной задержкойСерверные ошибки
502 Bad GatewayПерегрузка инфраструктуры GoogleПодождите 2-5 минут и попробуйте сноваСерверные ошибки
403 ForbiddenНедействительный API-ключ или отсутствие правПроверьте API-ключ и статус биллингаОшибки API
IMAGE_SAFETYСработал фильтр контентаПроверьте диагностику Layer 1 vs Layer 2Руководство по IMAGE_SAFETY
Пустой выводГенерация завершилась, но вернула пустой результатУпростите промпт, снизьте сложностьИсправление пустого вывода
ТаймаутЗапрос занял слишком много времениУменьшите разрешение или упростите сценуИсправление таймаута
400 Bad RequestНекорректный запросПроверьте формат промпта и параметрыОшибки API

Распределение ошибок среди пользователей Nano Banana Pro следует чёткой закономерности, которая показывает, на чём следует сосредоточить усилия по устранению неполадок. Ошибка 429 (RESOURCE_EXHAUSTED) составляет примерно 70% всех зарегистрированных проблем, что делает её доминирующим режимом отказа с большим отрывом. Серверные ошибки (500 и 502 вместе) представляют около 15% сбоев и полностью находятся вне вашего контроля, поскольку исходят от инфраструктуры Google. Ошибки аутентификации (403) составляют примерно 8%, а оставшиеся ошибки — включая блокировки IMAGE_SAFETY, пустые выходные данные и таймауты — в совокупности занимают около 7% зарегистрированных проблем. Понимание этого распределения помогает расставить приоритеты при чтении разделов: если вы сталкиваетесь с периодическими сбоями, ошибка 429 почти наверняка является причиной.

Ошибка 429 — превышение лимита скорости (ошибка номер один)

Ошибка 429 RESOURCE_EXHAUSTED является самой распространённой проблемой, с которой сталкиваются пользователи Nano Banana Pro, и понимание трёхмерной системы ограничения скорости необходимо как для исправления, так и для предотвращения этой ошибки. В отличие от более простых API, которые ограничивают только количество запросов в минуту, API Gemini от Google применяет ограничения по трём одновременным измерениям: RPM (запросы в минуту), RPD (запросы в день) и TPM (токены в минуту). Превышение любого отдельного измерения вызывает ошибку 429, а это значит, что вы можете столкнуться с лимитом, даже если считаете, что остаётесь в рамках квоты по двум другим измерениям.

Лимиты скорости существенно различаются между бесплатным и платными тарифами, что является основной причиной разочарования многих пользователей. В следующей таблице показана полная структура тарифов по состоянию на февраль 2026 года, проверенная по официальной документации Google AI (ai.google.dev/rate-limits, февраль 2026):

ТарифТребованиеRPMRPDTPM
БесплатныйПользователи в поддерживаемых регионах5-1010015 000
Tier 1Привязан платёжный аккаунтДо 30010 000100 000
Tier 2Общие расходы $250+, 30+ днейВышеВышеВыше
Tier 3Общие расходы $1 000+, 30+ днейМаксимальныеМаксимальныеМаксимальные

Пользователи бесплатного тарифа могут генерировать не более 100 изображений в день и не более примерно 10 в минуту — для тех, кто создаёт приложение или выполняет пакетную обработку, эти лимиты крайне ограничительны. Пользователи Tier 1 получают увеличение лимитов до 300 RPM и 10 000 RPD, что представляет собой 30-кратное увеличение поминутной ёмкости и 100-кратное увеличение дневной ёмкости. Для достижения Tier 2 или Tier 3 требуется не только потратить пороговую сумму, но и подождать 30 дней с момента первого платежа, а значит, нельзя просто заплатить $1 000 авансом, чтобы немедленно получить доступ к лимитам Tier 3. Приложение Gemini (в отличие от API) имеет собственные отдельные лимиты, привязанные к уровню подписки: бесплатные аккаунты получают примерно 2 изображения в день, подписчики Pro ($19,99/месяц) получают около 100 в день, а подписчики Ultra ($99,99/месяц) могут генерировать до 1 000 в день в более высоком разрешении.

Самое эффективное немедленное исправление ошибки 429 — просто подождать. Лимиты RPM сбрасываются каждые 60 секунд, поэтому пауза в одну минуту перед повторной попыткой устранит большинство ошибок ограничения скорости. Лимиты RPD сбрасываются в полночь по тихоокеанскому времени, поэтому если вы исчерпали дневную квоту, придётся подождать до следующего дня. Для более надёжного решения, особенно в рабочих приложениях, следует реализовать экспоненциальную задержку с джиттером. Следующий код на Python предоставляет готовый к продакшену механизм повторных попыток, который обрабатывает все три измерения. Подробное руководство по исправлению ошибок Gemini 429 можно найти в нашей специализированной статье, которая охватывает крайние случаи и продвинутые стратегии.

hljs python
import time
import random
import google.generativeai as genai

def generate_with_retry(prompt, max_retries=5, base_delay=2):
    """Generate image with exponential backoff and jitter."""
    for attempt in range(max_retries):
        try:
            model = genai.GenerativeModel("gemini-2.0-flash-exp")
            response = model.generate_content(prompt)
            return response
        except Exception as e:
            if "429" in str(e) or "RESOURCE_EXHAUSTED" in str(e):
                delay = base_delay * (2 ** attempt) + random.uniform(0, 1)
                print(f"Rate limited. Waiting {delay:.1f}s (attempt {attempt + 1}/{max_retries})")
                time.sleep(delay)
            else:
                raise e
    raise Exception(f"Failed after {max_retries} retries")

Помимо повторных попыток, существует несколько стратегических вариантов для борьбы с постоянными ошибками 429. Повышение тарифа — самый прямолинейный путь: привязка платёжного аккаунта сразу разблокирует лимиты Tier 1, которые в 30 раз выше по RPM и в 100 раз выше по RPD, чем у бесплатного тарифа. Если бюджет позволяет, достижение Tier 2 или Tier 3 устраняет ограничение скорости как практическую проблему для большинства сценариев использования. В качестве альтернативы можно использовать пакетную обработку через конечные точки пакетного API Gemini, которые обрабатывают запросы асинхронно по значительно сниженным тарифам. Для пользователей, которым нужен надёжный высокообъёмный доступ без управления тарифами и квотами, сторонние API-провайдеры, такие как laozhang.ai, предлагают доступ к Nano Banana Pro примерно за $0,05 за изображение без ограничений скорости, что примерно на 60% дешевле официальной стоимости $0,134 за изображение в разрешении 1K/2K (ai.google.dev/pricing, февраль 2026). Подробный обзор лимитов скорости Gemini API можно найти в нашем детальном руководстве, охватывающем все тарифы и измерения.

Ошибки 500 и 502 — серверные сбои

Серверные ошибки 500 и 502 исходят от инфраструктуры Google, а не из вашего кода или промпта, что делает их одновременно раздражающими и простыми в обработке. Ошибка 500 Internal Server Error указывает на то, что сервер Google столкнулся с непредвиденным условием при обработке вашего запроса, тогда как 502 Bad Gateway означает, что сервер, выступающий в роли шлюза, получил недействительный ответ от вышестоящего сервера. Обе ошибки являются симптомами одной и той же основной проблемы: инфраструктура Gemini от Google испытывает нагрузку, проходит техническое обслуживание или имеет временные сбои, которые не позволяют успешно завершить ваш запрос.

Эти ошибки, как правило, группируются в периоды высокого спроса. Во время праздничного сезона в декабре 2025 года наблюдался особенно резкий всплеск: по отчётам сообщества, использование увеличилось на 340%, что перегрузило инфраструктуру Google и вызвало массовые ошибки 502 примерно на две недели. Корпоративные пользователи Vertex AI столкнулись с отдельным инцидентом в начале января 2026 года, когда конечная точка Vertex AI возвращала устойчивые ошибки 429 и 502, которые Google признал и частично устранил с помощью исправления, выпущенного 8 января 2026 года. Ключевой вывод заключается в том, что серверные ошибки по своей природе временны — они разрешатся сами по мере того, как Google масштабирует мощности или завершит обслуживание, а ваш код должен быть рассчитан на их корректную обработку через логику повторных попыток.

Правильная реакция на серверные ошибки — это стратегия повторных попыток, которая учитывает как ваше время, так и инфраструктуру Google. В отличие от ошибок 429, где причина известна — ограничение скорости, серверные ошибки могут разрешиться за секунды или сохраняться часами. Хорошая стратегия повторных попыток использует экспоненциальную задержку, начиная с 30 секунд и удваивая при каждой попытке до максимальной задержки в 5 минут, с общим бюджетом в 3-5 попыток перед переходом к альтернативному варианту. Если попытки исчерпаны, ваше приложение должно иметь запасной путь — либо поставить запрос в очередь на потом, уведомить пользователя о временной недоступности, либо перенаправить запрос через альтернативную конечную точку. Для производственных систем реализация паттерна «автоматический выключатель» (circuit breaker), который временно прекращает отправку запросов после обнаружения нескольких последовательных серверных ошибок, предотвратит вклад вашего приложения в перегрузку и автоматически восстановится, когда проблема будет устранена.

Важное различие, которое помогает сформировать ожидания, — это разница между ошибками 500 и 502 с точки зрения времени восстановления. Ошибка 500 обычно указывает на конкретный сбой обработки запроса, который может быть устранён простым повторением того же запроса — проблема была временной и локализованной для вашего конкретного запроса. Ошибка 502, напротив, свидетельствует о более широкой проблеме инфраструктуры, когда вышестоящие серверы недоступны, и восстановление может занять больше времени. Во время праздничного кризиса декабря 2025 года ошибки 502 сохранялись для многих пользователей до двух недель, пока Google работал над масштабированием мощностей. Если вы наблюдаете устойчивые ошибки 502 при различных промптах и API-ключах, проблема почти наверняка на стороне Google, и наиболее продуктивным действием будет мониторинг панели состояния Google Cloud Status Dashboard для получения обновлений, а не многократные повторные попытки, которые расходуют вашу квоту лимита скорости на неудачные запросы.

IMAGE_SAFETY — почему ваш промпт блокируется

Диагностическая блок-схема IMAGE_SAFETY, показывающая различия между фильтрами Layer 1 и Layer 2 и соответствующие способы исправления

Ошибка IMAGE_SAFETY, пожалуй, является самой запутанной ошибкой, с которой сталкиваются пользователи Nano Banana Pro, поскольку она охватывает два принципиально разных механизма фильтрации, требующих совершенно разных решений. Понимание различия между фильтрами Layer 1 и Layer 2 является ключом к эффективному устранению блокировок IMAGE_SAFETY, и этот раздел предоставляет наиболее чёткую диагностическую схему из доступных. Ещё более подробное пошаговое руководство можно найти в нашей статье об исправлении ошибок блокировки политик в Nano Banana Pro.

Фильтры Layer 1 — это входные фильтры безопасности контента, которые проверяют текст вашего промпта до начала генерации. Эти фильтры проверяют категории, включая HARASSMENT, HATE_SPEECH, SEXUALLY_EXPLICIT и DANGEROUS_CONTENT. Критическое различие заключается в том, что фильтры Layer 1 настраиваются через API с помощью параметров безопасности. Установив порог BLOCK_NONE для соответствующих категорий, вы можете фактически отключить фильтрацию Layer 1 для своих запросов. Когда срабатывает фильтр Layer 1, ответ API покажет finishReason со значением SAFETY — это ваш диагностический сигнал, что вы имеете дело с настраиваемым фильтром.

Фильтры Layer 2 — это выходные фильтры безопасности изображений, которые проверяют сгенерированное изображение, а не ваш промпт. Эти фильтры проверяют IMAGE_SAFETY, PROHIBITED_CONTENT, CSAM и SPII (конфиденциальная персональная информация). Фильтры Layer 2 не настраиваются — их нельзя отключить или изменить через какой-либо параметр API. Когда срабатывает фильтр Layer 2, finishReason покажет именно IMAGE_SAFETY. Единственный способ обойти блокировки Layer 2 — это промпт-инженерия: переформулирование промпта, чтобы избежать генерации контента, вызывающего срабатывание выходного фильтра.

Процесс диагностики прост, если вы понимаете это различие. Сначала проверьте ответ API на наличие поля finishReason. Если там указано SAFETY, у вас проблема Layer 1 — настройте параметры безопасности на BLOCK_NONE и повторите попытку. Если указано IMAGE_SAFETY, у вас проблема Layer 2 — вам нужно перефразировать промпт. Для пользователей приложения Gemini, у которых нет доступа к ответу API, хорошая эвристика — оценить, выглядит ли сам промпт безобидным: если ваш промпт описывает полностью безопасную сцену, но генерация всё равно завершается неудачей, вы, скорее всего, натыкаетесь на Layer 2 после того, как изображение было частично сгенерировано.

Google ужесточил политики IMAGE_SAFETY в январе 2026 года, что увеличило частоту ложных срабатываний, особенно для сценариев использования в электронной коммерции. Розничные продавцы модной одежды и бренды сообщили, что изображения товаров с нижним бельём, купальниками или облегающей одеждой теперь чаще вызывают блокировки IMAGE_SAFETY, чем до изменения политики. Для продавцов электронной коммерции, сталкивающихся с этими блокировками, эффективные стратегии промпт-инженерии включают явное указание «fashion catalog photography» (фотография для модного каталога), «professional product photography» (профессиональная предметная фотография) и «retail merchandise display» (витрина розничного товара) в промптах. Добавление контекста о коммерческом характере изображения — например, «for an online store listing» (для карточки товара в интернет-магазине) или «product catalog shot on white background» (снимок для каталога продукции на белом фоне) — может помочь модели понять легитимное намерение и снизить количество ложных срабатываний. Когда одна промпт-инженерия не помогает, рассмотрите возможность использования альтернативных моделей генерации изображений для деликатных категорий товаров, либо генерируйте базовое изображение с помощью Nano Banana Pro и отдельно редактируйте проблемные области.

Пустой вывод и ошибки таймаута

Пустой вывод и ошибки таймаута представляют собой «тихие сбои» Nano Banana Pro — ваш запрос, кажется, завершается успешно (или, по крайней мере, не возвращает явный код ошибки), но вы получаете либо пустой ответ, либо запрос зависает до истечения времени ожидания. Эти проблемы особенно раздражают, потому что нет сообщения об ошибке, которое направило бы ваше устранение неполадок, а коренные причины варьируются от чрезмерно сложных промптов до проблем с инфраструктурой, пересекающихся с серверными ошибками.

Пустой вывод чаще всего возникает, когда модель пытается сгенерировать изображение, но сталкивается с внутренней проблемой во время процесса рендеринга, которая не позволяет ей создать валидный результат. Наиболее частый триггер — сложность промпта: когда промпт содержит слишком много одновременных требований — несколько объектов, конкретный текстовый рендеринг, точные пространственные соотношения и детализированную стилизацию — модель может «молча» завершиться неудачей, вместо того чтобы выдать результат низкого качества. Решение — систематическое упрощение промпта. Начните с удаления второстепенных требований из промпта и тестируйте только с основным объектом и действием. Если упрощённый промпт генерируется успешно, добавляйте требования обратно по одному, чтобы определить, какой элемент вызывает пустой вывод. Такой подход бинарного поиска гораздо эффективнее, чем многократные попытки вариаций полного промпта.

Ошибки таймаута возникают, когда процесс генерации изображения превышает максимально допустимое время, которое варьируется в зависимости от конечной точки и конфигурации. Стандартный таймаут Gemini API обычно составляет 60 секунд для синхронных запросов, и увеличение этого таймаута на стороне клиента не поможет, если сама серверная обработка занимает слишком много времени. Запросы в высоком разрешении (особенно 4K-выходы по $0,24 за изображение) более подвержены таймаутам, поскольку требуют больше вычислительных ресурсов и времени обработки. Примечательный инцидент в январе 2026 года вызвал массовые сбои таймаутов специально для API-запросов в разрешении 4K, затронувший пользователей как Google AI Studio, так и конечных точек Vertex AI.

Если вы сталкиваетесь с таймаутами при высокоразрешённых выходных данных, наиболее эффективный диагностический подход — сначала снизить разрешение до 2K ($0,134 за изображение), чтобы подтвердить, что проблема связана именно с разрешением. Если тот же промпт успешно выполняется при 2K, но не при 4K, реализуйте асинхронную обработку для запросов 4K, где таймауты менее критичны, поскольку запрос обрабатывается в фоновом режиме, и вы опрашиваете результаты, а не ждёте синхронно. Для сложных сцен, которые завершаются таймаутом даже при более низких разрешениях, хорошо работает техника пошаговой генерации: разбейте сцену на более простые компоненты, сначала сгенерировав фон, а затем добавляя элементы переднего плана отдельными запросами. Этот подход не только избегает таймаутов, но часто даёт лучшие результаты, потому что каждая генерация может сосредоточиться на качественном рендеринге одного элемента, а не на компромиссах между множеством одновременных требований. Тестирование сообщества показало, что промпты с более чем тремя различными объектами в одной сцене значительно чаще приводят к пустым выходным данным или таймаутам, чем промпты, сфокусированные на одном основном объекте с поддерживающим контекстом.

Nano Banana Pro не отображается в Gemini

Одной из наиболее распространённых проблем, не связанных с ошибками, является просто невозможность найти или получить доступ к Nano Banana Pro. Пользователи, ищущие «Nano Banana Pro не отображается» или «Nano Banana Pro недоступен», сталкиваются с этой проблемой по трём основным причинам: ограничения аккаунта Workspace, региональные ограничения и неправильный выбор модели. У каждой причины свой путь решения, поэтому определение того, какая из них относится к вашей ситуации, — первый шаг.

Аккаунты Google Workspace (ранее G Suite) не имеют автоматического доступа ко всем функциям Gemini. Если вы вошли в Chrome или приложение Gemini с аккаунтом Workspace, управляемым вашей организацией, ваш администратор может не включить расширенные функции Gemini или возможности генерации изображений. Для исправления требуется, чтобы администратор Workspace включил соответствующие функции Gemini в консоли администратора Google в разделе «Приложения > Дополнительные сервисы Google > Gemini». Отдельные пользователи не могут переопределить это ограничение; вам необходимо запросить доступ через ваш ИТ-отдел или переключиться на личный аккаунт Google для тестирования.

Региональные ограничения также ограничивают доступ к Nano Banana Pro. Хотя Google значительно расширил доступность в течение 2025 года и начала 2026 года, в некоторых регионах по-прежнему нет полного доступа к функциям генерации изображений в приложении Gemini. Если вы находитесь в регионе, где Nano Banana Pro недоступен через интерфейс приложения Gemini, вы всё равно можете получить к нему доступ через API с помощью Google AI Studio (ai.google.dev) или Vertex AI, которые имеют более широкую региональную доступность. Использование VPN для доступа к приложению Gemini нарушает условия обслуживания Google и может привести к ограничениям аккаунта.

Для пользователей API, которые не могут найти Nano Banana Pro, проблема обычно заключается в выборе модели. Текущий идентификатор модели Nano Banana Pro — gemini-3-pro-image-preview (ai.google.dev, февраль 2026). Оригинальная модель Nano Banana использует gemini-2.5-flash-image, а Google недавно анонсировал Gemini 3.1 Pro Preview, хотя он ещё не получил широкого распространения для генерации изображений. Если вы используете устаревший идентификатор модели, устаревшую версию SDK или ссылаетесь на документацию до запуска Gemini 3, ваши запросы могут направляться на модель, не поддерживающую генерацию изображений. Всегда проверяйте, что вы используете актуальный идентификатор модели из официальной документации, и убедитесь, что ваш SDK обновлён до последней версии, поддерживающей семейство моделей Gemini 3. Разница в ценах между моделями также заслуживает внимания: Nano Banana Pro генерирует изображения по $0,134 за изображение 1K/2K и $0,24 за изображение 4K, тогда как более быстрая модель Nano Banana (Flash) генерирует по $0,067 за изображение 1K/2K и $0,12 за изображение 4K (ai.google.dev/pricing, февраль 2026). Если вам не нужно качество уровня Pro, переход на модель Flash может вдвое сократить ваши расходы при сохранении хорошего качества для большинства сценариев использования.

Ошибки, специфичные для API: AI Studio и Vertex AI

Разработчики, создающие приложения на основе Nano Banana Pro через Google AI Studio или Vertex AI, сталкиваются с особым набором ошибок, связанных с аутентификацией, управлением квотами и конфигурацией, специфичной для платформы. Эти ошибки на уровне API отличаются от рассмотренных выше пользовательских ошибок тем, что они часто не имеют ничего общего с самой генерацией изображений — это проблемы инфраструктуры и конфигурации, которые не позволяют вашему запросу достичь модели. Полное руководство по интеграции API Nano Banana Pro можно найти в нашей специализированной статье, которая пошагово описывает настройку с нуля.

Ошибки аутентификации (403) в контексте API почти всегда сводятся к одной из трёх причин: недействительный или истёкший API-ключ, проект без включённого биллинга или неправильные разрешения IAM в Vertex AI. Для Google AI Studio убедитесь, что ваш API-ключ был сгенерирован из того же проекта, где настроен биллинг, и что ключ не был ротирован или отозван. Для Vertex AI аутентификация сложнее, поскольку используются учётные данные сервисного аккаунта, а не API-ключи — убедитесь, что ваш сервисный аккаунт имеет разрешение aiplatform.endpoints.predict и что ваше приложение корректно загружает JSON-учётные данные сервисного аккаунта. Распространённая ошибка — использование API-ключей Google AI Studio с конечными точками Vertex AI или наоборот; это отдельные системы с разными механизмами аутентификации.

Исчерпание квоты проявляется иначе, чем ограничение скорости (ошибки 429). В то время как ошибки 429 временны и разрешаются ожиданием, исчерпание квоты означает, что вы использовали весь выделенный бюджет на расчётный период. Проверьте использование квоты в Google Cloud Console в разделе «IAM и Администрирование > Квоты» и запросите увеличение квоты при необходимости. Важно понимать связь между тарифами биллинга и квотами: Tier 1 (привязан платёжный аккаунт) предоставляет до 300 RPM, Tier 2 (общие расходы $250+, 30+ дней) предоставляет более высокие лимиты, а Tier 3 (общие расходы $1 000+, 30+ дней) предоставляет максимально доступные лимиты (ai.google.dev/rate-limits, февраль 2026).

Несовместимость версий SDK становится всё более распространённой причиной ошибок по мере быстрой итерации Google над API Gemini. Если вы получаете неожиданные ошибки 400 Bad Request или видите сообщения об ошибках о неподдерживаемых параметрах, ваша версия SDK может быть устаревшей. Gemini API претерпел значительные изменения между основными версиями, и использование SDK, предшествующего текущей модели, может приводить к отправке некорректных запросов. Наиболее распространённые проблемы, связанные с SDK, включают использование устаревшего Python-пакета generative-ai вместо актуального google-genai, передачу устаревших параметров (например, полей generation_config, которые были переименованы или удалены), а также указание идентификаторов моделей, которые были заменены более новыми версиями. Всегда явно фиксируйте версию SDK в управлении зависимостями (например, google-genai>=1.0.0 в вашем requirements.txt), тестируйте с последней версией в промежуточной среде перед обновлением продакшена и проверяйте официальный журнал изменений SDK на предмет критических изменений. В случае сомнений создайте минимальный тестовый скрипт, отправляющий один запрос с максимально простым промптом, чтобы изолировать, находится ли проблема в конфигурации SDK или в параметрах конкретного запроса.

Ключевое различие, которое должны понимать корпоративные пользователи, — это разница в поведении ошибок между Google AI Studio и Vertex AI. Во время инцидента в январе 2026 года Vertex AI испытывал более серьёзные и продолжительные ошибки 429, чем конечная точка Google AI Studio. Запросы Vertex AI также проходят через дополнительные уровни инфраструктуры (балансировщики нагрузки, проверки IAM, маршрутизация VPC), которые могут вносить задержку и дополнительные точки отказа. Если вы создаёте приложение, критичное к надёжности, рассмотрите возможность реализации переключения с Vertex AI на прямую конечную точку Gemini API (или наоборот) для повышения общей доступности.

hljs python
# Dual-endpoint fallback pattern
import google.generativeai as genai

def generate_with_fallback(prompt, primary="vertex", max_retries=3):
    """Try primary endpoint, fall back to secondary on failure."""
    endpoints = {
        "vertex": {"project": "your-project", "location": "us-central1"},
        "ai_studio": {"api_key": "your-api-key"}
    }

    for endpoint_name in [primary, "ai_studio" if primary == "vertex" else "vertex"]:
        for attempt in range(max_retries):
            try:
                if endpoint_name == "ai_studio":
                    genai.configure(api_key=endpoints["ai_studio"]["api_key"])
                    model = genai.GenerativeModel("gemini-3-pro-image-preview")
                    return model.generate_content(prompt)
                else:
                    # Vertex AI endpoint logic
                    pass
            except Exception as e:
                if attempt == max_retries - 1:
                    print(f"{endpoint_name} failed after {max_retries} attempts, trying fallback...")
                    break
                time.sleep(2 ** attempt)

    raise Exception("All endpoints exhausted")

Предотвращение — как полностью избежать ошибок

Блок-схема стратегии предотвращения ошибок, сравнивающая реактивный и проактивный подходы

Каждый раздел выше сосредоточен на исправлении ошибок после их возникновения, но наиболее эффективная стратегия — предотвращение ошибок в первую очередь. Ни одно другое руководство по устранению неполадок не охватывает проактивное предотвращение ошибок, именно поэтому существует этот раздел: чтобы превратить вас из реактивного отладчика в проактивного системного проектировщика. Приведённые ниже стратегии предотвращения применимы независимо от того, являетесь ли вы разработчиком, создающим приложение, дизайнером, генерирующим изображения через приложение Gemini, или владельцем бизнеса, управляющим рабочим процессом генерации ИИ-изображений для команды.

Мониторинг лимитов скорости — основа предотвращения ошибок. Вместо того чтобы ждать, пока ошибка 429 сообщит вам о достижении лимита, активно отслеживайте своё использование относительно лимитов вашего тарифа. Для пользователей API заголовки ответа Gemini API содержат информацию о лимитах скорости, которую можно парсить и логировать. Создайте простую панель мониторинга или систему оповещений, которая предупреждает, когда использование достигает 80% по любому измерению (RPM, RPD или TPM). Такое раннее предупреждение даёт вам время для снижения частоты запросов, перехода на пакетную обработку или временной маршрутизации трафика на альтернативную конечную точку до начала ошибок. Для пользователей приложения Gemini, у которых нет доступа к заголовкам API, самый простой подход к мониторингу — отслеживать количество сгенерированных изображений за сеанс и устанавливать личные лимиты ниже известных порогов для вашего уровня подписки — 2 в день для бесплатного, примерно 100 в день для Pro ($19,99/месяц) и до 1 000 в день для Ultra ($99,99/месяц), по данным сообщества.

Настройка бюджетных лимитов предотвращает как финансовые неожиданности, так и исчерпание квоты. В Google Cloud Console настройте оповещения о биллинге на 50%, 80% и 100% вашего месячного бюджета. Для Gemini API в частности установите квоты на уровне проекта, ограничивающие ежедневные расходы ниже вашего комфортного порога. Это особенно важно при использовании более дорогих функций, таких как генерация изображений 4K по $0,24 за изображение, где неконтролируемый скрипт, генерирующий тысячи изображений, может привести к непредвиденным расходам — партия из 1 000 изображений 4K обходится в $240, что может быстро накопиться во время разработки и тестирования. Оповещения о бюджете не останавливают расходы автоматически, поэтому сочетайте их с квотными лимитами, обеспечивающими жёсткие ограничения. Комбинация мягких оповещений и жёстких квотных ограничений создаёт страховочную сеть, которая предотвращает как постепенное увеличение бюджета, так и внезапные всплески расходов из-за неконтролируемых процессов или неожиданных всплесков трафика. Команды, работающие над производственными приложениями, должны назначить выделенного администратора биллинга, который еженедельно анализирует модели расходов и корректирует квоты на основе фактических тенденций использования, а не устанавливает произвольные лимиты, которые могут быть слишком ограничительными или слишком мягкими.

Умное планирование запросов равномерно распределяет ваше использование API во времени, чтобы избежать превышения лимитов RPM при всплесках. Вместо того чтобы отправлять 100 запросов максимально быстро и мгновенно достигать лимита бесплатного тарифа в 5-10 RPM, реализуйте очередь запросов, которая распределяет их с постоянными интервалами. Для пакетной обработки планируйте тяжёлые нагрузки на непиковые часы (поздний вечер — раннее утро по тихоокеанскому времени), когда инфраструктура Google испытывает меньшую общую нагрузку, что снижает вероятность как ошибок 429, так и серверных ошибок 500/502. Для более глубокого анализа поиска наиболее экономичного доступа к API Nano Banana Pro наше руководство по сравнению цен анализирует все доступные варианты. Сторонние провайдеры, такие как laozhang.ai, могут служить уровнем надёжности в вашей архитектуре — маршрутизация запросов через провайдера с собственным управлением запросами, логикой повторных попыток и переключением между несколькими конечными точками устраняет большинство категорий ошибок до того, как они достигнут вашего приложения, по цене примерно $0,05 за изображение без ограничений скорости (документация на docs.laozhang.ai).

Часто задаваемые вопросы

Сколько нужно ждать после ошибки 429?

Для лимитов RPM (запросы в минуту) достаточно подождать 60 секунд, поскольку окно лимита сбрасывается каждую минуту. Для лимитов RPD (запросы в день) необходимо подождать до полуночи по тихоокеанскому времени, когда дневной счётчик сбрасывается. Если вы не уверены, какое измерение вызвало ошибку, начните с ожидания 60 секунд — если ошибка сохраняется, вы, вероятно, исчерпали лимит RPD, и вам нужно подождать до следующего дня или повысить тариф биллинга для доступа к более высоким лимитам.

Можно ли увеличить лимит скорости без оплаты?

Лимиты бесплатного тарифа фиксированы на уровне примерно 5-10 RPM и 100 RPD. Единственный способ увеличить лимиты — привязать платёжный аккаунт (Tier 1), что повышает лимиты до 300 RPM и 10 000 RPD. Дальнейшее увеличение требует накопления расходов: $250+ общих расходов для Tier 2 и $1 000+ общих расходов для Tier 3, каждый с 30-дневным периодом ожидания с момента первого платежа (ai.google.dev/rate-limits, февраль 2026).

Почему Nano Banana Pro блокирует безопасные изображения?

Это почти всегда проблема фильтра Layer 2 IMAGE_SAFETY. Layer 2 проверяет сгенерированное изображение, а не текст вашего промпта. Даже если ваш промпт описывает что-то полностью безопасное, сгенерированное изображение может содержать элементы, вызывающие срабатывание выходного фильтра — например, оттенки кожи, позы или композиции, которые фильтр интерпретирует как потенциально неприемлемые. Решение — промпт-инженерия: добавьте явный контекст о коммерческом или образовательном характере изображения, точно укажите детали одежды и избегайте двусмысленных описаний, которые модель может интерпретировать непредвиденным образом.

В чём разница между ошибкой 429 и ошибкой 503?

Ошибка 429 (RESOURCE_EXHAUSTED) означает, что лично вы превысили выделенный лимит скорости — она специфична для вашего API-ключа и тарифа биллинга. Ошибка 503 (Service Unavailable) означает, что сервис Google временно недоступен или перегружен для всех пользователей. Исправление для 429 — подождать, пока ваш личный лимит сбросится, или повысить тариф. Исправление для 503 — повторная попытка с экспоненциальной задержкой, поскольку это указывает на серверную проблему, которая разрешится самостоятельно.

Как использовать API Nano Banana Pro без ошибок?

Ключ к безошибочному использованию API — реализация трёх уровней защиты: во-первых, используйте экспоненциальную задержку с джиттером для всех вызовов API, чтобы автоматически обрабатывать временные ошибки; во-вторых, отслеживайте своё использование относительно лимитов вашего тарифа и снижайте частоту запросов до достижения порогов; в-третьих, реализуйте стратегию переключения (вторичная конечная точка, очередь запросов или альтернативный провайдер) на случай недоступности основной конечной точки. Готовые к продакшену примеры кода на Python в этом руководстве обеспечивают основу для всех трёх уровней. На практике команды, реализовавшие все три уровня, сообщают о частоте ошибок ниже 1% в продакшене по сравнению с 15-30% для приложений, которые обрабатывают ошибки только реактивно. Первоначальные инженерные затраты минимальны — обычно несколько часов работы — но долгосрочное улучшение надёжности колоссально и напрямую выражается в лучшем пользовательском опыте и более низких операционных расходах благодаря сокращению времени отладки и напрасных вызовов API.

🍌
PRO

Nano Banana Pro

4K-80%

Google Gemini 3 Pro · AI Inpainting

Модель Google · AI ретушь

100K+ разработчиков
20мс задержка
🎨4K UHD
🚀30с/фото
🏢Корпоративный
Enterprise|Alipay · WeChat · Карта|🔒 Безопасно
100+ компаний используют
99.9% доступность·Глобальная сеть
Спецпредложение
$0.24¥1.7
$0.05
$0.05
за изображение
Экономия 80%

Рекомендуемое