Если вы подключаете новую официальную интеграцию Kimi API, первым model ID должен быть kimi-k2.6. kimi-k2.5 стоит оставлять только для совместимости, сравнения с K2.5 или старой evaluation baseline. kimi-k2-thinking нужен тогда, когда вы осознанно вызываете отдельную более старую thinking-модель, а не просто хотите, чтобы K2.6 рассуждала глубже. Provider pages, локальные API-магазины, ролики про free API и готовые OpenAI-compatible snippets полезны как точки входа, но они не владеют официальным контрактом Kimi/Moonshot.
Русскоязычная выдача по этой теме часто смешивает три задачи: найти рабочий endpoint, понять текущий model ID и выяснить, можно ли использовать бесплатный или сторонний маршрут. Для production-кода эти задачи нельзя решать одной строкой из поисковой выдачи. Сначала зафиксируйте официальный model ID, затем выберите route owner, и только потом решайте, какие provider aliases, цены и лимиты относятся к конкретному маршруту.

| Задача | Используйте | Почему | Проверить перед production |
|---|---|---|---|
| Новая официальная интеграция Kimi API | kimi-k2.6 | Текущий model ID из официального K2.6 quickstart | model list, price, context, quota, account limits |
| Сохранить K2.5 test или compatibility path | kimi-k2.5 | Это отдельная модель, а не опечатка в K2.6 | действительно ли тест зависит от поведения K2.5 |
| Отдельный старый thinking route | kimi-k2-thinking | Dedicated model ID, not a K2.6 alias | reasoning output, tool-call fields, max tokens |
| Provider или free API route | Provider-specific alias | Доказывает только маршрут данного владельца | price, limits, identity, data policy, free-claim evidence |
Сначала выберите model ID, а не самое громкое название K2
Семейство Kimi K2 легко читать как одну линию версий: K2.6 кажется просто последней, K2.5 выглядит как предыдущая, K2 Thinking звучит как режим с более сильным reasoning. Но API-запрос не принимает настроение семейства. Он принимает точный model, base URL, credentials, параметры и response schema.
Для нового официального кода самый чистый default — kimi-k2.6 на Kimi/Moonshot API. Официальный K2.6 quickstart использует OpenAI-compatible client shape и base URL https://api.moonshot.ai/v1. Это не означает, что все старые K2 строки в репозитории надо заменить глобальным search-and-replace. Это означает, что свежая интеграция, которая хочет current official Kimi route, не должна начинаться со старого model string.
kimi-k2.5 остается полезным, когда тест зависит от поведения K2.5, когда нужно сохранить сравнимость старого benchmark или когда конкретный provider route еще не обновил свою карту моделей. Такая строка должна быть сохранена с объяснением. Если причина не записана, будущий разработчик не поймет, это намеренная совместимость или забытая конфигурация.
kimi-k2-thinking — еще более узкий случай. Его надо трактовать как отдельный model ID. Если ваша задача состоит в управлении thinking behavior на K2.6 или K2.5, это уже вопрос request settings, reasoning fields и tool-call continuity, а не разрешение выдумать новый string вроде kimi-k2.6-thinking.
Официальный API отвечает за модельную идентичность
Provider article, форумный snippet или локальный aggregator может показать, как быстро отправить запрос. Но официальный Kimi/Moonshot surface остается сильнейшим источником для model list, supported route, pricing rows, context window, parameter behavior и retirement notices. Если вы пишете production runbook, cost estimate или SDK default, сначала проверяйте именно route owner.
Минимальный вызов должен делать маршрут видимым:
hljs tsimport OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.KIMI_API_KEY,
baseURL: "https://api.moonshot.ai/v1",
});
const response = await client.chat.completions.create({
model: "kimi-k2.6",
messages: [
{ role: "user", content: "Summarize the routing risk in this Kimi setup." },
],
});
console.log(response.choices[0]?.message);
Сначала подтвердите, что account, API key, base URL и model string работают на официальной линии. После этого добавляйте tools, streaming, multimodal input, long context, retries или provider proxy. Такой порядок полезен при диагностике: если официальный вызов работает, а сторонний маршрут падает, расследование идет в alias mapping, billing, rate limits, capability wrapper или data policy provider'а.
На 8 мая 2026 года официальная платформа показывала K2.6 и K2.5 как multimodal models с 256K context. Для K2.6 были указаны cache hit $0.16/MTok, input $0.95/MTok, output $4.00/MTok; для K2.5 — cache hit $0.10/MTok, input $0.60/MTok, output $3.00/MTok. Это датированные факты конкретного владельца маршрута. Перед переносом в бюджет, dashboard или публичную страницу их надо проверить заново.
K2 Thinking не равен произвольному thinking mode

Самая опасная путаница возникает вокруг слова thinking. В одном контексте это dedicated model ID kimi-k2-thinking. В другом — поведение текущей модели, где клиент должен правильно обрабатывать reasoning output и tool calls. Эти два слоя дают разные требования к коду.
| Слой | Что это | Практический эффект |
|---|---|---|
kimi-k2-thinking | Отдельный старый K2 thinking model ID | Указывается напрямую в model, если этот route нужен |
| Thinking behavior на K2.6/K2.5 | Request/response handling на текущем route | Нужно сохранять reasoning fields и корректно вести tool calls |
Официальный thinking guide важен не ради маркетингового слова. Responses могут содержать reasoning_content; tool-call workflow может требовать, чтобы reasoning content переносился дальше; streaming behavior, temperature guidance и max-token setting могут менять итоговое качество. Если ваш SDK wrapper удаляет nonstandard fields, суммирует intermediate messages или неправильно replay'ит tool calls, модель будет выглядеть слабее, хотя проблема находится в интеграции.
Для production-документации лучше записать пять вещей: какой exact model ID используется; включено ли thinking behavior; сохраняет ли клиент reasoning_content; повторяются ли tool-call messages с нужными полями; достаточно ли max tokens для reasoning path. Это сильнее, чем просто утверждать, что "K2 Thinking лучше".
Старые K2 strings требуют миграционного правила
Официальный model list содержал retirement note для старой серии kimi-k2. Это не значит, что K2.5 и K2.6 исчезли. Это значит, что старые configs, examples, provider aliases и evaluation scripts должны пройти целевой scan.
| Где искать | Что искать | Действие |
|---|---|---|
| Environment variables | KIMI_MODEL, MODEL_ID, provider aliases | Менять только после выбора route owner |
| SDK wrappers | default model strings, hidden fallback | Сделать default явным и логировать selected model |
| Evaluation scripts | K2.5 labels, K2 Thinking baseline | Сохранить, если сравнение зависит от старого поведения |
| Provider configs | hosted aliases, platform model paths | Маппить отдельно от official model IDs |
| Documentation | "latest K2", "K2 API" без model ID | Заменить на exact model string и checked date |
Без такого правила команда либо оставит stale defaults, либо сломает исторические сравнения. Правильная формула короче: new official builds default to K2.6; existing tests keep intentional routes; old K2 strings get a route-owner check.
Provider и free API claims проверяются отдельно

Сторонний маршрут может быть правильным выбором. Он может дать знакомый account, регион, worker runtime, unified billing, OpenAI-compatible endpoint или быстрый playground. Но такой маршрут доказывает только контракт данного provider'а. Он не переписывает официальный model list Kimi.
Перед зависимостью от provider route проверьте каждый слой:
| Claim | Где проверять | Почему |
|---|---|---|
| Model identity | Provider docs плюс official Kimi docs | Alias может отличаться от official model ID |
| Price and billing | Provider pricing page | Цена, free credit, minimums и billing owner отличаются |
| Context and limits | Provider model card или dashboard | Hosted route может иметь свой practical limit |
| Tool, vision, JSON, streaming | Provider capability docs | Capability wrapper может быть неполным |
| Data policy | Terms и product docs provider'а | Official model identity не отвечает за data handling |
| Free API | Route owner, not a video title | Free, unlimited, no-ban и guarantee claims quickly expire |
Если страница обещает free Kimi K2.6 API, воспринимайте это как lead to verify. Для low-risk experiment это может быть нормально. Для production code, client commitment или публичной рекомендации нужны текущие доказательства от route owner. Без них нельзя писать unlimited, stable, no-ban, refund или failure-free guarantees.
Kimi вместо Claude — отдельное сравнение
Часть читателей приходит к K2.6 из обсуждений "может ли Kimi заменить Claude Code или Opus workflow". Это важный, но другой вопрос. Model-ID guide отвечает за Kimi route: kimi-k2.6, kimi-k2.5, kimi-k2-thinking, official base URL, provider alias и thinking handling. Replacement analysis должен отдельно измерять coding reliability, agent loops, tool use, latency, cost, failure recovery и repository behavior.
Держите границу простой:
- выбираете Kimi model string — используйте route table;
- сравниваете Kimi с Claude workflow — запускайте same-task benchmark;
- используете provider — сначала проверяйте provider route, потом сравнивайте model quality;
- пишете production docs — указывайте official model ID и route owner вместе.
Такой порядок защищает от shortcut, когда market excitement подменяет проверенный API contract.
Production-чеклист перед запуском
Финальная запись в репозитории должна быть скучной и точной:
| Поле | Хорошая запись |
|---|---|
| Official target | kimi-k2.6, kimi-k2.5 или kimi-k2-thinking с причиной |
| API owner | Kimi/Moonshot official API или named provider route |
| Base URL | https://api.moonshot.ai/v1 или provider endpoint |
| Checked date | Когда проверяли model list, price, context и limits |
| Thinking behavior | off, on, default или dedicated model route |
| Reasoning handling | Сохраняет ли client reasoning_content |
| Provider caveat | Alias, billing, limits, capabilities, data policy |
| Stop rule | Никаких free, unlimited, no-ban или guarantee claims без owner proof |
Эта таблица предотвращает скрытую проблему: через месяц никто не помнит, почему в конфиге стоит конкретный K2 string. Если причина записана, migration и incident response становятся намного проще.
FAQ
Сейчас для нового Kimi API проекта нужно использовать kimi-k2.6?
Да, если речь идет об official Kimi API и нет специальной причины сохранять K2.5, вызывать dedicated kimi-k2-thinking или использовать provider-specific alias.
kimi-k2-thinking — это то же самое, что K2.6 thinking mode?
Нет. kimi-k2-thinking — отдельный model ID. Thinking behavior на K2.6 или K2.5 зависит от текущих request settings и response handling.
Есть ли смысл тестировать Kimi K2.5?
Да, если вам нужна совместимость, историческая baseline или конкретное поведение K2.5. Для свежей official API integration это не должен быть default без объяснения.
Можно ли использовать бесплатный Kimi K2.6 API?
Для эксперимента — возможно, если route owner явно показывает условия. Для production нельзя полагаться на free, unlimited, no-ban, uptime, refund или guarantee claims без текущего доказательства владельца маршрута.
Что делать со старыми kimi-k2 строками?
Просканируйте configs, wrappers, examples и provider settings. Затем решите: новая official route идет на K2.6, K2.5 остается для сравнения, kimi-k2-thinking остается только для dedicated thinking model, provider alias маппится отдельно.



