Si vas a crear una integración nueva con la API oficial de Kimi, el primer model que debes probar es kimi-k2.6. Mantén kimi-k2.5 solo si necesitas compatibilidad, comparación con una baseline antigua o una prueba que dependa del comportamiento de K2.5. Usa kimi-k2-thinking únicamente cuando quieras llamar al modelo thinking dedicado más antiguo. Una página de provider, un vídeo sobre API gratuita o un snippet compatible con OpenAI puede ayudarte a encontrar una entrada, pero no define el contrato oficial de Kimi/Moonshot.
En español, la duda suele mezclar tres temas: cuál es el ID actual, si la API de Kimi K2 es gratis y si K2 Thinking es un modelo o un modo. La respuesta práctica es separar responsabilidades. El ID oficial se confirma en la ruta Kimi/Moonshot; el alias de un provider se confirma en ese provider; las promesas de gratis, ilimitado o estable solo valen si el dueño de la ruta las muestra ahora.

| Necesidad | Usa primero | Por qué | Revisa antes de producción |
|---|---|---|---|
| Nueva integración oficial de Kimi API | kimi-k2.6 | Es el model ID usado por el quickstart oficial de K2.6 | model list, precio, contexto, límites de cuenta |
| Conservar una prueba K2.5 | kimi-k2.5 | Sigue siendo un modelo distinto, no una errata de K2.6 | si la prueba realmente necesita K2.5 |
| Ruta thinking dedicada | kimi-k2-thinking | Es un model ID separado, no un alias de K2.6 | reasoning output, tool calls, max tokens |
| Provider o API gratuita | Alias propio del provider | Solo prueba el contrato de esa ruta | precio, límites, identidad, datos, prueba de gratuidad |
La primera decisión es el model ID
Los nombres públicos de Kimi K2 son fáciles de confundir. K2.6 suena como la versión nueva, K2.5 como la versión anterior y K2 Thinking como una función de razonamiento. Pero una llamada API no acepta una familia de nombres. Acepta un string exacto en model, un base URL, credenciales, parámetros y un formato de respuesta.
Para trabajo nuevo en la ruta oficial, el default más limpio es kimi-k2.6. El quickstart oficial de K2.6 usa una forma compatible con el cliente OpenAI y el base URL https://api.moonshot.ai/v1. Eso no significa que debas sustituir cada string K2 antiguo en tu repositorio. Significa que un proyecto nuevo que quiere usar el modelo Kimi actual no debería empezar con un string viejo.
kimi-k2.5 todavía tiene sentido cuando preservas una evaluación, comparas comportamiento de K2.5, mantienes compatibilidad o usas una ruta de provider que aún no expone K2.6. Trátalo como una ruta intencional. Si el archivo de configuración no dice por qué sigue ahí, otro desarrollador no sabrá si es compatibilidad o deuda técnica.
kimi-k2-thinking es más estrecho. Es un model ID dedicado. Si lo que quieres es activar o manejar comportamiento de thinking en K2.6 o K2.5, la pregunta se mueve a request settings, fields de reasoning y continuidad de tool calls. No conviertas una frase de provider en un ID oficial nuevo.
Empieza por la ruta oficial
La ruta oficial de Kimi/Moonshot es la fuente fuerte para model IDs, filas de precio, context window, parámetros, notas de retiro y estado de modelos. Los providers pueden tener mucho valor como entrada rápida, facturación unificada o entorno regional, pero no reemplazan la lista oficial cuando decides qué significa el string del modelo.
Un ejemplo mínimo debe dejar visible la ruta:
hljs tsimport OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.KIMI_API_KEY,
baseURL: "https://api.moonshot.ai/v1",
});
const response = await client.chat.completions.create({
model: "kimi-k2.6",
messages: [
{ role: "user", content: "Summarize the routing risk in this Kimi setup." },
],
});
console.log(response.choices[0]?.message);
Primero confirma que la cuenta, la key, el base URL y el model ID funcionan en la ruta oficial. Después añade streaming, tool calls, input multimodal, long context, proxy de provider o retries. Si la ruta oficial funciona y una ruta alojada falla, el problema puede estar en alias mapping, billing, rate limits, capability wrapper o data policy del provider.
El 8 de mayo de 2026, la plataforma oficial mostraba K2.6 y K2.5 como modelos multimodales con contexto de 256K. K2.6 aparecía con cache hit $0.16/MTok, input $0.95/MTok y output $4.00/MTok; K2.5 aparecía con cache hit $0.10/MTok, input $0.60/MTok y output $3.00/MTok. Esos datos tienen fecha. Revisa la plataforma actual antes de ponerlos en presupuesto, página pública o compromiso interno.
K2 Thinking no es cualquier modo de thinking

La palabra thinking aparece en dos capas. Una es kimi-k2-thinking, un model ID dedicado. La otra es el comportamiento de razonamiento en K2.6 o K2.5, donde el cliente debe manejar correctamente campos de reasoning, tool calls, streaming y límites de tokens. Si mezclas esas capas, el código puede fallar aunque el modelo elegido sea correcto.
| Capa | Qué significa | Efecto práctico |
|---|---|---|
kimi-k2-thinking | Modelo K2 thinking dedicado y más antiguo | Se elige en model cuando esa ruta es intencional |
| Thinking en K2.6/K2.5 | Comportamiento de request y response en la ruta actual | Hay que preservar reasoning fields y tool-call continuity |
La guía de thinking importa porque la respuesta puede exponer reasoning_content y los flujos con tool calls pueden necesitar que ese contenido avance al siguiente turno. También importan streaming, temperatura y max tokens. Si tu wrapper elimina campos no estándar, resume mensajes intermedios o pierde la información antes de una tool call, parecerá que el modelo rinde peor cuando el fallo está en la integración.
Para producción, documenta cinco puntos: exact model ID, estado del thinking, si el cliente conserva reasoning_content, cómo reproduce tool-call messages y qué max-token budget usa. Esa lista es más accionable que preguntar si K2 Thinking es “mejor”.
Los strings K2 antiguos necesitan una regla de migración
La lista oficial incluyó una nota de retiro para la serie antigua kimi-k2. No lo interpretes como que K2.5 o K2.6 desaparecieron. Interprétalo como una señal para revisar configs, wrappers, ejemplos, aliases de providers y scripts de evaluación.
| Dónde buscar | Qué revisar | Acción |
|---|---|---|
| Variables de entorno | KIMI_MODEL, MODEL_ID, provider aliases | Cambiar solo después de elegir route owner |
| SDK wrappers | default model strings, hidden fallback | Hacer explícito el default y registrar selected model |
| Scripts de evaluación | labels K2.5 o K2 Thinking | Mantener si la comparación depende de ellos |
| Config de providers | aliases alojados o rutas de plataforma | Mapear separado de los IDs oficiales |
| Documentación | “latest K2” o “K2 API” sin ID | Sustituir por exact model string y checked date |
La regla segura es: nuevas integraciones oficiales empiezan en K2.6; pruebas existentes conservan su ruta si hay intención; strings antiguos reciben una comprobación de route owner. Reemplazar todo por K2.6 puede romper comparaciones; no tocar nada puede dejar defaults obsoletos.
Las rutas de providers y API gratuita se verifican por dueño

Un provider puede ser la mejor ruta para una prueba concreta. Puede ofrecer endpoint compatible con OpenAI, consola cómoda, billing existente, runtime regional, créditos o integración con otra plataforma. Pero el contrato que demuestra es el suyo. No convierte automáticamente un alias en model ID oficial.
Antes de depender de esa ruta, separa las capas:
| Afirmación | Dueño a revisar | Por qué importa |
|---|---|---|
| Identidad del modelo | Provider docs más docs oficiales de Kimi | El alias puede no coincidir con el ID oficial |
| Precio y billing | Página de precios del provider | Precio, crédito, mínimos y dueño de factura cambian |
| Contexto y límites | Model card o dashboard del provider | El límite práctico puede ser distinto |
| Tools, vision, JSON, streaming | Capability docs del provider | La envoltura puede soportar solo parte de la API |
| Data policy | Terms y product docs del provider | El nombre del modelo no responde cómo se tratan datos |
| API gratuita | Página actual del route owner | Gratis, ilimitado y garantía cambian rápido |
Si una página dice “API gratuita de Kimi K2.6”, úsala como pista, no como prueba. Puede servir para un experimento de bajo riesgo. Para producción, no publiques ni dependas de promesas de gratis, ilimitado, no-ban, refund, uptime o garantía sin evidencia actual del dueño de la ruta.
Kimi frente a Claude es otra decisión
Algunos lectores llegan a K2.6 porque lo vieron como alternativa a Claude Code, Opus u otro flujo de programación. Esa comparación es legítima, pero no decide el model ID. La decisión de ruta de Kimi separa kimi-k2.6, kimi-k2.5, kimi-k2-thinking, base URL oficial, alias de provider y tratamiento del thinking.
Una comparación con Claude debe medir workflow fit, coding reliability, tool use, agent loops, latency, cost, failure recovery y comportamiento en repositorios reales. Cambiar el model string por entusiasmo de benchmark no es una migración; es un riesgo de routing.
Mantén la frontera así:
- Para elegir un string Kimi, usa la tabla de rutas.
- Para evaluar reemplazo de Claude, ejecuta un benchmark con las mismas tareas.
- Para usar provider, verifica la ruta antes de comparar calidad de modelos.
- Para documentación de producción, escribe official model ID y route owner juntos.
Checklist de producción
Antes de enviar una integración Kimi K2-family, deja estos valores en el repositorio o runbook:
| Campo | Buena nota de producción |
|---|---|
| Target oficial | kimi-k2.6, kimi-k2.5 o kimi-k2-thinking con motivo |
| API owner | Kimi/Moonshot official API o provider route concreto |
| Base URL | https://api.moonshot.ai/v1 o endpoint del provider |
| Checked date | Fecha de revisión de model list, precio, context y limits |
| Thinking behavior | off, on, default o dedicated model route |
| Reasoning handling | Si el cliente conserva reasoning_content |
| Provider caveat | Alias, billing, limits, capabilities y data policy |
| Stop rule | No usar free, unlimited, no-ban o guarantee sin owner proof |
La tabla parece básica, pero evita que un model string sobreviva meses sin dueño claro. Cuando haya que migrar, depurar o cambiar de provider, la decisión estará escrita.
FAQ
¿Para una integración nueva debo usar kimi-k2.6?
Sí, si usas la API oficial de Kimi y no tienes una razón específica para conservar K2.5, llamar kimi-k2-thinking o usar un alias de provider.
¿kimi-k2-thinking es lo mismo que el modo thinking de K2.6?
No. kimi-k2-thinking es un model ID separado. El thinking behavior de K2.6 o K2.5 depende de settings de request y manejo de response.
¿Sigue valiendo la pena probar Kimi K2.5?
Sí, cuando necesitas comportamiento K2.5, compatibilidad o una baseline antigua. No debería ser el default de una integración oficial nueva sin una razón escrita.
¿Puedo usar una API gratuita de Kimi K2.6?
Quizá para una prueba de bajo riesgo, si el route owner muestra condiciones actuales. No uses promesas de gratis, ilimitado, no-ban, uptime, refund o garantía sin evidencia actual.
¿Qué hago con strings antiguos kimi-k2?
Busca en configs, wrappers, ejemplos y provider settings. Mueve nuevas rutas oficiales a K2.6, conserva K2.5 si hay comparación, usa kimi-k2-thinking solo para el modelo dedicado y mapea aliases de provider por separado.



