Kimi K2.6 API, K2.5 y K2 Thinking: qué model ID debes usar

Si vas a crear una integración nueva con la API oficial de Kimi, el primer model que debes probar es kimi-k2.6. Mantén kimi-k2.5 solo si necesitas compatibilidad, comparación con una baseline antigua o una prueba que dependa del comportamiento de K2.5. Usa kimi-k2-thinking únicamente cuando quieras llamar al modelo thinking dedicado más antiguo. Una página de provider, un vídeo sobre API gratuita o un snippet compatible con OpenAI puede ayudarte a encontrar una entrada, pero no define el contrato oficial de Kimi/Moonshot.

En español, la duda suele mezclar tres temas: cuál es el ID actual, si la API de Kimi K2 es gratis y si K2 Thinking es un modelo o un modo. La respuesta práctica es separar responsabilidades. El ID oficial se confirma en la ruta Kimi/Moonshot; el alias de un provider se confirma en ese provider; las promesas de gratis, ilimitado o estable solo valen si el dueño de la ruta las muestra ahora.

Tabla de rutas de Kimi: K2.6 como opción inicial, K2.5 para compatibilidad, K2 Thinking y comprobación de strings antiguos

Necesidad	Usa primero	Por qué	Revisa antes de producción
Nueva integración oficial de Kimi API	`kimi-k2.6`	Es el model ID usado por el quickstart oficial de K2.6	model list, precio, contexto, límites de cuenta
Conservar una prueba K2.5	`kimi-k2.5`	Sigue siendo un modelo distinto, no una errata de K2.6	si la prueba realmente necesita K2.5
Ruta thinking dedicada	`kimi-k2-thinking`	Es un model ID separado, no un alias de K2.6	reasoning output, tool calls, max tokens
Provider o API gratuita	Alias propio del provider	Solo prueba el contrato de esa ruta	precio, límites, identidad, datos, prueba de gratuidad

La primera decisión es el model ID

Los nombres públicos de Kimi K2 son fáciles de confundir. K2.6 suena como la versión nueva, K2.5 como la versión anterior y K2 Thinking como una función de razonamiento. Pero una llamada API no acepta una familia de nombres. Acepta un string exacto en model, un base URL, credenciales, parámetros y un formato de respuesta.

Para trabajo nuevo en la ruta oficial, el default más limpio es kimi-k2.6. El quickstart oficial de K2.6 usa una forma compatible con el cliente OpenAI y el base URL https://api.moonshot.ai/v1. Eso no significa que debas sustituir cada string K2 antiguo en tu repositorio. Significa que un proyecto nuevo que quiere usar el modelo Kimi actual no debería empezar con un string viejo.

kimi-k2.5 todavía tiene sentido cuando preservas una evaluación, comparas comportamiento de K2.5, mantienes compatibilidad o usas una ruta de provider que aún no expone K2.6. Trátalo como una ruta intencional. Si el archivo de configuración no dice por qué sigue ahí, otro desarrollador no sabrá si es compatibilidad o deuda técnica.

kimi-k2-thinking es más estrecho. Es un model ID dedicado. Si lo que quieres es activar o manejar comportamiento de thinking en K2.6 o K2.5, la pregunta se mueve a request settings, fields de reasoning y continuidad de tool calls. No conviertas una frase de provider en un ID oficial nuevo.

Empieza por la ruta oficial

La ruta oficial de Kimi/Moonshot es la fuente fuerte para model IDs, filas de precio, context window, parámetros, notas de retiro y estado de modelos. Los providers pueden tener mucho valor como entrada rápida, facturación unificada o entorno regional, pero no reemplazan la lista oficial cuando decides qué significa el string del modelo.

Un ejemplo mínimo debe dejar visible la ruta:

hljs ts
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.KIMI_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

const response = await client.chat.completions.create({
  model: "kimi-k2.6",
  messages: [
    { role: "user", content: "Summarize the routing risk in this Kimi setup." },
  ],
});

console.log(response.choices[0]?.message);

Primero confirma que la cuenta, la key, el base URL y el model ID funcionan en la ruta oficial. Después añade streaming, tool calls, input multimodal, long context, proxy de provider o retries. Si la ruta oficial funciona y una ruta alojada falla, el problema puede estar en alias mapping, billing, rate limits, capability wrapper o data policy del provider.

El 8 de mayo de 2026, la plataforma oficial mostraba K2.6 y K2.5 como modelos multimodales con contexto de 256K. K2.6 aparecía con cache hit $0.16/MTok, input $0.95/MTok y output $4.00/MTok; K2.5 aparecía con cache hit $0.10/MTok, input $0.60/MTok y output $3.00/MTok. Esos datos tienen fecha. Revisa la plataforma actual antes de ponerlos en presupuesto, página pública o compromiso interno.

K2 Thinking no es cualquier modo de thinking

Flujo de Kimi thinking con elección de modelo, settings de thinking, reasoning content, tool calls y max-token checks

La palabra thinking aparece en dos capas. Una es kimi-k2-thinking, un model ID dedicado. La otra es el comportamiento de razonamiento en K2.6 o K2.5, donde el cliente debe manejar correctamente campos de reasoning, tool calls, streaming y límites de tokens. Si mezclas esas capas, el código puede fallar aunque el modelo elegido sea correcto.

Capa	Qué significa	Efecto práctico
`kimi-k2-thinking`	Modelo K2 thinking dedicado y más antiguo	Se elige en `model` cuando esa ruta es intencional
Thinking en K2.6/K2.5	Comportamiento de request y response en la ruta actual	Hay que preservar reasoning fields y tool-call continuity

La guía de thinking importa porque la respuesta puede exponer reasoning_content y los flujos con tool calls pueden necesitar que ese contenido avance al siguiente turno. También importan streaming, temperatura y max tokens. Si tu wrapper elimina campos no estándar, resume mensajes intermedios o pierde la información antes de una tool call, parecerá que el modelo rinde peor cuando el fallo está en la integración.

Para producción, documenta cinco puntos: exact model ID, estado del thinking, si el cliente conserva reasoning_content, cómo reproduce tool-call messages y qué max-token budget usa. Esa lista es más accionable que preguntar si K2 Thinking es “mejor”.

Los strings K2 antiguos necesitan una regla de migración

La lista oficial incluyó una nota de retiro para la serie antigua kimi-k2. No lo interpretes como que K2.5 o K2.6 desaparecieron. Interprétalo como una señal para revisar configs, wrappers, ejemplos, aliases de providers y scripts de evaluación.

Dónde buscar	Qué revisar	Acción
Variables de entorno	`KIMI_MODEL`, `MODEL_ID`, provider aliases	Cambiar solo después de elegir route owner
SDK wrappers	default model strings, hidden fallback	Hacer explícito el default y registrar selected model
Scripts de evaluación	labels K2.5 o K2 Thinking	Mantener si la comparación depende de ellos
Config de providers	aliases alojados o rutas de plataforma	Mapear separado de los IDs oficiales
Documentación	“latest K2” o “K2 API” sin ID	Sustituir por exact model string y checked date

La regla segura es: nuevas integraciones oficiales empiezan en K2.6; pruebas existentes conservan su ruta si hay intención; strings antiguos reciben una comprobación de route owner. Reemplazar todo por K2.6 puede romper comparaciones; no tocar nada puede dejar defaults obsoletos.

Las rutas de providers y API gratuita se verifican por dueño

Checklist de provider route para Kimi API: alias, billing, limits, tools, data policy y free claims

Un provider puede ser la mejor ruta para una prueba concreta. Puede ofrecer endpoint compatible con OpenAI, consola cómoda, billing existente, runtime regional, créditos o integración con otra plataforma. Pero el contrato que demuestra es el suyo. No convierte automáticamente un alias en model ID oficial.

Antes de depender de esa ruta, separa las capas:

Afirmación	Dueño a revisar	Por qué importa
Identidad del modelo	Provider docs más docs oficiales de Kimi	El alias puede no coincidir con el ID oficial
Precio y billing	Página de precios del provider	Precio, crédito, mínimos y dueño de factura cambian
Contexto y límites	Model card o dashboard del provider	El límite práctico puede ser distinto
Tools, vision, JSON, streaming	Capability docs del provider	La envoltura puede soportar solo parte de la API
Data policy	Terms y product docs del provider	El nombre del modelo no responde cómo se tratan datos
API gratuita	Página actual del route owner	Gratis, ilimitado y garantía cambian rápido

Si una página dice “API gratuita de Kimi K2.6”, úsala como pista, no como prueba. Puede servir para un experimento de bajo riesgo. Para producción, no publiques ni dependas de promesas de gratis, ilimitado, no-ban, refund, uptime o garantía sin evidencia actual del dueño de la ruta.

Kimi frente a Claude es otra decisión

Algunos lectores llegan a K2.6 porque lo vieron como alternativa a Claude Code, Opus u otro flujo de programación. Esa comparación es legítima, pero no decide el model ID. La decisión de ruta de Kimi separa kimi-k2.6, kimi-k2.5, kimi-k2-thinking, base URL oficial, alias de provider y tratamiento del thinking.

Una comparación con Claude debe medir workflow fit, coding reliability, tool use, agent loops, latency, cost, failure recovery y comportamiento en repositorios reales. Cambiar el model string por entusiasmo de benchmark no es una migración; es un riesgo de routing.

Mantén la frontera así:

Para elegir un string Kimi, usa la tabla de rutas.
Para evaluar reemplazo de Claude, ejecuta un benchmark con las mismas tareas.
Para usar provider, verifica la ruta antes de comparar calidad de modelos.
Para documentación de producción, escribe official model ID y route owner juntos.

Checklist de producción

Antes de enviar una integración Kimi K2-family, deja estos valores en el repositorio o runbook:

Campo	Buena nota de producción
Target oficial	`kimi-k2.6`, `kimi-k2.5` o `kimi-k2-thinking` con motivo
API owner	Kimi/Moonshot official API o provider route concreto
Base URL	`https://api.moonshot.ai/v1` o endpoint del provider
Checked date	Fecha de revisión de model list, precio, context y limits
Thinking behavior	off, on, default o dedicated model route
Reasoning handling	Si el cliente conserva `reasoning_content`
Provider caveat	Alias, billing, limits, capabilities y data policy
Stop rule	No usar free, unlimited, no-ban o guarantee sin owner proof

La tabla parece básica, pero evita que un model string sobreviva meses sin dueño claro. Cuando haya que migrar, depurar o cambiar de provider, la decisión estará escrita.

FAQ

¿Para una integración nueva debo usar `kimi-k2.6`?

Sí, si usas la API oficial de Kimi y no tienes una razón específica para conservar K2.5, llamar kimi-k2-thinking o usar un alias de provider.

¿`kimi-k2-thinking` es lo mismo que el modo thinking de K2.6?

No. kimi-k2-thinking es un model ID separado. El thinking behavior de K2.6 o K2.5 depende de settings de request y manejo de response.

¿Sigue valiendo la pena probar Kimi K2.5?

Sí, cuando necesitas comportamiento K2.5, compatibilidad o una baseline antigua. No debería ser el default de una integración oficial nueva sin una razón escrita.

¿Puedo usar una API gratuita de Kimi K2.6?

Quizá para una prueba de bajo riesgo, si el route owner muestra condiciones actuales. No uses promesas de gratis, ilimitado, no-ban, uptime, refund o garantía sin evidencia actual.

¿Qué hago con strings antiguos `kimi-k2`?

Busca en configs, wrappers, ejemplos y provider settings. Mueve nuevas rutas oficiales a K2.6, conserva K2.5 si hay comparación, usa kimi-k2-thinking solo para el modelo dedicado y mapea aliases de provider por separado.

Kimi K2.6 API, K2.5 y K2 Thinking: qué model ID debes usar

Contenido

La primera decisión es el model ID

Empieza por la ruta oficial

K2 Thinking no es cualquier modo de thinking

Los strings K2 antiguos necesitan una regla de migración

Las rutas de providers y API gratuita se verifican por dueño

Kimi frente a Claude es otra decisión

Checklist de producción

FAQ

¿Para una integración nueva debo usar `kimi-k2.6`?

¿`kimi-k2-thinking` es lo mismo que el modo thinking de K2.6?

¿Sigue valiendo la pena probar Kimi K2.5?

¿Puedo usar una API gratuita de Kimi K2.6?

¿Qué hago con strings antiguos `kimi-k2`?

Etiquetas

Compartir este artículo

Artículos relacionados

Jailbreak del generador de imágenes de Grok: qué no intentar y qué ruta segura elegir

Costo de un video Grok Imagine en créditos: API oficial y créditos de plataformas

Fondo para foto profesional: como elegirlo para LinkedIn, CV, equipo y edicion con IA

Contenido

La primera decisión es el model ID

Empieza por la ruta oficial

K2 Thinking no es cualquier modo de thinking

Los strings K2 antiguos necesitan una regla de migración

Las rutas de providers y API gratuita se verifican por dueño

Kimi frente a Claude es otra decisión

Checklist de producción

FAQ

¿Para una integración nueva debo usar kimi-k2.6?

¿kimi-k2-thinking es lo mismo que el modo thinking de K2.6?

¿Sigue valiendo la pena probar Kimi K2.5?

¿Puedo usar una API gratuita de Kimi K2.6?

¿Qué hago con strings antiguos kimi-k2?

Etiquetas

Compartir este artículo

Artículos relacionados

Jailbreak del generador de imágenes de Grok: qué no intentar y qué ruta segura elegir

Costo de un video Grok Imagine en créditos: API oficial y créditos de plataformas

Fondo para foto profesional: como elegirlo para LinkedIn, CV, equipo y edicion con IA

¿Para una integración nueva debo usar `kimi-k2.6`?

¿`kimi-k2-thinking` es lo mismo que el modo thinking de K2.6?

¿Qué hago con strings antiguos `kimi-k2`?