
Что такое Kimi K2.5 и Moonshot AI
Kimi K2.5 — флагманская открытая модель от китайской ИИ-лаборатории Moonshot AI (月之暗面), основанной в 2023 году. Релиз состоялся в январе 2026 года и сразу привлёк внимание сообщества: K2.5 стала самой мощной открытой моделью на момент выхода.
Модель построена на архитектуре Mixture-of-Experts (MoE) с 1 триллионом параметров, при этом активируется лишь 32 миллиарда на каждый токен — это позволяет эффективно использовать ресурсы без потери качества. Обучена на 15 триллионах смешанных визуальных и текстовых токенов поверх базовой модели Kimi K2.
Архитектура и технические характеристики
| Параметр | Значение |
|---|---|
| Архитектура | Mixture-of-Experts (MoE) |
| Всего параметров | 1 трлн |
| Активных параметров | 32 млрд на токен |
| Контекстное окно | 256K токенов |
| Количество слоёв | 61 (1 dense + 60 MoE) |
| Экспертов | 384 (8 на токен + 1 shared) |
| Размер скрытого слоя | 7168 |
| Визуальный энкодер | MoonViT (400M параметров) |
Роутинг MoE активирует топ-8 наиболее релевантных экспертов для каждого токена плюс один shared-эксперт, обеспечивая баланс специализации и стабильности.
Ключевые возможности
Нативная мультимодальность
Впервые в линейке Kimi модель нативно поддерживает изображения и видео. Модель предобучена на смешанных vision-language токенах и способна:
- Анализировать изображения и видео
- Генерировать код по визуальным спецификациям (UI-дизайны, видео-воркфлоу)
- Использовать инструменты на основе визуальных входных данных
На бенчмарке MMMU Pro модель набирает 75%, что сопоставимо с GPT-5.2 и Claude Opus 4.5.
Agent Swarm — рой агентов
Самая примечательная фича K2.5 — Agent Swarm. Для сложных задач модель самостоятельно создаёт и оркестрирует до 100 специализированных суб-агентов, работающих параллельно:
- До 1500 одновременных вызовов инструментов
- Ускорение выполнения в 4.5 раза по сравнению с single-agent
- Автоматическое создание workflow без предварительной настройки
Технология основана на PARL (Parallel Agent Reinforcement Learning) — методике обучения параллельным агентским цепочкам.
Coding with Vision
K2.5 демонстрирует лучшие среди открытых моделей способности к программированию:
- Генерация интерфейсов из простых текстовых описаний
- Воспроизведение сложных веб-сайтов и 3D-эффектов по видео
- Параллельная обработка множественных кодовых задач
Бенчмарки
Рационирование и математика
| Бенчмарк | Kimi K2.5 | GPT-5.2 (xhigh) | Claude 4.5 Opus | Gemini 3 Pro |
|---|---|---|---|---|
| AIME 2025 | 96.1 | 100 | 92.8 | 95.0 |
| HMMT 2025 | 95.4 | 99.4 | 92.9 | 97.3 |
| GPQA-Diamond | 87.6 | 92.4 | 87.0 | 91.9 |
| HLE-Full (с инструментами) | 50.2 | 45.5 | 43.2 | 45.8 |
Кодинг и агентские задачи
| Бенчмарк | Kimi K2.5 | GPT-5.2 | Claude 4.5 Opus | Gemini 3 Pro |
|---|---|---|---|---|
| SWE-Bench Verified | 76.8 | 80.0 | 80.9 | 76.2 |
| LiveCodeBench v6 | 85.0 | - | 82.2 | 87.4 |
| BrowseComp (Swarm) | 78.6 | - | 81.9 | - |
Мультимодальность
- MMMU Pro: 75% (на уровне GPT-5.2)
- HLE-Image (с инструментами): 39.8%
На Humanity’s Last Exam (HLE) Kimi K2.5 показывает феноменальный результат 50.2% с использованием инструментов — лучший среди всех моделей.
Цены и доступ к API
Kimi K2.5 доступна через несколько каналов:
Официальный API Moonshot AI
| Модель | Вход (за 1M токенов) | Выход (за 1M токенов) |
|---|---|---|
| kimi-k2.5 | ~$0.60 | ~$3.00 |
- Контекст: до 256K токенов
- Поддержка JSON mode, function calling, streaming
- Web search и другие инструменты
OpenRouter
На OpenRouter цены аналогичны:
- Input: $0.45–0.60 за 1M токенов
- Output: $2.25–3.00 за 1M токенов
- 262K контекст
Это в 4-5 раз дешевле, чем Claude Opus 4.5 и GPT-5.2 на том же OpenRouter.
Бесплатный доступ
NVIDIA предоставляет бесплатный доступ к Kimi K2.5 через NIM API на build.nvidia.com — отличная возможность протестировать модель без затрат.
Режимы работы
| Режим | Описание |
|---|---|
| K2.5 Instant | Быстрые ответы для простых задач |
| K2.5 Thinking | Глубокое рассуждение перед ответом |
| K2.5 Agent | Предустановленный режим с инструментами |
| K2.5 Agent Swarm | Бета-режим с роем агентов (до 100 параллельных агентов) |
Использование с Anthropic API
Kimi K2.5 совместима с Anthropic API через OpenRouter и другие провайдеры. Формат запросов:
curl -N -H "Authorization: Bearer sk-or-v1-..." \
-H "Content-Type: application/json" \
-d '{
"model": "moonshotai/kimi-k2.5",
"messages": [{"role": "user", "content": "Hi"}],
"stream": true
}' \
https://openrouter.ai/api/v1/chat/completions
Работает с Claude Code, Cline, Roo Code и другими инструментами через Omni Router.
Кому подходит Kimi K2.5
Идеально для:
- Разработчиков, нуждающихся в помощи с фронтендом и UI
- Сложных агентских workflow с параллельными задачами
- Мультимодальных приложений (анализ скриншотов, видео)
- Длинного контекста (256K — классический вариант для книг и кодовых баз)
Стоит учитывать:
- Китайская компания — для чувствительных данных выбирайте другие модели
- Agent Swarm пока в бета — не для продакшена критических систем
- Производительность на англоязычных задачах может отличаться от англоязычных моделей
Итог
Kimi K2.5 — прорыв в мире открытых моделей. Это первая open-source модель, которая:
- Нативно поддерживает мультимодальность на уровне топовых проприетарных моделей
- Предлагает уникальную технологию роя агентов
- Показывает лидирующие результаты на кодинг-бенчмарках
- Доступна за $0.60–3.00 за миллион токенов (в 4-5 раз дешевле Claude/GPT)
Для разработчиков, которым нужны мощные агентские возможности и визуальный кодинг — must try.