Kimi K2.5: обзор флагманской модели Moonshot AI

Kimi K2.5 обзор

Что такое Kimi K2.5 и Moonshot AI

Kimi K2.5 — флагманская открытая модель от китайской ИИ-лаборатории Moonshot AI (月之暗面), основанной в 2023 году. Релиз состоялся в январе 2026 года и сразу привлёк внимание сообщества: K2.5 стала самой мощной открытой моделью на момент выхода.

Модель построена на архитектуре Mixture-of-Experts (MoE) с 1 триллионом параметров, при этом активируется лишь 32 миллиарда на каждый токен — это позволяет эффективно использовать ресурсы без потери качества. Обучена на 15 триллионах смешанных визуальных и текстовых токенов поверх базовой модели Kimi K2.

Архитектура и технические характеристики

Параметр	Значение
Архитектура	Mixture-of-Experts (MoE)
Всего параметров	1 трлн
Активных параметров	32 млрд на токен
Контекстное окно	256K токенов
Количество слоёв	61 (1 dense + 60 MoE)
Экспертов	384 (8 на токен + 1 shared)
Размер скрытого слоя	7168
Визуальный энкодер	MoonViT (400M параметров)

Роутинг MoE активирует топ-8 наиболее релевантных экспертов для каждого токена плюс один shared-эксперт, обеспечивая баланс специализации и стабильности.

Ключевые возможности

Нативная мультимодальность

Впервые в линейке Kimi модель нативно поддерживает изображения и видео. Модель предобучена на смешанных vision-language токенах и способна:

Анализировать изображения и видео
Генерировать код по визуальным спецификациям (UI-дизайны, видео-воркфлоу)
Использовать инструменты на основе визуальных входных данных

На бенчмарке MMMU Pro модель набирает 75%, что сопоставимо с GPT-5.2 и Claude Opus 4.5.

Agent Swarm — рой агентов

Самая примечательная фича K2.5 — Agent Swarm. Для сложных задач модель самостоятельно создаёт и оркестрирует до 100 специализированных суб-агентов, работающих параллельно:

До 1500 одновременных вызовов инструментов
Ускорение выполнения в 4.5 раза по сравнению с single-agent
Автоматическое создание workflow без предварительной настройки

Технология основана на PARL (Parallel Agent Reinforcement Learning) — методике обучения параллельным агентским цепочкам.

Coding with Vision

K2.5 демонстрирует лучшие среди открытых моделей способности к программированию:

Генерация интерфейсов из простых текстовых описаний
Воспроизведение сложных веб-сайтов и 3D-эффектов по видео
Параллельная обработка множественных кодовых задач

Бенчмарки

Рационирование и математика

Бенчмарк	Kimi K2.5	GPT-5.2 (xhigh)	Claude 4.5 Opus	Gemini 3 Pro
AIME 2025	96.1	100	92.8	95.0
HMMT 2025	95.4	99.4	92.9	97.3
GPQA-Diamond	87.6	92.4	87.0	91.9
HLE-Full (с инструментами)	50.2	45.5	43.2	45.8

Кодинг и агентские задачи

Бенчмарк	Kimi K2.5	GPT-5.2	Claude 4.5 Opus	Gemini 3 Pro
SWE-Bench Verified	76.8	80.0	80.9	76.2
LiveCodeBench v6	85.0	-	82.2	87.4
BrowseComp (Swarm)	78.6	-	81.9	-

Мультимодальность

MMMU Pro: 75% (на уровне GPT-5.2)
HLE-Image (с инструментами): 39.8%

На Humanity’s Last Exam (HLE) Kimi K2.5 показывает феноменальный результат 50.2% с использованием инструментов — лучший среди всех моделей.

Цены и доступ к API

Kimi K2.5 доступна через несколько каналов:

Официальный API Moonshot AI

Модель	Вход (за 1M токенов)	Выход (за 1M токенов)
kimi-k2.5	~$0.60	~$3.00

Контекст: до 256K токенов
Поддержка JSON mode, function calling, streaming
Web search и другие инструменты

OpenRouter

На OpenRouter цены аналогичны:

Input: $0.45–0.60 за 1M токенов
Output: $2.25–3.00 за 1M токенов
262K контекст

Это в 4-5 раз дешевле, чем Claude Opus 4.5 и GPT-5.2 на том же OpenRouter.

Бесплатный доступ

NVIDIA предоставляет бесплатный доступ к Kimi K2.5 через NIM API на build.nvidia.com — отличная возможность протестировать модель без затрат.

Режимы работы

Режим	Описание
K2.5 Instant	Быстрые ответы для простых задач
K2.5 Thinking	Глубокое рассуждение перед ответом
K2.5 Agent	Предустановленный режим с инструментами
K2.5 Agent Swarm	Бета-режим с роем агентов (до 100 параллельных агентов)

Использование с Anthropic API

Kimi K2.5 совместима с Anthropic API через OpenRouter и другие провайдеры. Формат запросов:

curl -N -H "Authorization: Bearer sk-or-v1-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonshotai/kimi-k2.5",
    "messages": [{"role": "user", "content": "Hi"}],
    "stream": true
  }' \
  https://openrouter.ai/api/v1/chat/completions

Работает с Claude Code, Cline, Roo Code и другими инструментами через Omni Router.

Кому подходит Kimi K2.5

Идеально для:

Разработчиков, нуждающихся в помощи с фронтендом и UI
Сложных агентских workflow с параллельными задачами
Мультимодальных приложений (анализ скриншотов, видео)
Длинного контекста (256K — классический вариант для книг и кодовых баз)

Стоит учитывать:

Китайская компания — для чувствительных данных выбирайте другие модели
Agent Swarm пока в бета — не для продакшена критических систем
Производительность на англоязычных задачах может отличаться от англоязычных моделей

Итог

Kimi K2.5 — прорыв в мире открытых моделей. Это первая open-source модель, которая:

Нативно поддерживает мультимодальность на уровне топовых проприетарных моделей
Предлагает уникальную технологию роя агентов
Показывает лидирующие результаты на кодинг-бенчмарках
Доступна за $0.60–3.00 за миллион токенов (в 4-5 раз дешевле Claude/GPT)

Для разработчиков, которым нужны мощные агентские возможности и визуальный кодинг — must try.

Попробовать Kimi K2.5 через Omni Router →