Все статьи
KimiMoonshot AIОбзорМультимодальность

Kimi K2.5: обзор флагманской модели Moonshot AI

Omni Router

Kimi K2.5 обзор

Что такое Kimi K2.5 и Moonshot AI

Kimi K2.5 — флагманская открытая модель от китайской ИИ-лаборатории Moonshot AI (月之暗面), основанной в 2023 году. Релиз состоялся в январе 2026 года и сразу привлёк внимание сообщества: K2.5 стала самой мощной открытой моделью на момент выхода.

Модель построена на архитектуре Mixture-of-Experts (MoE) с 1 триллионом параметров, при этом активируется лишь 32 миллиарда на каждый токен — это позволяет эффективно использовать ресурсы без потери качества. Обучена на 15 триллионах смешанных визуальных и текстовых токенов поверх базовой модели Kimi K2.

Архитектура и технические характеристики

ПараметрЗначение
АрхитектураMixture-of-Experts (MoE)
Всего параметров1 трлн
Активных параметров32 млрд на токен
Контекстное окно256K токенов
Количество слоёв61 (1 dense + 60 MoE)
Экспертов384 (8 на токен + 1 shared)
Размер скрытого слоя7168
Визуальный энкодерMoonViT (400M параметров)

Роутинг MoE активирует топ-8 наиболее релевантных экспертов для каждого токена плюс один shared-эксперт, обеспечивая баланс специализации и стабильности.

Ключевые возможности

Нативная мультимодальность

Впервые в линейке Kimi модель нативно поддерживает изображения и видео. Модель предобучена на смешанных vision-language токенах и способна:

  • Анализировать изображения и видео
  • Генерировать код по визуальным спецификациям (UI-дизайны, видео-воркфлоу)
  • Использовать инструменты на основе визуальных входных данных

На бенчмарке MMMU Pro модель набирает 75%, что сопоставимо с GPT-5.2 и Claude Opus 4.5.

Agent Swarm — рой агентов

Самая примечательная фича K2.5 — Agent Swarm. Для сложных задач модель самостоятельно создаёт и оркестрирует до 100 специализированных суб-агентов, работающих параллельно:

  • До 1500 одновременных вызовов инструментов
  • Ускорение выполнения в 4.5 раза по сравнению с single-agent
  • Автоматическое создание workflow без предварительной настройки

Технология основана на PARL (Parallel Agent Reinforcement Learning) — методике обучения параллельным агентским цепочкам.

Coding with Vision

K2.5 демонстрирует лучшие среди открытых моделей способности к программированию:

  • Генерация интерфейсов из простых текстовых описаний
  • Воспроизведение сложных веб-сайтов и 3D-эффектов по видео
  • Параллельная обработка множественных кодовых задач

Бенчмарки

Рационирование и математика

БенчмаркKimi K2.5GPT-5.2 (xhigh)Claude 4.5 OpusGemini 3 Pro
AIME 202596.110092.895.0
HMMT 202595.499.492.997.3
GPQA-Diamond87.692.487.091.9
HLE-Full (с инструментами)50.245.543.245.8

Кодинг и агентские задачи

БенчмаркKimi K2.5GPT-5.2Claude 4.5 OpusGemini 3 Pro
SWE-Bench Verified76.880.080.976.2
LiveCodeBench v685.0-82.287.4
BrowseComp (Swarm)78.6-81.9-

Мультимодальность

  • MMMU Pro: 75% (на уровне GPT-5.2)
  • HLE-Image (с инструментами): 39.8%

На Humanity’s Last Exam (HLE) Kimi K2.5 показывает феноменальный результат 50.2% с использованием инструментов — лучший среди всех моделей.

Цены и доступ к API

Kimi K2.5 доступна через несколько каналов:

Официальный API Moonshot AI

МодельВход (за 1M токенов)Выход (за 1M токенов)
kimi-k2.5~$0.60~$3.00
  • Контекст: до 256K токенов
  • Поддержка JSON mode, function calling, streaming
  • Web search и другие инструменты

OpenRouter

На OpenRouter цены аналогичны:

  • Input: $0.45–0.60 за 1M токенов
  • Output: $2.25–3.00 за 1M токенов
  • 262K контекст

Это в 4-5 раз дешевле, чем Claude Opus 4.5 и GPT-5.2 на том же OpenRouter.

Бесплатный доступ

NVIDIA предоставляет бесплатный доступ к Kimi K2.5 через NIM API на build.nvidia.com — отличная возможность протестировать модель без затрат.

Режимы работы

РежимОписание
K2.5 InstantБыстрые ответы для простых задач
K2.5 ThinkingГлубокое рассуждение перед ответом
K2.5 AgentПредустановленный режим с инструментами
K2.5 Agent SwarmБета-режим с роем агентов (до 100 параллельных агентов)

Использование с Anthropic API

Kimi K2.5 совместима с Anthropic API через OpenRouter и другие провайдеры. Формат запросов:

curl -N -H "Authorization: Bearer sk-or-v1-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonshotai/kimi-k2.5",
    "messages": [{"role": "user", "content": "Hi"}],
    "stream": true
  }' \
  https://openrouter.ai/api/v1/chat/completions

Работает с Claude Code, Cline, Roo Code и другими инструментами через Omni Router.

Кому подходит Kimi K2.5

Идеально для:

  • Разработчиков, нуждающихся в помощи с фронтендом и UI
  • Сложных агентских workflow с параллельными задачами
  • Мультимодальных приложений (анализ скриншотов, видео)
  • Длинного контекста (256K — классический вариант для книг и кодовых баз)

Стоит учитывать:

  • Китайская компания — для чувствительных данных выбирайте другие модели
  • Agent Swarm пока в бета — не для продакшена критических систем
  • Производительность на англоязычных задачах может отличаться от англоязычных моделей

Итог

Kimi K2.5 — прорыв в мире открытых моделей. Это первая open-source модель, которая:

  • Нативно поддерживает мультимодальность на уровне топовых проприетарных моделей
  • Предлагает уникальную технологию роя агентов
  • Показывает лидирующие результаты на кодинг-бенчмарках
  • Доступна за $0.60–3.00 за миллион токенов (в 4-5 раз дешевле Claude/GPT)

Для разработчиков, которым нужны мощные агентские возможности и визуальный кодинг — must try.

Попробовать Kimi K2.5 через Omni Router →