Все статьи
Claude CodeCodexАвтоматизацияSkillsГайд

Сценарии использования Claude Code и Codex за пределами обычного кодинга

Omni Router

AI-агенты

Большинство разработчиков используют Claude Code для рефакторинга и написания функций. Codex — для фич и багфиксов. Это работает, но можно найти новые сценарии.

Реальная мощь AI-агентов открывается, когда вы начинаете воспринимать их как универсальных автономных исполнителей, способных делать всё, что можно описать в терминале. Идеи материализуются почти со скоростью мысли: между “а что если…” и работающим прототипом — минуты, не дни. Ограничение только одно — ваша фантазия.


Web-исследования на автопилоте

Запустить Claude Code с web-поиском и делегировать ему сбор информации — очевидный сценарий. Неочевидное: насколько глубоко он может копать. (буквально deep research у вас дома)

Пример: Анализ конкурентов с pricing-таблицами

claude

> Найди 10 SaaS-сервисов для управления проектами, запущенных
> в 2024-2026. Для каждого собери: ценообразование (все тарифы), ключевын фичи,
> технический стэк, финансирование
> Сохрани в markdown файле: saas-analysis.md

Claude Code использует встроенные сервисы web-поиск, посещает сайты, парсит страницы, проверяет Crunchbase и прочие базы для данных о финансировании. Результат — структурированный отчёт за 5-10 минут.

Где это работает:

  • Исследование трендов перед запуском продукта
  • Сбор кейсов для презентаций (“найди 20 компаний, которые мигрировали с Postgres на TimescaleDB”)
  • Технический due diligence (“проверь, какие CVE были у этой библиотеки за последний год”)

Research agents


Skills: расширяемость без лимитов

Claude Code поддерживает skills — кастомные инструкции, которые превращают агента в специалиста. Skills можно писать самому или искать готовые.

SEO-оптимизация контента

Skill seo-optimizer (гипотетический пример, но вы можете написать свой):

/seo-optimize blog/my-post.md --keyword "AI agents" --target-lang ru

Агент:

  1. Анализирует текущий контент
  2. Проверяет keyword density
  3. Генерирует meta description и title
  4. Добавляет internal links на релевантные статьи
  5. Форматирует headings для featured snippets

Генерация изображений

Skill для генерации изображений подключается к Nano Banana Pro (модель Gemini 3 Pro Image от Google DeepMind) и работает прямо из Claude Code:

/nanobanana "futuristic dashboard UI, dark theme,
high-quality digital art" --width 1920 --height 1080

Nano Banana Pro отлично рендерит текст на изображениях (вывески, диаграммы, mockups с реальным контентом), поддерживает 4K и понимает сложные составные промпты. Результат конвертируется в WebP автоматически. Идеально для прототипирования лендингов, hero images, инфографики.

Другие полезные skills:

  • better-icons — поиск иконок из 200+ библиотек (Iconify) и вставка SVG
  • threejs-* — целая серия skills для 3D-графики (geometry, shaders, lighting, loaders)
  • agent-browser — автоматизация браузера для тестирования и скрапинга
  • agent-pipeline — многоступенчатый pipeline (spec → plan → implementation → review)

Пентест и security audit

Запустить агента с задачей “найди уязвимости” звучит амбициозно, но работает лучше, чем кажется. Ключевое — давать конкретные задачи, а не абстрактное “проверь безопасность”.

Security testing

Статический анализ (SAST)

Агент читает код и ищет известные паттерны уязвимостей. Не замена специализированным сканерам вроде Semgrep, но хорошее дополнение — потому что агент понимает контекст.

claude

> Проведи security audit src/api/ по OWASP Top 10. Для каждой категории:
> 1. Broken Access Control — есть ли эндпоинты без проверки авторизации?
> 2. Injection — пользовательский ввод попадает в SQL/shell без санитизации?
> 3. Cryptographic Failures — захардкоженные секреты, слабые алгоритмы?
> 4. Security Misconfiguration — CORS *, debug mode в production?
> Для каждой находки: severity, файл, строка, PoC-запрос если применимо.
> Отчёт в security-audit.md

Что агент делает хорошо: связывает находки в цепочки. “Эндпоинт /api/users/:id не проверяет, что :id принадлежит текущему пользователю” + “поле email из этого эндпоинта используется в шаблоне письма без экранирования” = IDOR + потенциальный XSS. Человек может пропустить связь между двумя файлами в разных частях проекта, агент — нет, потому что он прочитал весь код.

Динамический анализ (DAST)

Через agent-browser или curl агент может гонять реальные запросы к dev-серверу:

> Подними dev-сервер (npm run dev) и протестируй все API-эндпоинты:
> - Попробуй SQL injection через параметры
> - Проверь, что rate limiting работает (отправь 100 запросов подряд)
> - Попробуй path traversal через file upload
> Логируй все запросы и ответы.

Аудит зависимостей

npm audit и cargo audit выдают список CVE. Агент идёт дальше — проверяет, какие из них реально эксплуатируемы в контексте вашего проекта:

> Запусти cargo audit. Для каждой найденной CVE проверь:
> используется ли уязвимая функция в нашем коде?
> Если да — предложи fix или workaround. Если нет — пометь как false positive.

Fuzzing

> Напиши property-based тесты для всех REST handlers в api/.
> Используй hypothesis для Python или fast-check для TypeScript.
> Сфокусируйся на edge cases: пустые строки, огромные числа,
> unicode, null bytes, SQL keywords в полях ввода.

Агент генерирует сотни тест-кейсов, которые человек не додумался бы написать. Нагрузочные тесты (k6, Locust) с реалистичными сценариями — тоже сюда.


API exploration и Explore-субагенты

Новый API, документация непонятная, примеров мало. Классическая ситуация.

Базовый сценарий: SDK из документации

> Изучи API документацию YooKassa (https://yookassa.ru/developers).
> Напиши TypeScript SDK для:
> - Создания платежа
> - Проверки статуса
> - Webhook verification
> - Auto-renewal через saved payment method
> Добавь примеры использования и error handling.

Агент читает docs через WebFetch, анализирует структуру запросов, генерирует типизированный клиент. Вы получаете SDK вместо копипасты curl-команд. Бонус: агент может протестировать API в sandbox-режиме (если есть тестовые ключи) и показать реальные ответы.

Explore-субагенты: параллельное исследование

Когда API большой, один агент будет последовательно ползти по документации. Explore-субагенты (subagent_type=Explore) решают это параллельностью.

Как они работают:

  • Запускаются через Task tool — несколько штук одновременно
  • Имеют доступ к поиску по файлам, grep, чтению, web-поиску — но не могут редактировать файлы
  • Каждый глубоко копает свою область, не засоряя основной контекст
  • Результат возвращается компактным саммари
> Изучи Stripe API. Запусти 3 explore-субагента параллельно:
> 1. Payment Intents — flow создания, подтверждения, 3D Secure
> 2. Webhooks — типы событий, верификация подписи, retry-политика
> 3. Customer + PaymentMethod — привязка карты, recurring billing
> Собери результаты в stripe-api-research.md с примерами запросов.

Три агента работают одновременно, каждый глубоко копает свою область. Результат — не поверхностный обзор, а детальное исследование за время, которое один агент потратил бы на треть работы.

Это же работает для исследования кодовых баз. Унаследовали проект на 200k строк без документации? Запустите explore-субагентов: один разбирает модели данных, другой — API-слой, третий — бизнес-логику. Через 5 минут у вас архитектурный обзор.

Reverse engineering чужих API

Когда документации нет или она врёт:

> Вот HAR-файл с трафиком мобильного приложения (traffic.har).
> Восстанови API-спецификацию:
> - Все эндпоинты с методами и параметрами
> - Формат авторизации (какие токены, где передаются)
> - Rate limits (если видно из заголовков)
> Сгенерируй OpenAPI spec.

Прототипы и MVP за минуты

Разрыв между задумкой и реализацией схлопнулся. “А что если сделать X?” → промпт → работающий код. Это меняет подход к валидации идей: вместо дней планирования — быстрый прототип и проверка на практике.

Кейс: Нужен landing для валидации идеи.

codex

> Создай Astro-сайт для SaaS "AI Email Assistant". Страницы:
> - Hero с value proposition
> - Features (3 блока)
> - Pricing (2 тарифа)
> - FAQ
> - Footer с email-формой (Mailchimp)
> Стиль: минимализм, Tailwind, тёмная тема. Деплой на Vercel.

Codex за 10-15 минут создаёт проект, пишет компоненты, настраивает Tailwind, добавляет форму с валидацией, коммитит, пушит, деплоит через Vercel CLI. Результат: рабочий сайт на your-project.vercel.app.

Быстрая проверка новой библиотеки:

> Создай минимальный пример использования Better Auth с OAuth
> (GitHub + Google), Drizzle ORM, и session management. Покажи
> полный setup для Next.js App Router.

Вместо чтения docs на 2 часа — готовый рабочий код за 5 минут.

CLI-утилиты на лету:

> Напиши CLI на Python: принимает CSV с заказами, группирует по городу,
> считает средний чек, шлёт отчёт в Telegram-бот. Click для аргументов.

Раньше это задача на день. Сейчас — на 5 минут.


Оркестрация агентов: multi-agent workflows

Один агент — это круто. Команда агентов, работающих параллельно — это уже конвейер.

Agent orchestration

Пример: Полный цикл фичи от spec до PR

# Включаем экспериментальные agent teams
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
claude

> Создай команду из 3 агентов для фичи "user profile avatars" с upload в S3:
> - Один для backend (API endpoints + S3 integration)
> - Один для frontend (Upload UI + preview component)
> - Один для testing (E2E и unit-тесты)
> Используй Sonnet для всех агентов.

Claude автоматически создаёт team, запускает субагентов через Task tool, создаёт общий список задач. Агенты координируются через SendMessage и распределённые задачи.

Как это работает:

  • TeamCreate/TeamDelete — создание и удаление команд
  • TaskCreate/TaskUpdate — управление задачами (status, dependencies, ownership)
  • SendMessage — прямые сообщения между агентами и broadcast
  • Display modes — in-process (Shift+Up/Down для переключения) или split panes (tmux/iTerm2)

Ограничение: агенты иногда конфликтуют при одновременном редактировании одного файла. Разделяйте зоны ответственности чётко. Agent teams — экспериментальная фича, требует CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1.


Claude Code в CI/CD

Claude Code работает не только локально в терминале. Его можно встроить в CI/CD pipeline — и тогда агент становится частью вашего процесса разработки: ревьюит PR, генерирует changelog, запускает security-аудит при каждом пуше.

Пример: автоматический code review в GitHub Actions

- name: Claude Code Review
  run: |
    claude -p "Проверь diff этого PR. Найди баги, проблемы
    с безопасностью, нарушения code style. Если всё ок — напиши
    короткий approve-комментарий. Если нет — перечисли проблемы
    с указанием файлов и строк." --output-format json

Другие сценарии в CI:

  • Автогенерация release notes из коммитов между тегами
  • Проверка миграций БД на обратную совместимость
  • Линтинг документации (“проверь, что все публичные функции задокументированы”)
  • Security audit при каждом PR (по модели из секции про пентест выше)

Провайдеры: не только Anthropic API

Claude Code по умолчанию ходит в Anthropic API, но можно направить его через прокси на альтернативных провайдеров. Это полезно, когда нужны другие модели, ниже цена, или доступ из региона с ограничениями.

Omnirouter работает как прокси между Claude Code и провайдером. Подключаете свой API-ключ (Anthropic, OpenRouter, или OAuth от подписки Claude Pro/Max) — и используете через единый endpoint. Настройка — одна переменная:

export ANTHROPIC_BASE_URL=https://api.omnirouter.ru
export ANTHROPIC_API_KEY=omni_***
claude

Через Omnirouter также доступны сторонние провайдеры:

  • Kimi — дешёвый доступ к Claude-моделям, хорошие лимиты
  • Z.ai — ещё один Anthropic-совместимый провайдер
  • OpenRouter — агрегатор с десятками моделей, pay-per-use
  • Chutes — бюджетный вариант для экспериментов

Каждый провайдер — это просто API-ключ в настройках Omnirouter. Переключение между ними — без изменений в коде или CI-конфиге.


Ещё сценарии

Миграция между стеками

Не просто “перепиши с PHP на Go”, а осмысленная миграция с сохранением поведения:

> Мигрируй Express.js API (src/api/) на Elysia.
> Сохрани все эндпоинты, middleware, валидацию.
> Замени Joi на Zod, express-session на Better Auth.
> Покажи diff в поведении, если есть.

Анализ логов и разбор инцидентов

3 часа ночи, сервис лежит, в логах каша:

> Вот лог из production (logs/error-2026-02-11.log).
> Найди root cause падения между 02:15 и 02:30 UTC.
> Проверь, какие коммиты были задеплоены за последние 24 часа.
> Предложи fix.

Агент фильтрует шум, сопоставляет timestamp ошибок с git log, находит проблемный коммит.

Оптимизация SQL и схемы БД

> Вот EXPLAIN ANALYZE медленных запросов (slow-queries.sql).
> Предложи индексы. Найди N+1 в Prisma-коде (src/db/).
> Проверь, есть ли смысл в materialized views для дашборда.

Генерация инфраструктуры

Terraform, Docker Compose, Kubernetes — всё, что описывается декларативно:

> Напиши Terraform для AWS:
> - ECS Fargate (2 сервиса: API + worker)
> - RDS PostgreSQL (Multi-AZ)
> - ALB с SSL
> - VPC с private/public subnets
> Используй модули, не хардкодь ресурсы.

Генерация датасетов для ML

> Создай synthetic dataset для sentiment analysis.
> 10,000 отзывов о ресторанах (русский язык).
> Колонки: text, rating (1-5), sentiment (positive/negative/neutral).
> Сохрани в CSV.

Документация из кода

> Сгенерируй API reference из TypeScript types в src/api/.
> Формат: Markdown с примерами запросов для каждого endpoint.
> Добавь mermaid-диаграмму для authentication flow.

DevOps-автоматизация

> Напиши GitHub Actions workflow:
> - Run tests on PR
> - Build Docker image
> - Push to registry (только main branch)
> - Deploy на staging (auto), production (manual approval)

Локализация

> Переведи все i18n-ключи из locales/en.json на русский, немецкий,
> испанский. Тон: неформальный, для B2C SaaS.
> Проверь, что все переменные ({{name}}) на месте.

Парсинг и трансформация данных

> В data/invoices/ лежат 200 PDF-счетов от разных поставщиков.
> Извлеки из каждого: номер, дату, сумму, ИНН, позиции.
> Сохрани в CSV. Пометь файлы, которые не удалось распарсить.

Боты за вечер

Telegram-бот, Discord-бот, Slack-бот. Агент знает API всех платформ, подключает webhook, деплоит. От идеи до работающего бота — один промпт.

Mock-серверы для фронтенда

> Из openapi.yaml сгенерируй mock-сервер на Express.
> Каждый эндпоинт возвращает реалистичные данные (не просто {}).
> Поддержи пагинацию и фильтрацию где указано в спеке.

Фронтенд-команда не ждёт, пока бэкенд допилит API.


Порог входа: почти нулевой

Отдельно стоит сказать вот что: AI-агенты радикально снижают порог входа в разработку.

Человек без опыта в программировании может собрать работающего Telegram-бота, лендинг, CLI-утилиту, автоматизацию для своего бизнеса. Не потому что агент пишет идеальный код — а потому что он берёт на себя всю механику: синтаксис, конфигурацию, зависимости, деплой. Вам остаётся только описать что вы хотите.

Для опытных разработчиков эффект другой: задачи, которые раньше были “можно, но лень настраивать” (Terraform, CI/CD, browser extension, data pipeline) — теперь делаются за один промпт. Зона того, что реально сделать за вечер, выросла в разы.


Без тестов это карточный домик

Карточный домик из кода

Легко увлечься скоростью и забыть про проверку. Агент написал 500 строк за 3 минуты — кажется, что всё работает. Но без верификации вы строите на песке.

Правило: каждый значимый результат агента должен быть проверен — тестами, другим агентом, или вручную. Проект без тестов, собранный AI-агентами, развалится при первом же изменении.

Что помогает:

  • Тесты как часть промпта. Не “напиши функцию X”, а “напиши функцию X и unit-тесты к ней”. Агент пишет тесты, запускает, видит красные — и чинит код сам.
  • Ревью агентом-рецензентом. Один агент пишет код, второй (или тот же, но отдельным промптом) проверяет: ищет edge cases, проверяет error handling, сверяет с документацией. В Claude Code для этого есть /review и code-reviewer-committer субагент.
  • CI как страховка. Линтер, тесты, type checker в GitHub Actions ловят то, что вы пропустили. Агент сгенерировал код с ошибкой типов — CI не пустит в main.
  • Не доверяйте слепо. Агент может уверенно написать код, который компилируется, проходит очевидные тесты — и содержит тонкий баг в бизнес-логике. Чем критичнее код, тем внимательнее ревью.

Скорость AI-агентов — это суперсила, но только в паре с проверкой. Быстро написать и быстро сломать — не одно и то же.


Почему это работает (и где ломается)

Работает, когда:

  • Задача чётко сформулирована (“создай X с параметрами Y”)
  • Есть примеры или документация для reference
  • Агент может проверить результат (тесты, линтеры, компиляция)

Ломается, когда:

  • Требуется креативность высокого уровня (дизайн brand identity, UX-стратегия)
  • Нужен domain expertise, которого нет в training data
  • Задача слишком расплывчата (“сделай лучше”)

AI-агенты — не замена мышлению, а усилитель исполнения. Вы придумываете что делать, агент делает это на порядок быстрее.


С чего начать

  1. Попробуйте один нестандартный сценарий — не рефакторинг, а что-то из списка выше
  2. Изучите skills/help skills в Claude Code, поищите готовые в GitHub
  3. Автоматизируйте одну рутинную задачу — что вы делаете раз в неделю и ненавидите?
  4. Не забывайте про тесты — после каждого значимого изменения: регрессия бизнес-логики, новые тесты, DRY/KISS/YAGNI
  5. Попробуйте explore-субагентов — для исследования нового API или чужой кодовой базы

Единственный лимит — ваша фантазия. И, конечно, API rate limits. Но это уже другая история.