vMira 5.2 — пост-тренинг-апдейт поверх 5.1. Та же базовая модель, то же длинноконтекстное поведение, та же мультимодальность — но переработанный пайплайн пост-тренинга, расширенный набор русскоязычных reasoning-данных и калибровка под задачи, в которых модель публично оценивается. Это самая сильная русскоязычная сборка vMira на сегодняшний день.
5.2 — релиз про качество. Архитектура и развёртывание не меняются: те же базовые компоненты, что у 5.1, те же тарифы, те же сборки. Что изменилось — пост-тренинг-пайплайн: расширенный набор русскоязычных reasoning-данных, более строгая фильтрация награды и обновлённая стадия alignment, заметно лучше работающая на задачах с цепочкой рассуждений.
Этот пост — про что улучшилось и как развернуть 5.2 поверх существующей интеграции 5.1 без переписывания клиентского кода.
Что изменилось в 5.2
Развёртывание drop-in для существующих клиентов: тот же model identifier (`mira` для базовой модели, `mira-thinking` для рассуждающей сборки), та же тарификация, тот же формат `model_meta`, тот же набор хостинг-регионов. Улучшения сосредоточены в **пост-тренинге**. Три направления дали наибольший прирост. **Русскоязычное рассуждение** — расширен набор данных, включая структурный юридический разбор и фактологическую проверку на материале российских корпоративных и нормативных текстов. **Код** — расширено покрытие инструктивных задач, калибровка отказов скорректирована, чтобы модель чаще предлагала рабочее решение, чем декларировала проблему. **Многошаговая логика** — стадия alignment теперь дополнительно вознаграждает следы, в которых промежуточные утверждения переживают финальный ответ.
Пост-тренинг
Пайплайн тот же, что в 5.1, но каждый этап получил конкретные улучшения. Supervised fine-tuning прошёл на расширенной курированной смеси с большей долей русскоязычных reasoning-данных, кодовых задач с проверяемыми тестами и целевой калибровки под публичные русскоязычные категории оценки. Стадия alignment использует более строгую функцию награды, учитывающую согласованность следа и финального ответа. Качество подготовки данных улучшено за счёт более жёсткой фильтрации наградой.
Контекст и мультимодальность
Без изменений относительно 5.1: 262 144 токена нативного контекста, расширение до 1 миллиона токенов для специализированных нагрузок, та же голова ввода изображений, та же поддержка ordered-image-sequence для покадрового рассуждения. Если 5.1 у вас уже работала на длинных документах или мультимодальных запросах — 5.2 будет работать ровно так же, только точнее на контенте, требующем рассуждения.
Совместимость с 5.1
5.2 полностью drop-in поверх 5.1 на API-уровне. Тот же эндпоинт, те же параметры, тот же формат ответа, тот же блок `reasoning` для thinking-сборки. Существующая интеграция продолжит работать без изменений; единственное, что мы рекомендуем сделать — перепрогнать ваш eval-сет, потому что числа на новой сборке будут другие (как правило, лучше). Для клиентов, которые пинят на конкретный хеш сборки — старый хеш 5.1 остаётся живым ещё шесть месяцев, поэтому миграция происходит на ваших условиях.
Развёртывание
Без изменений относительно 5.1. **Хостинговый API** работает в нашем московском дата-центре, тарификация по токенам в рублях или долларах. **Приватное развёртывание в регионе РФ** доступно по отдельному SLA, с первичным сбором персональных данных внутри России в соответствии с 152-ФЗ. **On-premise сборка** — компактный пакет, который запускается на одном современном Linux-сервере с одним потребительским GPU. Профиль пропускной способности и совместимость с существующей интеграцией — без изменений относительно 5.1.
Где модель не справляется
Список ограничений 5.1 в основном переносится на 5.2 без изменений. Мы зафиксировали то, что улучшилось, и то, что осталось:
- Дата отсечки знаний: март 2026 (та же, что у 5.1). Для актуальной фактологии включайте веб-поиск или режим цитирования API.
- Галлюцинации: уменьшились примерно на 18% относительно 5.1 на нашем внутреннем фактологическом наборе, но не устранены. Для критичной к фактам работы режим цитирования по-прежнему нужен.
- Арифметика на многих разрядах: без режима рассуждений по-прежнему хрупка. С vMira Thinking — заметно лучше; для задач с цифрами включайте `reasoning.effort: medium` или выше.
- Покрытие региональных диалектов: то же, что у 5.1. Добавление новых языков народов Федерации идёт отдельной серией релизов.
- Ввод изображений: ориентирован на текст и документы. Photo-grounded рассуждение по-прежнему не поддерживаемый сценарий.
“Архитектура — это потолок, пост-тренинг — то, насколько близко к нему подбирается модель. 5.2 — про то, что мы подобрались ближе.”
Разработчикам
На API ничего не меняется: тот же `mira`, тот же `mira-thinking`, та же сигнатура запроса, тот же формат `model_meta` с новым хешем сборки. Существующие клиенты автоматически получают 5.2 на запросах без явного pin'а; те, кто пинит на хеш — продолжают получать 5.1 без изменений. SDK на Python, TypeScript, Go и Rust обновлены; релиз-нот фиксирует точные дельты. Корпоративные клиенты с приватными эндпоинтами могут запросить миграцию по своему расписанию через своего account manager'а.
Почему пост-тренинг, а не новая базовая модель
Каждые две-три модели мы стоим перед выбором: новая базовая или ещё один пост-тренинг-проход. 5.2 — пост-тренинг-проход, и это сознательное решение. Большой архитектурный апгрейд (то, что станет 6.0) требует месяцев работы и нелинейных рисков на качестве. Пост-тренинг-проход проходит существенно быстрее, имеет предсказуемые дельты и не ломает существующих интеграций. На российском рынке, где клиенты часто привязаны к контрактам с фиксированной моделью на квартал-полгода, drop-in-релизы — то, что нужно сейчас. Большая базовая модель придёт следующей.
Публичная оценка
Мы прогнали 5.2 на стандартном открытом наборе категорий русскоязычной оценки, поддерживаемом независимой командой. Результаты находятся на модерации у операторов оценки — по их процедуре публикация происходит после проверки сабмита. Когда они опубликуют, мы обновим этот пост и приведём конкретные числа по категориям. До того момента мы сознательно воздерживаемся от публикации внутренних оценок — наша же редакционная политика требует, чтобы первые публикуемые числа были числами независимой оценки.
Что мы НЕ улучшили
Пост-тренинг даёт прирост ровно там, где он целенаправленно вкладывается. Скорость инференса не изменилась — тот же базовый стек, та же модель в памяти. Размер контекста не изменился — 262K натив, 1M с расширением. Голова ввода изображений не переучивалась — улучшения там придут со следующей базовой моделью. Если ваш use-case упирается в один из этих параметров, 5.2 не даст вам ничего нового.
Миграция
Большинство клиентов получат 5.2 автоматически без изменений в коде — переключение прозрачное на стороне сервинга. Если у вас захардкожен hash сборки — старый hash 5.1 остаётся валидным ещё шесть месяцев, после чего автоматически роутится на 5.2. Клиенты с приватным развёртыванием получают обновлённый образ через своего account manager'а на своих условиях. On-premise сборка обновляется через стандартный механизм релизов; задавайте `model: "mira-5.2"` в config или продолжайте использовать `mira` для автоматического обновления.