ISO/IEC 42001 — это стандарт «системы менеджмента для ИИ» (AI Management System, AIMS), который закрепляет процессы, роли и артефакты для ответственной разработки и эксплуатации решений на искусственном интеллекте. Он не диктует конкретных моделей или библиотек: AIMS — это «каркас управления» над вашим техническим стеком. Если упростить, ISO 42001 делает с ИИ то, что ISO 27001 сделал с безопасностью: требует политики, владельцев, журналов событий, планов деградации и постоянного пост-мониторинга.
Для команд, работающих с крупными моделями LLM и генеративными системами генеративный ИИ, стандарт помогает превратить эксперименты в предсказуемый сервис. Ниже — инженерно-продуктовая призма, как вимпелы ISO/IEC 42001 «садятся» на ваш AI-стек и эксплуатацию inference-сервисов (профили, очереди, метрики).
Кому и зачем нужен ISO/IEC 42001
- Enterprise-продактам и платформам. Формализует «как мы делаем ИИ»: от целей и границ до гейтов релиза и журналов.
- Поставщикам ИИ-функций (API/SDK). Требует карточек моделей и инструкций для интеграторов, чтобы снизить риски downstream.
- Интеграторам LLM/GenAI в бизнес-процессы. Дисциплина логов, прозрачность, контроль «цены эпизода» и SLA.
- Юр./комплаенс-командам. Единый словарь ролей/процедур, интегрируемый с внешними рамками и корпоративными аудитами.
Итог: ISO 42001 — это про стандарты процессов, а не «бумагу ради галочки». Правильно внедрённая AIMS поднимает качество и экономику инференса.
Как устроен стандарт: логика AIMS (PDCA)
ISO/IEC 42001 следует циклу Plan–Do–Check–Act и требует:
- Контекст и границы. Описать, _где_ и _зачем_ применяется ИИ; какие ограничения и «не для того».
- Лидерство и роли. Назначить владельцев модели, данных, риска, SRE; утвердить политики ввода/вывода.
- Планирование рисков/целей. Определить риск-реестр, целевые метрики, пороги автo-отката.
- Поддержка. Компетенции, репозитории артефактов, доступы, лицензии.
- Операция. Релизы по гейтам, канарейки, профили инференса, пост-валидация контрактов.
- Оценка эффективности. Дешборды TTFT/P95/неформат/utility/«цена эпизода», отчёты релизов.
- Улучшение. Пост-мортемы, патчи, планы деградации, обновление риск-карты.
Для технической стороны эксплуатации см. также inference-стек.
Чем ISO 42001 отличается от «просто хорошей инженерии»
| Вопрос | «Просто делаем ИИ» | ISO/IEC 42001 (AIMS) |
| Назначение/границы | Частично в голове/Confluence | Формально утверждены, доступны всем |
| Роли | «Кто успел — тот владелец» | Владелец модели/данных/риска/SRE назначены |
| Релизы | «Выкатили — посмотрим» | Гейты, канарейки, план отката |
| Логи/версии | Частично | Полный трейсинг версий (модель/ретривер/шаблоны) |
| Метрики | «Смотрим на ощущения» | TTFT, P95, неформат, utility, «цена эпизода» |
| Риски | Реактивно | Риск-реестр, ревизии, ответственные |
| Документация | Спорадически | Карточка модели, data-manifest, release-notes |
AIMS узаконивает то, что и так необходимо для масштабируемого продукта.
Маппинг ISO/IEC 42001 на процессы LLM/GenAI
| Раздел AIMS | Что это в продукте на ИИ | Примеры артефактов/процедур |
| Контекст/границы | Use/Abuse-cases, «не для того» | Страница назначения; ограничения домена |
| Лидерство | Роли и ответственность | RACI; назначение владельцев |
| Планирование | Цели качества/безопасности/экономики | Пороги TTFT/P95/неформата; целевая «цена эпизода» |
| Поддержка | Навыки, лицензии, доступы | Регистр лицензий; обучение операторов |
| Операция | Релизы и эксплуатация | Канарейки, профили Light/Standard/Heavy, кэш префилла |
| Оценка | Измерение и отчётность | Дешборды, отчёт пост-мониторинга |
| Улучшение | Инциденты и патчи | Пост-мортемы, план деградации |
Для общей архитектуры см. AI-стек, а для сценариев поиска знаний — RAG.
Документация и артефакты, которые «просит» ISO 42001
* Политики ИИ. Цели, границы, принципы ввода/вывода, маркировка синтетики. * Карточка модели. Назначение, ограничения, версии, изменения, метрики до/после, известные риски. * Data-manifest. Источники, лицензии, чувствительность, даты обновления, ответственные. * Риск-реестр. Риск → мера смягчения → владелец → срок пересмотра. * Процедуры релизов. Гейты, канарейки, планы отката и деградации. * Журналы эксплуатации. Версии модели/ретривера/шаблонов, TTFT, P95, доля неформата, utility, «цена эпизода». * Инцидент-лог. Тип события, канал, статус, патч/деплой, коммуникация пользователям.
Эти артефакты хранятся в репозиториях и версионируются как код.
Роли и ответственность (минимальный состав)
| Роль | Зона ответственности | KPI/Артефакты |
| Владелец модели | Качество/безопасность модели и релизы | Карточка модели, эвалы, релиз-ноуты |
| Владелец данных | Источники/лицензии/обновляемость | Data-manifest, отчёты очистки |
| Владелец риска | Риск-реестр и ревизии | Протокол ревизий, матрица рисков |
| Продакт | Use-/Abuse-cases; критерии приёмки | Страница назначения, требования |
| SRE/Платформа | SLA/SLO, трейсинг, деградации | Дешборды, план отката |
| Безопасность/Право | Политики ввода/вывода, инциденты | Политики, пост-мортемы, отчёты |
Метрики «здоровья» AIMS для инференса
| Метрика | Что показывает | Зачем AIMS | Управленческий рычаг |
| TTFT | Время до первого токена | UX/отмены | Прогрев пулов, короткие шаблоны |
| P95 задержек | «Длинный хвост» | SLA и пиковая устойчивость | Разделение очередей, лимиты |
| Доля неформата | Невалидные JSON/таблицы | Ретраи/ручной труд | Контракты вывода, пред-валидация |
| Utility-скор | Прикладная полезность | Ценность релизов | Тюнинг шаблонов/ретривера |
| «Цена эпизода» | Полная себестоимость | FinOps и маржа | Кэш, квантизация, профили |
Метрики фиксируются в релиз-карточках и используются как гейты.
Контракты вывода и операционные профили
Контракты вывода (JSON/таблицы) — обязательный элемент AIMS: они уменьшают долю неформата и ускоряют отладку. Профили инференса — *Light / Standard / Heavy* с отдельными очередями. Смешение профилей ломает P95 и «цену эпизода».
*Практика:*
- Light — короткие ответы и инструменты.
- Standard — основной диалог.
- Heavy — длинные отчёты (в отдельной очереди).
Таблица: соответствие ISO 42001 ↔ NIST AI RMF (упрощённо)
| ISO/IEC 42001 | Эквивалентная функция | Что делать |
| Контекст/границы | Map | Use/Abuse-cases, манифест данных |
| Лидерство/политики | Govern | Роли, политики ввода/вывода, RACI |
| Метрики/эвалы | Measure | TTFT, P95, неформат, utility, «цена эпизода» |
| Операция/релизы | Manage | Канарейки, гейты, планы отката |
| Улучшение | Manage | Пост-мортемы, патчи, ревизии рисков |
Подробную рамку см. NIST AI RMF.
Подготовка к сертификации: 30/60/90 дней
Первые 30 дней (минимум AIMS)
- Назначены владельцы модели/данных/риска/SRE.
- Описаны Use-/Abuse-cases и границы применения.
- Заполнен data-manifest (источники, лицензии, чувствительность).
- Введены дешборды: TTFT, P95, неформат, utility, «цена эпизода».
- Включены контракты вывода и пред-валидация.
Дни 31–60 (операция и гейты)
- Заведены профили Light/Standard/Heavy и разделены очереди.
- Настроены канарейки и пороги автo-отката.
- Включён кэш префилла/эмбеддингов; короткие шаблоны.
- Выпущены политики ввода/вывода и маркировки синтетики.
Дни 61–90 (мониторинг и улучшение)
- Регулярные ревизии риск-реестра.
- Пост-мортемы инцидентов и план деградации.
- Репозитории артефактов: карточка модели, release-notes, отчёты эвалов.
- Подготовка к внешнему аудиту: выбор пилотного кейса, бэкап-артефактов.
Таблица: гейты релиза в AIMS
| Этап | Критерий «пропуска» | Артефакты |
| Pre-prod | Эвалы ≥ порога, неформат ≤ целевого | Карточка модели, отчёт эвалов |
| Канарейка | Δutility ≥ 0; TTFT/P95 в пределах | Логи канареек, план отката |
| Прод | SLO стабилен N дней | Дешборды, релиз-ноуты |
| Пост-мониторинг | Нет инцидентов выше порога | Отчёт пост-мониторинга |
Риск-менеджмент в духе ISO 42001 (что реально внедрить)
* Идентификация. Галлюцинации, утечки PII, смещения, prompt-инъекции, дрейф данных, взрыв стоимости. * Оценка. Матрица «вероятность × влияние», владелец риска, дата пересмотра. * Меры. Контракты вывода, RAG-санкбоксы, фильтры ввода, лимиты длины, кэш, квоты, версионирование. * Мониторинг. Алерты по P95/неформату/цене эпизода; отчёт инцидентов; ретроспективы.
(Технические термины и пайплайны поиска знаний — см. RAG.)
Частые ошибки при внедрении AIMS и как их чинить
| Ошибка | Проявление | Исправление |
| Нет границ применения | «Модель для всего», жалобы, регресс | Use/Abuse-cases; страница ограничений |
| Одна очередь на всё | Пики P95, нестабильный UX | Профили и разделение очередей |
| Свободный текст всегда | Неформат, ретраи | Контракты JSON, пред-валидация |
| Без версий и артефактов | Нечем защищаться на аудите | Репозитории: карточка, data-manifest, релиз-ноуты |
| Нет планов деградации | Падение качества = простой | Fallback-профили, лимиты, безопасные шаблоны |
Интеграция AIMS со стеком разработки и эксплуатации
- CI/CD. Гейты релиза, проверка схем JSON, smoke-тесты профилей.
- Обучение команды. База знаний: артефакты AIMS, чек-листы релизов, «золотой набор».
- Партнёры и клиенты. Перед релизом — public-карточка модели, инструкции для интеграторов, ограничения использования.
- Экономика. Еженедельный отчёт о «цене эпизода» и корреляции с P95/отменами.
FAQ
Это «бумажная» сертификация или про реальную инженерию? Про инженерию. ISO 42001 проверяет, что у вас есть и работают роли, артефакты, метрики и процессы: без них продукт на ИИ нестабилен и дорог.
Если мы используем стороннюю LLM через API — мы подпадаем? Да, как внедряющая сторона. Вы отвечаете за границы применения, логи, прозрачность для пользователя, профили и планы деградации.
Как ISO 42001 соотносится с NIST AI RMF? AI RMF — «как управлять рисками»; ISO 42001 — «как построить систему менеджмента». Они совместимы: см. таблицу маппинга выше и страницу NIST AI RMF.
Нужно ли всё сразу для старта? Нет. Начните с минимума: роли, границы, метрики TTFT/P95/неформат/utility/«цена эпизода», контракты JSON, канарейки, риск-реестр. Затем углубляйте.
Как связать AIMS с техническим стеком? Через артефакты и профили. Карточка модели, версии ретривера и шаблонов, профили инференса и гейты релиза «прошивают» ISO 42001 в ваш AI-стек.
А что с мультимодальностью и поиском знаний? Те же принципы: манифест данных по модальностям, контракты вывода, хранение ID источников в RAG, отдельные очереди для тяжёлых задач.
Словарь терминов
- AIMS (AI Management System) — система менеджмента ИИ по ISO/IEC 42001: роли, артефакты, процессы и улучшение.
- Use/Abuse-cases — допустимые сценарии и анти-кейсы применения системы.
- Гейты релиза — формальные критерии допуска изменений к пользователям.
- Канарейки — малодолевые релизы для проверки деградаций.
- TTFT/P95 — эксплуатационные метрики задержек (время до первого токена; 95-й перцентиль).
- Доля неформата — процент невыполнения контракта вывода (JSON/таблицы).
- Utility-скор — метрика прикладной полезности на «золотом наборе».
- «Цена эпизода» — суммарная стоимость полезного ответа (ввод → генерация → инструменты → ретраи → пост-обработка).
