ISO/IEC 23894: управление рисками ИИ — практическое руководство для LLM/GenAI-продуктов

ISO/IEC 23894 — стандарт по управлению рисками систем искусственного интеллекта. Его цель — сделать работу с ИИ предсказуемой и управляемой: задать общие принципы выявления, оценки и обработки рисков, определить роли и циклы контроля, встроить мониторинг и эскалации в жизненный цикл. В отличие от «бумажных» деклараций, 23894 ориентирован на практические процессы, которые легко пришить к вашему производственному стеку — от данных и обучения до инференса и поддержки.

ISO/IEC 23894: управление рисками ИИ — практическое руководство для LLM/GenAI-продуктов

Эта страница — инженерно-продуктовый конспект: как перевести 23894 на язык повседневной разработки и эксплуатации сервисов на больших моделях LLM и генеративного ИИ. Мы разберём роли и документы, процедуры оценки рисков, метрики «здоровья» (включая TTFT/P95 и «цену эпизода»), практику мониторинга и планы деградации. Для архитектурного контекста держите под рукой обзор AI-стека и слой исполнения LLM-inference.

Зачем ISO/IEC 23894 продуктовым и инженерным командам

  • Единый язык рисков. Принципы и процессы, которые понимают менеджеры, ML-инженеры, SRE и безопасность.
  • Привязка к реальности. Речь о конкретных шагах: как выявлять, измерять, смягчать и документировать.
  • Ускорение контрактов и аудитов. Наличие ролей, артефактов и метрик снижает «трение» на предпроде и в пилотах.
  • Экономика продукта. Управление рисками напрямую уменьшает операционные потери, ретраи и «длинный хвост» задержек.

Ключевая мысль: 23894 узаконивает хорошую инженерную практику — то, что и так нужно для надёжного ИИ-сервиса.

Что такое ISO/IEC 23894 простыми словами

Стандарт описывает, какие риски бывают у систем ИИ, как их организованно управлять и какие артефакты нужно вести, чтобы решения были воспроизводимыми и проверяемыми. Это «зонтик» над задачами данных, моделей и эксплуатации:

  • Принципы: системность, контекстность, цикличность, документируемость.
  • Процессы: идентификация → анализ → оценка → обработка → мониторинг → коммуникация и пересмотр.
  • Роли: владельцы модели, данных, риска; SRE/платформа; безопасность/право; продакт-владелец.
  • Артефакты: реестр рисков, карточка модели, отчёты об оценке, журналы инцидентов и релизов.

Важно: 23894 дружит и «стыкуется» с процессными рамками и нормативкой. Он хорошо ложится на системный стандарт ISO/IEC 42001 (AIMS), инженерную рамку NIST AI RMF и риск-ориентированный подход регламента EU AI Act.

Карта процессов 23894: от идеи до эксплуатации

Этап Вопрос Выход
Идентификация Что может пойти не так? Список рисков, сценарии (use/abuse), источники
Анализ Как устроен риск внутри? Причины, последствия, предпосылки, зависимости
Оценка Насколько это важно? Матрица «вероятность × влияние», приоритет
Обработка Что делаем? План мер: избегание/снижение/перенос/принятие
Реализация Кто и когда делает? Ответственные, сроки, KPI контроля
Мониторинг Что меняется? Метрики, дешборды, триггеры, отчёты
Коммуникация Кто должен знать и когда? Каналы, периодичность, формат отчётности
Пересмотр В чём мы ошиблись? Обновлённые риски/меры, пост-мортемы, новые пороги

Эти шаги не разовые — они «крутятся» по мере эволюции данных, моделей и инфраструктуры.

Типология рисков для LLM/GenAI (производственная оптика)

Класс риска Примеры проявлений Где ловить Инструменты/меры
Качество/достоверность Галлюцинации, нецитатные ответы Инференс/продукт Контракты вывода, post-валидация, ретривер RAG
Устойчивость/производительность Пики P95/TTFT, «длинный хвост» Платформа Профили, очереди, кэш префилла, лимиты
Безопасность/конфиденциальность Prompt-инъекции, утечки PII Безопасность/данные Фильтры ввода, анонимизация логов, санкбоксы
Справедливость/смещения Систематические ошибки по группам Эвалы Стратификация данных, fairness-метрики
Правовые/регуляторные Непрозрачность, отсутствие маркировки Продукт/право Информирование/маркировка, карточки модели
Экономика/FinOps Взрыв «цены эпизода», ретраи Эксплуатация Короткие промпты, кэш, квантизация квантизации

Роли и ответственность (минимальный состав)

Роль Зона Обязанности
Владелец модели Качество/безопасность Карточка модели, эвалы, релиз-ноуты, известные риски
Владелец данных Источники/PII/лицензии Data-manifest, очистка, обновления
Владелец риска Процессы/артефакты Риск-реестр, ревизии, отчёты
Продакт Назначение/границы Use/abuse-cases, критерии приёмки
SRE/Платформа SLA/SLO/стоимость TTFT/P95, «цена эпизода», профили и очереди
Безопасность/Право Политики/инциденты Политики ввода/вывода, инцидент-лог

Как 23894 маппится на AI-стек

Слой стека Фокус управления рисками Практики
Данные Происхождение, лицензии, смещения Data-manifest, дедуп, фильтры, стратификация
Модели Ограничения, известные риски Карточка модели, «золотой набор», сценарии деградации
Ретривер/RAG Источники фактов, цитатность Качественные эмбеддинги эмбеддингов, векторный индекс векторной БД, лог ссылок
Инференс Задержки/стоимость/неформат Контракты JSON, лимиты длины, ранние остановки
Оркестрация Профили, очереди, канарейки *Light/Standard/Heavy*, фичефлаги, авто-откаты
Наблюдаемость Метрики/трейсинг/инциденты TTFT, P95, доля неформата, «цена эпизода», инцидент-лог

Метрики «здоровья» (как «измерять» риски)

Метрика Риск Зачем Рычаг
TTFT Отказы/UX Удержание, конверсия Тёплые пулы, короткий ввод
P95 задержек SLA/SLO Пики/стабильность Разделение очередей, лимиты
Доля неформата Ретраи/ручной труд Цена эпизода Контракты вывода, пред-валидация
Utility-скор «Польза» Ценность релизов Тюнинг шаблонов/ретривера
Цена эпизода FinOps Маржа Кэш/квантизация/профили
Доля цитатности (RAG) Достоверность Объяснимость Логи источников, перегенерация по фактам

(Слои и механика поиска знаний — см. AI-стек и LLM-inference.)

Процедуры оценки рисков: минимальный рабочий набор

1) Идентификация. Соберите «карту рисков» по слоям: данные → модель → ретривер → инференс → оркестрация → UX. Источники — пост-мортемы, жалобы, метрики, экспертиза команды.

2) Анализ. Для каждого риска опишите: причины, триггеры, потенциальный ущерб, зоны влияния, «сигналы раннего предупреждения».

3) Оценка. Присвойте вероятность/влияние и приоритет. Для high-impact заведите отдельные гейты релиза.

4) Обработка. Выберите стратегию: избегать (меняем архитектуру), снижать (контроль/ограничители), переносить (страхование/контракт), принимать (под мониторинг).

5) Мониторинг. Определите метрики/алерты, периодичность ревизий, условия эскалаций. Все изменения фиксируйте в карточках релизов.

Таблица: примеры рисков и мер контроля

Риск Симптом Меры
Галлюцинации Уверенные, но неверные ответы RAG с логом источников, пост-валидация контрактов, лимиты длины
Prompt-инъекции Выход из роли, раскрытие ключей Санкбоксы инструментов, фильтры ввода, список запрещённых действий
Утечки PII «Длинный» контекст в логах Маскирование/анонимизация логов, правила хранения
Взрыв стоимости Длинные подсказки/ответы Сокращение ввода, кэш префилла, квантизация квантизация
Пики P95 Смешение профилей Разделение очередей, *light/standard/heavy*, тёплые пулы
Неформат Не-JSON/битые таблицы Строгие схемы, пред-валидация, управляемые ретраи
Смещение Систематические ошибки по группам Стратификация данных, fairness-эвалы
Дрейф данных Падение качества со временем Регулярные пересборки/ревизии наборов, канарейки

Документы и артефакты 23894 (что реально вести)

  • Риск-реестр. Риск → мера → владелец → срок пересмотра → статус.
  • Карточка модели. Назначение, границы, известные риски, метрики до/после, версии.
  • Data-manifest. Источники/лицензии/чувствительность/обновления.
  • Release-notes. Изменения в модели/ретривере/шаблонах, влияние на TTFT/P95/utility/цену.
  • Инцидент-лог. Событие → последствия → решение → патч/коммуникация.
  • План деградации. Fallback-профили, тайм-ауты, упрощённые ответы, ручная эскалация.

Артефакты версионируются «как код» и доступны всем ответственным.

Чек-листы внедрения 23894

Первые 30 дней (минимум)

  • Назначены владельцы модели/данных/риска/SRE; утверждены границы использования.
  • Заполнены risk-registry и data-manifest.
  • Включены дешборды TTFT, P95, неформат, utility, цена эпизода.
  • Введены контракты вывода и пред-валидация.
  • Разделены очереди: chat / long / offline; добавлены профили *light/standard/heavy*.

Дни 31–60 (углубление)

  • Настроены канарейки и пороги авто-отката.
  • Включён кэш префилла/эмбеддингов; сокращены шаблоны ввода.
  • Проведены стресс-тесты на prompt-инъекции и отказоустойчивость.
  • Сформирован «золотой набор» utility-кейсів и fairness-наборы.

Дни 61–90 (операция)

  • Регулярные ревизии риск-реестра; пост-мортемы инцидентов.
  • Публикация карточек релизов; обновление планов деградации.
  • Отчёты пост-мониторинга с трендами TTFT/P95/неформата/utility/цены.

Сопоставление 23894 с соседними рамками

Задача ISO/IEC 23894 Соседняя рамка Комментарий
Система менеджмента Требует цикличности и ролей ISO/IEC 42001 42001 формализует AIMS над практиками 23894
Инженерия рисков Процессы Govern/Map/Measure/Manage NIST AI RMF RMF — удобный операционный язык для тех же шагов
Нормативка ЕС Риск-ориентированный подход EU AI Act 23894 помогает готовить артефакты и процессы для аудитов

Профили инференса и риски

Профиль Риски Контрмеры
Light Потеря деталей, но дешёво Короткие ответы, строгий JSON, высокий SLA
Standard Баланс качества/цены Динамический batching, кэш префилла
Heavy Удар по P95/стоимости Отдельная очередь, лимиты длины, ранние остановки

Правило: не смешивайте профили — это ломает P95 и «цену эпизода».

Анти-паттерны и исправления

Анти-паттерн Симптом Исправление
«Всё решит большая модель» Дорого, нестабильно Сократить ввод, RAG, контракты вывода
«Одна очередь на всё» Пики задержек Разнести chat/long/offline, профили
«Без логов и версий» Нечем защищаться на аудите Версионирование артефактов и трейсинг
«Свободный текст всегда» Неформат, ретраи Строгие схемы JSON, пред-валидация
«Нет планов деградации» Срывы SLA Fallback-режимы, лимиты и тайм-ауты

Практические сценарии (как применить 23894)

1) Корпоративный ассистент с RAG. Риски: недостоверные ответы, утечки PII, пики P95. Меры: цитатность и лог источников, анонимизация логов, профили *light/standard*, лимиты длины. Метрики: TTFT/P95/цена эпизода/доля цитатности.

2) SaaS-генерация отчётов. Риски: неформат/ретраи, стоимость, дрейф данных. Меры: строгие схемы вывода, кэш префилла, план пересборок индекса, канарейки.

3) Модерация контента. Риски: fairness/ложные срабатывания. Меры: стратификация наборов, пороги, отчёты по группам, ручные ревью для пограничных случаев.

4) Агентные сценарии с инструментами. Риски: эскалация действий, prompt-инъекции. Меры: ограничение глубины планов, санкбоксы инструментов, трейсинг шагов, журналы.

Таблица «реестр рисков» (шаблон)

ID Риск Вероятность Влияние Мера Владелец Срок пересмотра Статус
R-01 Неформат JSON Средняя Среднее Схемы/валидация SRE 14 дней В работе
R-02 Пики P95 Высокая Высокое Профили/очереди Платформа 7 дней Контроль
R-03 Галлюцинации Средняя Высокое RAG/цитатность Вл. модели 30 дней План
R-04 Утечки PII Низкая Высокое Маскирование Безопасность 30 дней Контроль
R-05 Рост стоимости Средняя Среднее Кэш/квантизация Продакт 14 дней В работе

Часто задаваемые вопросы (FAQ)

Это «для корпораций» или применимо стартапам? Применимо всем. Начните с минимума: роли, risk-registry, метрики TTFT/P95/неформат/utility/цена эпизода, контракты вывода и профили.

Как связать 23894 с нашими релиз-циклами? Добавьте гейты: без обновлённых артефактов (карточка модели, риск-реестр) — релиз не пропускается. Канарейки и пороги авто-отката — часть «Manage».

Нужно ли вести «толстые отчёты»? Нет. Достаточно кратких, но полных артефактов: risk-registry, карточка модели, release-notes, отчёт пост-мониторинга. Важно, чтобы они были актуальны.

Что делать, если команда «не верит» в метрики? Сопоставьте цены эпизода и P95 с отменами заказов/жалобами. Экономика быстро убеждает.

Как избегать «бумажности»? Ведите артефакты в репозиториях, автоматизируйте сбор метрик/логов, интегрируйте гейты с CI/CD.

Как учитывать мультимодальность? Те же принципы: манифесты данных по модальностям, контракты вывода, лог источников, отдельные профили тяжёлых задач.

Словарь терминов

  • Управление рисками ИИ (по 23894) — циклы и артефакты, снижающие неопределённость и ущерб от систем ИИ.
  • Risk-registry (реестр рисков) — список рисков с мерами/владельцами/сроками.
  • Карточка модели — назначение, границы, метрики, известные риски и версии.
  • TTFT/P95 — эксплуатационные метрики задержек (время до первого токена; 95-й перцентиль).
  • Доля неформата — процент невыполнения контракта вывода (JSON/таблица).
  • Utility-скор — прикладная полезность на «золотом наборе» кейсов.
  • Цена эпизода — полная стоимость полезного ответа.
  • RAG — поиск фактов перед генерацией, с логом источников.
  • Профили инференса — маршруты *light/standard/heavy* с разными SLO и бюджетами.

См. также

Task Runner