AIOZ Network — децентрализованная сеть медиа-доставки и вычислений: узлы сообщества предоставляют хранилище, пропускную способность, транскодинг/рендеринг видео, а также GPU-вычисления для задач ИИ (инференс LLM/ASR/компьютерное зрение). За ресурсы пользователи платят, а оператор узла получает вознаграждение в токене AIOZ. Подход относится к классу «инфраструктурных» сетей (DePIN): чем больше подключено независимых узлов, тем шире покрытие и стабильнее сервис.
Связанные страницы: Model serving, Cost optimization LLM, vLLM, Qdrant, Weaviate, Pinecone, KV cache, Prefill cache, Confidential Compute / TEE, Evals.
Зачем нужна AIOZ Network (AIOZ)
- CDN без единой точки отказа. Распределённые узлы кэшируют и раздают контент ближе к пользователю — это снижает задержки и стоимость по сравнению с централизованной доставкой.
- Транскодинг/процессинг видео на периферии. Кодирование в нужные профили качества, генерация превью/кадров, анализ контента.
- AI-вычисления «рядом с данными». Узлы с GPU берут на себя инференс (распознавание речи/картинки, re-rank, эмбеддинги), разгружая облака и сокращая TTFB.
- Прозрачная экономика. Потребители платят за фактическое использование (трафик, хранение, GPU-время), а операторы стимулируются поддерживать аптайм и SLA.
Архитектура и роли
| Компонент | Роль | Что важно для продакшена |
|---|---|---|
| Клиент (Publisher/Consumer) | Загружает/запрашивает контент, отправляет AI-задачи | Указывает требования к качеству/времени/бюджету |
| Узел хранения/кэша | Держит копии данных, раздаёт по запросу | Гео, аптайм, скорость диска/сети |
| Узел транскодинга/процессинга | Кодирует видео/изображения, генерирует артефакты | Профили кодеков/битрейты, очередь задач |
| Узел GPU (AI-compute) | Выполняет инференс/эмбеддинги | VRAM/Compute-профиль, драйверы, контейнеры |
| Планировщик/маркетплейс | Матчит задания и узлы, учитывает SLA | Очереди, рейтинг узлов, ретраи/штрафы |
Как это работает (упрощённо). 1) Клиент публикует файл или формирует AI-задачу (контейнер/образ, VRAM, дедлайны, верхняя цена). 2) Планировщик назначает ближайшие/подходящие узлы (хранение/кэш, транскодинг, GPU). 3) Узлы исполняют, возвращают результат и метаданные (контрольные суммы, логи). 4) Оплата списывается в AIOZ, часть идёт узлам в соответствии с правилами распределения и качеством исполнения.
Утилита токена AIOZ (обобщённо)
| Область | Использование AIOZ |
|---|---|
| Расчёты | Оплата трафика, хранения, транскодинга и AI-вычислений |
| Стейкинг/депозиты | Гарантии SLA узлов: залоги, штрафы, приоритет в отборе |
| Стимулы качества | Бонусы за высокий аптайм/скорость/низкий p95, репутация |
| Управление | Параметры сети, тарифные формулы, эволюция протокола |
*Важно:* конкретные ставки/пулы/режимы управления эволюционируют. Перед участием проверяйте актуальные правила на используемой площадке.
Типовые сценарии
- Платформа видео/стрима. Кросс-кодирование, генерация превью, кеширование «на периферии»; тариф — за GB/час кодирования/выдачи.
- Мультимодальные пайплайны. ASR/TTS, OCR, классификация изображений/видео-фреймов; «пиковые» шаги — на GPU-узлах AIOZ.
- Гибрид облако+периферия. Постоянное ядро в облаке, региональные пики — через AIOZ для снижения задержек/стоимости.
Интеграция в стек (практика)
- Контейнеры. Готовьте минимальный Docker-образ с зафиксированными версиями CUDA/кодеков/библиотек; секреты — только через переменные окружения, не запекайте их в образ.
- Данные. Выдавайте узлам только необходимое (подписанные URL/временные ключи, контрольные суммы). Храните исходники/артефакты в своём сторадже с TTL.
- RAG-паттерн. Держите k умеренным (5–8), заранее фильтруйте по метаданным; используйте стоп-последовательности и max_new_tokens (см. FinOps).
- Наблюдаемость. Разносите метрики по шагам: prefill/decoding (LLM), кадры/с (видео), ttfb/битрейт, доля ретраев и таймаутов. Храните «золотой» набор для evals.
Метрики и SLO
- Latency p50/p95/p99 по операциям (выдача, кодирование, инференс).
- Throughput: tokens·s (LLM), кадры/с (видео), эмбеддинги/с.
- Надёжность: доля успешно завершённых задач, ретраи/ошибки, соответствие профилям кодеков.
- Стоимость: AIOZ за GB хранения/выдачи, AIOZ/час GPU, AIOZ/задачу; сравнивайте с облачными котировками и учётом доставки данных.
Безопасность и приватность
- Минимизация доступа. Не отдавайте лишние данные; шифруйте каналы; применяйте одноразовые токены/TTL для ссылок и ключей.
- Повторная проверка. Для критичных операций — N-из-M повторов на независимых узлах, детерминированные чек-рансы.
- Изоляция окружений. Контейнеры без привилегий; запрет сохранения секретов в образ; раздельные сети.
- Конфиденциальные вычисления. Для чувствительных сценариев используйте окружения из TEE/аттестации.
- LLM-риски. Учитывайте prompt-инъекции, утечки промптов, poisoning датасетов; задавайте жёсткие схемы JSON/стоп-правила.
Риски и ограничения
- Вариативность качества узлов. Разные задержки/скорость; страхуется рейтингами, депозитами и политикой ретраев.
- Сетевые накладные. Крупные файлы/длинные видео/веса моделей увеличивают TTFB и стоимость — планируйте кэш ближе к потребителю.
- Совместимость окружений. Несовпадение драйверов/кодеков/библиотек вызывает сбои — фиксируйте версии и делайте sanity-checks.
- Экономические флуктуации. Курс AIOZ и тарифы рынка меняются; держите бюджеты/лимиты и сравнивайте с облаками.
Мини-плейбук запуска
- Сформулируйте SLO: p95 по выдаче/кодированию/инференсу, потолок цены/времени.
- Соберите минимальный образ; подготовьте «золотой» набор evals.
- Настройте выдачу артефактов по подписанным ссылкам/TTL; кэшируйте «горячие» профили/пресеты.
- Включите мониторинг: p95, ретраи, стоимость/задачу, долю «пустых» выдач RAG.
FAQ
Подходит ли AIOZ для «тяжёлого» обучения моделей?
Чаще сеть используют для инференса и процессинга/транскодинга. Долгое обучение «с нуля» эффективнее на выделенных кластерах; комбинируйте подходы.
Можно ли гарантировать приватность данных?
В открытой сети — только снижать риск: минимум выдачи, шифрование, одноразовые ключи, N-из-M проверки и, при необходимости, TEE-окружения.
Как сравнивать с облаками?
Считайте AIOZ/GB хранения и выдачи, AIOZ/час GPU и «AIOZ на 1k токенов/кадров», учитывая доставку данных, ретраи и простои.
Как встроить в существующий пайплайн?
Через контейнеры и оркестрацию. Разделите сбор/препроцессинг локально/в облаке и вынесите «пиковые» шаги (транскодинг, эмбеддинги, re-rank) на узлы AIOZ.
