Arkham — платформа ончейн-аналитики, фокус которой — связывать адреса блокчейнов с сущностями (организации, сервисы, кластеры кошельков и т. п.), строить граф связей и предоставлять инструменты расследований, мониторинга и отчетности. В прикладном смысле Arkham — это сочетание ETL ончейн-данных, графовых алгоритмов и поиска по признаковым векторным представлениям (см. эмбеддинги и векторные БД), дополненных «биржей разведданных» (иногда называемой bounty-механикой), где пользователи выставляют запросы на атрибуцию или дают ответы за вознаграждение. Токен экосистемы — ARKM.
Материал пригодится редакциям, аналитикам, соблюдающим комплаенс командам Web3-проектов, а также продуктовым менеджерам, которым нужно понять, как встраивать ончейн-аналитику в рабочие процессы: от простого поиска кошельков до автоматизированных сигналов и внутренней отчётности.
Чем Arkham (Arkham Intelligence) отличается от «обычной» ончейн-панели
- Упор на разрешение сущностей (entity resolution). Не просто адреса и транзакции, а попытка связать их с реальными сервисами/кластерами/организациями.
- Графовый взгляд. Узлы (адреса/сущности) и рёбра (переводы/владение/обслуживание) — основа навигации и гипотез.
- Поиск по «смыслу». Эмбеддинги и векторные индексы позволяют искать похожие паттерны поведения, а не только точные совпадения (см. эмбеддинги и векторные БД).
- Интел-биржа. Публичная постановка задач атрибуции и вознаграждение за релевантные ответы — редкая для отрасли функциональность, создающая дополнительный «поток фактов».
- Ориентация на операционный контур. Подписки, алерты, экспорты — чтобы выводы не оставались «картинками», а шли в процессы.
Итог: Arkham позиционируется как «операционализированный» инструмент расследований и мониторинга, где граф + векторный поиск + краудсорсинг фактов собираются в единую воронку.
Архитектура и поток данных (концептуальная модель)
- Доставка ончейн-данных (ingest/ETL). Блоки, логи событий, мемпул, метаданные из открытых источников. Нормализация, дедупликация, сглаживание форков.
- Кластеризация адресов. Эвристики совместного контроля, паттерны «change», UTXO/аккаут-модели, поведенческие признаки.
- Разрешение сущностей (entity resolution). Мэппинг кластеров к сервисам/организациям, агрегирование атрибутов, уровень уверенности/версии.
- Граф связей. Узлы (адрес/кластер/сущность), рёбра (переводы, владельческие связи, посредники), веса/временные окна, метки риска.
- Эмбеддинги и векторный поиск. Кодирование признаков активности/графовых окрестностей; быстрый поиск похожих паттернов в векторном индексе (см. эмбеддинги, векторные БД).
- Сигналы и алерты. Триггеры по событиям, изменениям балансов, каскадам переводов, а также по «сходству» с известными паттернами.
- Витрины и отчётность. Дашборды, экспорт CSV/JSON, API-выдачи под внутренние регламенты.
На практике это многоуровневый «фабричный» конвейер: каждый слой повышает полезность данных для расследователя и снижает время до инсайта.
Интел-биржа Arkham: как работает «баунти»
Идея «интел-биржи» — создать *единый рынок* для заявок на атрибуцию/ссылки и для проверяемых ответов. Общая механика:
- Постановка задачи. Заказчик формулирует, что хочет узнать (например, «какая команда управляет кластером X?»), задаёт требования к доказательной базе и условия вознаграждения в ARKM.
- Дедлайны и модерация. Сроки, формат ответа, правила споров, приватность публикации.
- Ответы и доказательства. Участники присылают материалы (цепочки переводов, скриншоты, ссылки на открытые источники, графовые выкладки).
- Валидация и расчёты. Проверка качества, соответствия формату и достаточности доказательств; выплата вознаграждения победителю/победителям, отклонение слабых ответов.
- Архивация. История задач/ответов расширяет корпус атрибутов, часть которого может подпитывать базу знаний.
Такой рынок повышает «скорость света» для новых связей, но требует аккуратной модерации, чтобы избегать ошибочных атрибуций и нарушений приватности.
Где Arkham «сидит» в ИИ/данных стеке продукта
| Слой | Что делаете вы | Что даёт Arkham |
| Источники фактов | Формулируете вопросы, определяете доверенные источники | Витрина ончейн-данных и граф сущностей |
| Поиск/ретривер | Сужаете поле поиска, строите запросы | Поиск по атрибутам, графу и «сходству» (векторы) |
| Аналитика | Гипотезы, сценарии, риск-оценки | Метрики связности, алерты, временные срезы |
| Отчётность | Формы, регламенты, аудит | Экспорты, ссылки на первичные факты/транзакции |
Если вы уже применяете RAG для внутренних справок/ответов, Arkham может выступать источником проверяемых фрагментов (транзакции/счета/хэши), которые подмешиваются в контекст модели; затем LLM формирует резюме (см. эмбеддинги и векторные БД как базовые кирпичики).
Практические сценарии использования
1) Расследования и атрибуция. Сбор нитей между адресами и сервисами, построение цепочек, поиск «похожих» по поведению кошельков, оценка роли посредников.
2) Мониторинг рисковых событий. Алерты по входам/выходам, «пробуждению» старых кошельков, дроблению сумм, каскадам переводов через миксеры/мосты.
3) Оценка контрагентов и отчётность. Подготовка досье на сущности/кластеры: граф, ключевые адреса, окна активности, контрагенты, внешние ссылки.
4) Поддержка редакции/контента. Быстрая верификация фактов (когда, куда, сколько), диаграммы движения средств в материалах и «шпаргалки» для новостей.
5) Сигналы для продуктов. Маркировка входящих/исходящих транзакций (флаги/скоринги) и маршрутизация кейсов в процессы ручной проверки.
Метрики качества и инженерные ориентиры
| Метрика | Что измеряет | Почему важно |
| Precision/Recall атрибуции | Точность/полноту разрешения сущностей | Недопуск ложных «приписок» и потери связей |
| Coverage по сети/диапазонам | Долю покрытых активных адресов и протоколов | Понимание «слепых зон» данных |
| Freshness (время до индексации) | Задержку от события до появления в графе/алерте | Важна при реагировании на инциденты |
| Traceability | Степень «доказуемости» вывода (ссылки на события/блоки) | Чтобы любой вывод можно было *воспроизвести* |
| Explainability | Понятность, как алгоритм пришёл к выводу | Для обучающих/аудиторских целей |
Практика показывает: прозрачность цепочки вывода ценнее «черной коробки с высокой магией». Сохраняйте ссылки на первичные транзакции и версии эвристик.
Как устроен поиск «по смыслу»: эмбеддинги и векторные индексы
Ончейн-поведение (частоты переводов, характер взаимодействий с протоколами, «окрестности» графа) можно кодировать в векторные признаки и сравнивать по близости. Это:
- помогает находить «сходных» контрагентов;
- ускоряет навигацию по большим графам;
- позволяет строить семейства паттернов (например, «централизованный обменник-депозит», «арбитражный бридж», «сбрасывание NFT»).
Технически это слой поверх графа/таблиц: вычисление эмбеддингов, хранение в векторном индексе, эвристики пост-фильтрации. Подробнее — на страницах Эмбеддинги и Векторные БД.
Чек-лист внедрения Arkham в рабочий процесс
- Опишите кейсы: расследования, мониторинги, отчётность — для каждого своя карта действий.
- Зафиксируйте метрики: что такое «хороший» результат (точность/свежесть/следуемость).
- Настройте алерты и процедуры реагирования (кто, что, когда делает).
- Введите карточки сущностей (ID, адреса, связи, источники, дата проверки).
- Разделяйте гипотезы и факты: что подтверждено транзакциями, что — опосредованными признаками.
- Ведите журналы изменений: версии эвристик, обновления ярлыков, исправления ошибок.
- Проведите обучение команды: терминология графа, чтение ончейн-доказательств, интерпретация алертов.
Таблица: роли пользователей и ключевые действия
| Роль | Основные задачи | Артефакты |
| Аналитик/расследователь | Гипотезы, граф-навигатор, сбор доказательств | Цепочки, скриншоты, ссылки на блок-эксплореры |
| Риск/комплаенс | Политики, лимиты, белые/чёрные списки | Правила алертов, отчёты, кейсы |
| Продакт/операции | SLA алертов, интеграции, маршрутизация | Вебхуки, дашборды, регламент |
| Редакция | Быстрые факты/визуализации | Таймлайны, инфографика, ссылки на первичные события |
Таблица: граф vs векторный поиск — когда что лучше
| Ситуация | Графовые запросы | Векторный поиск |
| Точное смыкание адресов/цепочек | Идеален | Вторичен (для навигации) |
| Поиск «похожего поведения» | Можно, но тяжело | Естественный сценарий |
| Объяснение результата | Высокая прозрачность | Нужны пост-фильтры/примерки |
| Масштаб по большим выборкам | Выше сложность | Хорошо масштабируется |
| Риск ложных совпадений | Ниже при строгих правилах | Выше без контроля порогов |
Комбинация подходов часто даёт лучший результат: граф фиксирует «скелет», вектора — ускоряют скаутинг и находят неожиданные родства.
Риски и модель угроз
| Риск | Проявление | Как снижать |
| Ошибочная атрибуция | Неверная привязка адресов к сущности | Требовать доказуемости, многоисточность, версии/откаты |
| Переоценка сходства | «Похожее» поведение ≠ один владелец | Пороговые значения, верификация через граф/ручной обзор |
| Снижение приватности | Разглашение PII, токсичные выводы | Минимизировать PII, придерживаться публичных фактов |
| Устаревшие ярлыки | Сущность сменила владельца/профиль | Дата-штампы, периодические ревизии |
| Зависимость от одной витрины | Блокировка/ошибка источника | Дублирующие источники, кеш первичных ссылок |
Культура «спорим фактами, не догадками» — лучший антидот к рискам ончейн-разведки.
Экономика: считайте «цену эпизода», а не «час аналитика»
| Компонент | Что входит | Как управлять |
| Подготовка | Формулировка вопроса/гипотезы | Чёткие TTP: что считаем «подтверждением» |
| Сбор данных | Поиск, выборка, фильтры | Шаблоны запросов/макросы |
| Аналитика | Граф, сравнения, кросс-проверки | Повторно используемые плейбуки |
| Док-база | Скриншоты, ссылки, заметки | Единый формат «карточек кейсов» |
| Алертинг | Триггеры/вебхуки | Гистерезисы, дедупликация событий |
| Ревизия | Периодические проверки/обновления | SLA на переоценку ярлыков/сигналов |
Цель — сократить путь до воспроизводимого вывода; шаблоны и плейбуки экономят больше, чем разовые «героические» расследования.
Частые ошибки и как их избежать
- Смешение фактов и гипотез. Отдельно храните «подтверждено» и «вероятно», с указанием критериев.
- Охота на «признание» вместо доказательств. Вывод без первичных ссылок легко спорится.
- Гигантские «нережущиеся» графы. Делите на подграфы, вводите окна по времени и суммам.
- Необновляемые ярлыки. Планируйте ревизии и «срок жизни» атрибуций.
- Один подход ко всем задачам. Комбинируйте графовые правила и векторный поиск, не бойтесь ручной проверки узких мест.
Мини-плейбуки (скелеты действий)
A) Кто стоит за этим адресом/кластером? 1) Соберите окрестность по времени/суммам. 2) Проверьте взаимодействия с известными сервисами. 3) Поиск «сходных» паттернов (вектора). 4) Постройте гипотезы → ищите прямые артефакты (депозиты/выводы/метки). 5) Документируйте вывод.
B) Откуда пришли средства? 1) Раскрутите рёбра назад до «стабильных» узлов. 2) Сверяйте мосты/централизованные сервисы. 3) Используйте суммы/времена как отпечаток. 4) Сохраните маршрут и источники.
C) Мониторинг кластера. 1) Задайте алерты по входам/выходам/контрагентам. 2) Введите гистерезисы. 3) Раз в N дней ревизируйте ярлыки.
FAQ
Arkham — это «доксинг»? Платформа работает с ончейн-фактами и публичными источниками. Критично соблюдать этику и закон: минимизируйте PII и опирайтесь на проверяемые транзакции.
Можно ли использовать Arkham как единственный источник? В расследованиях это риск. Лучше держать второй/третий источник и *всегда* давать ссылки на первичные события (tx-хэши/блоки).
Как интерпретировать «сходство» кошельков? Как *подсказку*, а не доказательство. Всегда перепроверяйте через граф/временные корреляции и независимые признаки.
Насколько «устойчивы» ярлыки сущностей? Любая атрибуция устаревает. Храните дату версии, задайте SLA на ревизию и фиксируйте причины изменённой оценки.
Какие навыки нужны команде? Графовая грамотность, базовая статистика, знакомство с эмбеддингами/векторными БД, дисциплина документирования.
Где место токена ARKM? Служит экономическим инструментом экосистемы (в т. ч. в «интел-бирже» и/или механиках доступа/стимулов); детали см. в карточке ARKM.
Словарь терминов
- Entity resolution (разрешение сущностей) — связывание адресов/кластеров с реальными сервисами/организациями.
- Граф ончейн-связей — узлы (адреса/сущности), рёбра (переводы/отношения), веса/метки.
- Эмбеддинги — векторные представления поведенческих/графовых признаков.
- Векторный индекс — структура для быстрого поиска «похожих» по близости (см. векторные БД).
- Баунти (intel-биржа) — рыночная постановка задач атрибуции и вознаграждение за проверяемые ответы.
- Traceability/Explainability — воспроизводимость вывода и его объяснимость.
