Ошибки майнеров: коды Whatsminer и Antminer — индекс

Эта страница — «оглавление» по ошибкам ASIC-майнеров. Здесь собраны:

  • коды и типовые сообщения ошибок для Whatsminer и Antminer;
  • краткое объяснение «что это значит»;
  • ссылки на подробные разборы с пошаговой диагностикой.

Цель — чтобы вместо хаотичного поиска «ошибка 206», «find 0 asic» и т. п. можно было:

  • быстро найти код/сообщение в таблице;
  • перейти в нужный лонгрид;
  • уже там пройти подробный чек-лист.

Как читать журнал и видеть первопричину ошибки: см. Kernel log ASIC: как читать журнал майнера и понимать ошибки. Общий алгоритм диагностики: см. Быстрый чек-лист диагностики майнера.

Ошибки майнеров: коды Whatsminer и Antminer — индекс и быстрые ссылки на разборы

Как пользоваться индексом

  • Откройте Kernel log или веб-панель майнера и найдите:
    • числовой код (206, 207, 210…);
    • или текстовое сообщение (find 0 asic, EEPROM error, fan lost и т. п.).
  • Найдите этот код/сообщение:
    • в блоке Whatsminer;
    • либо в блоке Antminer;
    • либо в таблице «по типу проблемы».
  • Перейдите по ссылке «Подробный разбор»:
    • там описаны типичные причины;
    • есть пошаговый чек-лист «что проверить»;
    • указано, где имеет смысл остановиться и не усугублять проблему.

Если точного совпадения нет — ориентируйтесь на тип проблемы (fan / temp / psu / eeprom / asic / crc) и используйте общий чек-лист.

Индекс ошибок Whatsminer

Код / сообщение в Kernel log Что это значит в двух словах Подробный разбор
206 Срыв старта: контроллер не может корректно запустить одну или несколько хэш-плат Whatsminer — ошибка 206: что значит и что делать
207 Похож на 206, но чаще связан с профилем разгона и нагрузкой на PSU при инициализации Whatsminer — ошибка 207: старт под нагрузкой
210 Ошибка блока питания: выход параметров за допустимый диапазон, срабатывание защиты Whatsminer — ошибка 210: питание и PSU fault
find 0 asic / asic num is 0 Контроллер не видит ASIC-чипы на плате/цепочке, плата «молчит» Whatsminer — find 0 asic: причины и диагностика
EEPROM error / EEPROM NG Не читается EEPROM платы, повреждены калибровки/«паспорт» хэш-платы Whatsminer — EEPROM error / NG
nonce CRC error / CRC too high Ошибки CRC при обмене данными с чипами, особенно под нагрузкой Whatsminer — nonce CRC error
fan error / fan lost / fan speed low Вентилятор не крутится, обороты вне диапазона или не читается сигнал RPM Whatsminer — ошибки вентиляторов и температуры
overtemp / temp is too high Перегрев: температура плат или среды выше пороговых значений, майнер уходит в защиту Ошибки температуры и охлаждения Whatsminer
psu fault / psu overcurrent / undervoltage PSU уходит в защиту по току/напряжению, просадки на линии питания Whatsminer — ошибки блока питания
abnormal hashrate / low hashrate Хешрейт ниже нормы: троттлинг, частые ошибки, недобор плат Kernel log ASIC: как по журналу понять, что мешает хешрейту
Для Whatsminer отдельные статьи описывают, какие условия вызывают тот или иной код, как отличить проблему с PSU от проблемы с платой или средой и какие шаги безопасно сделать до обращения в ремонт.

Индекс ошибок Antminer

Сообщение в Kernel log Что это значит Подробный разбор
chain(x) asic is 0 / find 0 asic Контроллер не видит ASIC-чипы на плате/цепочке; плата не поднимается Antminer — find 0 asic
CRC error / asic crc error Ошибки обмена данными с платой: шум по питанию, шлейфы, перегрев Kernel log ASIC: как читать журнал майнера
temp sensor error / sensor lost / sensor abnormal Проблема с датчиком температуры или его обвязкой Antminer — ошибка датчика температуры
fatal temperature / overtemp protection Перегрев плат или среды, срабатывание защиты по температуре Влияние среды на стабильность майнинга
fan error / fan is lost Вентилятор не стартует, обороты вне диапазона или повреждён провод/коннектор Чек-лист диагностики майнера + разбор Kernel log
eeprom error / cannot read eeprom Не читается EEPROM платы: калибровки и паспорт платы недоступны или повреждены EEPROM: что это и как влияет на ошибки плат
Для Antminer часть формулировок и поведение кодов зависят от линейки (S9, S17, S19, S21 и т. д.). В профильных статьях мы отмечаем различия по моделям и прошивкам.

Индекс по типу проблемы (если кода нет)

Если в логе нет явного кода «206/207/210», но есть повторяющиеся симптомы, можно идти от ситуации, а не от кода.

Симптом Что чаще всего виновато Куда смотреть дальше
Майнер не стартует, перезагружается или сразу падает в ошибку Питание (PSU, ввод), критическая ошибка плат, EEPROM, агрессивный разгон Быстрый чек-лист диагностики + Kernel log ASIC
В логе find 0 asic / chain asic is 0 Цепочка ASIC-чипов или вся плата не «видится» контроллером Whatsminer find 0 asic или Antminer find 0 asic
Массовые CRC / nonce CRC error Шум/просадки по питанию, шлейфы, экстремальная температура nonce CRC error + среда и питание
Частые fan error / fan lost / temp sensor error Вентиляторы, датчики температуры, пыль, рециркуляция, кабели Ошибки вентиляторов Whatsminer, датчик температуры Antminer
Майнер перегревается и троттлит, хешрейт «плавает» Воздух, забитые радиаторы, горячий приток, плотная установка без каналов Влияние среды на стабильность майнинга
В логе psu fault / overcurrent / undervoltage PSU, вводное питание, некачественные кабели/автоматы Ошибки PSU Whatsminer и PSU — базовые понятия
Одна плата даёт заметно ниже хешрейт, чем другие Частично деградировавшая плата или цепочка ASIC-чипов «на грани» Kernel log ASIC: как по логу локализовать плату

FAQ по индексам ошибок майнеров

Что делать, если моего кода/сообщения нет в таблицах? Такое бывает, особенно на новых прошивках и редких моделях. Действуйте так:

  • определите тип проблемы (fan/temp/psu/eeprom/asic/crc) по тексту сообщения;
  • используйте таблицу «по типу проблемы» и общий чек-лист диагностики;
  • сохраните kernel log с момента холодного старта и сравните последовательность событий с похожими кейсами.

Часть редких ошибок со временем переедет в отдельные статьи, и индекс будет расширяться.

Зачем вообще отдельный индекс, если можно просто искать по коду? Индекс решает сразу несколько задач:

  • собирает все коды и формулировки в одном месте;
  • даёт короткое, но понятное объяснение «что это за ошибка»;
  • позволяет в один клик попасть в подробный разбор и чек-лист по нужной модели.

Для ферм и сервисов это удобная стартовая точка: не нужно хранить отдельные разрозненные таблицы для каждой прошивки.

Почему одинаковый код может вести себя по-разному на разных моделях и прошивках? Производители меняют логику:

  • добавляют новые проверки;
  • перераспределяют диапазон кодов;
  • меняют текст сообщений.

Поэтому важен не только код, но и контекст в kernel log (на каком шаге старта он срабатывает) и модель устройства. В профильных статьях мы стараемся явно отмечать, для каких серий (S19, M50 и т. д.) справедливы те или иные диагнозы.

Можно ли диагностировать майнер только по коду ошибки без осмотра железа? Нет. Код — это симптом, а не полный диагноз. Один и тот же код:

  • может быть вызван разными причинами (среда, питание, плата, прошивка);
  • на разных моделях трактуется по-разному.

Минимум нужно: посмотреть kernel log, проверить воздух, питание, шлейфы и запуск по одной плате. Это и разбирается в связке статей про Kernel log и чек-листа.

Что отправлять в сервис или поддержку кроме кода ошибки? Чтобы не тратить время на «догонку», обычно просят:

  • полный kernel log с момента холодного старта до ошибки;
  • модель майнера, версию прошивки и PSU;
  • фото/видео размещения (как стоит майнер, как организован воздух);
  • краткую историю: когда появилась ошибка, что меняли (прошивка, разгон, переезд, чистка).

Чем больше структурированных данных, тем выше шанс получить адекватный ответ с первого раза.

См. также

Task Runner