Этот чек-лист помогает быстро локализовать причину нестабильности майнера без пайки. Подходит для линеек Whatsminer и Antminer. Результат каждого шага — понятное действие «что дальше» и ссылки на углублённый разбор.
Когда использовать
- Майнер не выходит в хеширование, «плавает» хешрейт или уходит в ребуты.
- В панели/логах видны сообщения про fan/thermal, CRC/nonce CRC, find 0 asic/chain missing, EEPROM/PIC.
- Нужно быстро отделить проблемы окружения (питание/охлаждение/шлейфы) от конкретной платы.
Что понадобится
- Доступ к kernel/current/history журналам (см. где их открыть и как читать).
- Набор исправных шлейфов и возможность переставлять платы местами.
- По возможности — «эталонный» PSU той же мощности и чистое рабочее место для теста.
«10 шагов» диагностики
Шаг 1 — Зафиксируйте исходные условия Запишите модель майнера, ревизии плат (если видны), версию прошивки и точные симптомы (сообщения, время). Снимите kernel-журнал сразу после холодного пуска. Если в логах много рассыпано по темам — ориентируйтесь на индекс ошибок и кодов.
Шаг 2 — Верните сток-профиль Отключите разгон/касты, верните рекомендованные частоты/напряжения. Если в стоке всё стабилизировалось — причина была в агрессивных настройках. Если нет — дальше.
Шаг 3 — Питание (линия/PSU/контакты) Проверьте сетевой кабель, удлинитель, заземление, плотность посадки силовых коннекторов. При возможности — тест с эталонным блоком питания. Симптомы просадок: ребуты, всплески CRC, «fan error/low RPM», «find 0 asic» на старте. Подробно — PSU.
Шаг 4 — Охлаждение и пыль Продуйте радиаторы/решётки. Проверьте, свободно ли вращаются крыльчатки, нет ли посторонних предметов. Постоянные 100% оборотов или «thermal throttling» на ровном месте — признак проблем с датчиками/обдувом (см. PWM вентилятора, NTC-термистор).
Шаг 5 — Шлейфы и порты Переставьте шлейфы между платами и/или порты на контроллере. Наблюдайте, «переезжает» ли ошибка вместе с кабелем. Если «chain missing/find 0 asic» меняет номер цепочки после перестановки — виноват шлейф/порт. Если остаётся за платой — идём дальше.
Шаг 6 — Изоляция плат Запустите майнер с одной платой (остальные отключены), по очереди. Фиксируйте, на какой плате воспроизводится сбой. Если проблема воспроизводится только с одной платой — корень, скорее всего, на hashboard (см. хэшборд).
Шаг 7 — Вентиляторы и датчики Сверьте PWM/RPM и показания температур. Обменяйте вентиляторы местами (front↔rear) и повторите запуск. «fan error/low RPM» при любых перестановках → проверять разъём/питание/датчик; «один датчик выпал» (0/255 °C) → смотреть NTC.
Шаг 8 — Привяжите логи к событиям Сопоставьте пики CRC, fan/thermal и «find 0 asic» по времени старта/нагрева. Это показывает, что первично — питание/шум, датчик или инициализация. Подсказки по формулировкам — в разборе Kernel log.
Шаг 9 — Повтор на «чистом» стенде Если возможно, протестируйте с другим PSU/кабелями и в другом месте розетки. Если на чистом стенде всё стабильно — первопричина в окружении (линия, кабели, пыль, температура).
Шаг 10 — Решение по результатам
- Проблема исчезла в стоке/на эталонном PSU/после чистки → эксплуатационный фактор (питание/охлаждение/шлейфы).
- Проблема следует за платой при любых перестановках → стендовая диагностика платы (EEPROM/MCU/шины/силовые).
- В логах явный код/сообщение → перейдите сразу к нужной статье из индекса ошибок.
Матрица «симптом → первичная гипотеза → что сделать»
| Симптом | Первая гипотеза | Действие сейчас |
|---|---|---|
| find 0 asic / chain missing | Шлейф/порт, питание на старте, локальная логика/EEPROM на плате | Сток → переставить шлейфы/порты → запуск по одной плате → прицельно см. индекс и EEPROM |
| CRC/nonce CRC растёт | «Пила» по питанию, перегрев, шум/земля, завышенные частоты | Эталонный PSU, чистка/охлаждение, сток-профиль → см. CRC |
| fan error / low RPM | Вентилятор/тахосигнал, разъём/питание, датчик | Перестановка вентиляторов, проверка разъёма/кабелей → см. PWM вентилятора |
| thermal throttling / overheat | Пыль/поток/ambient, датчик «врёт» | Продувка, улучшить приток/вытяжку, сверка датчиков → см. NTC-термистор |
| ребуты под нагрузкой | Просадки/защита PSU, окисленные коннекторы | Проверить линию/кабели/коннекторы, эталонный блок → см. PSU |
Частые вопросы (FAQ)
С чего начинать, если «всё сразу красное»? Со стока и логов: сток-профиль, холодный запуск, фиксируем первые сообщения. Дальше отсекать окружение: PSU, шлейфы, пыль/температура.
Почему в жару всё ухудшается? Рост ambient повышает обороты и пиковые токи, усиливает просадки и шум, датчики раньше выходят на пороги. Помогают чистка, усиление притока/вытяжки и отказ от разгона.
Нужно ли обновлять прошивку сразу? Нет, сначала исключите питание/шлейфы/охлаждение. Прошивка редко лечит проблемы окружения, а неверное обновление добавит рисков.
Что делать, если кодов нет, а «не майнит»? Идти по чек-листу: питание → пыль/вентиляторы → шлейфы/изоляция плат → логи. Часто всплывает скрытая проблема PSU/коннекторов.
