Whatsminer: ошибки блока питания — диагностика и решения

Ошибки блока питания на Whatsminer проявляются широко: от резких перезапусков под нагрузкой и «провалов» хешрейта до россыпи вторичных симптомов — fan error/low RPM, всплесков CRC/nonce CRC, сообщений find 0 asic/chain missing на старте. На практике первопричина нередко лежит за пределами корпуса: удлинители и «тройники», слабая розеточная группа, «шумная» земля, перегретые или окисленные коннекторы. Но даже идеальная сеть не спасёт, если внутри перегревается силовая часть, жгуты распределены неравномерно, а выхлопная струя возвращается во вход.

Whatsminer: ошибки блока питания — диагностика и решения

Этот материал — практический гид по диагностике без пайки. Мы разберём, как быстро распознать электрическую первопричину по логам, чем отличается «плохая сеть» от «уставшего коннектора», почему вентиляция комнаты напрямую влияет на стабильность питания, и как оформить проверку на эталонном PSU, чтобы перестать гадать.

Коротко про ошибки в блоке питания

  • PSU-причины маскируются под другие ошибки. Цепочки «CRC → fan/thermal → find 0 asic» почти всегда указывают на питание и среду.
  • Лучшая быстрая проверка — возврат к сток-профилю, чистый воздухотракт, запуск на эталонном PSU и короткой линии, затем изоляция плат.
  • Коннекторы и жгуты критичны: нагретые пины и неравномерная раскладка вызывают локальные просадки на платах → срыв инициализации и рост ошибок обмена.
  • Рециркуляция и пыль перегревают силовую часть и делают питание «грязным», даже если розетка «идеальна». Среда — такой же элемент стабильности, как и блок питания.

Как выглядят проблемы питания в панели и журналах

В интерфейсе вы увидите общие статусы нестабильности и перезапуски. В Kernel log ориентируйтесь на ранние участок холодного старта и моменты сбоя:

Наблюдение Что это значит чаще всего
Ранние всплески CRC/nonce CRC и рывки PWM/RPM «Пила» по питанию, «шумная» земля, разнобой по жгутам
find 0 asic/chain missing сразу после роста скорости вентиляторов Просадка напряжения на старте, перегрев силовой части, рециркуляция
fan error/low RPM без явных проблем с крыльчаткой Плохая опора тахосигнала из-за просадок, коннектор, линия
Перезагрузка в одно и то же «тяжёлое» время Общая сеть перегружена, соседи включают мощную нагрузку
«Выравнивание» поведения на эталонном блоке питания Первична электрика: PSU/линия/коннекторы, а не прошивка/плата

Подсказки по формулировкам см. в разделе про Kernel log; сопутствующие симптомы — в CRC и fan/thermal.

Что именно делает блок питания и как он «падает»

Блок питания должен обеспечить стабильные уровни под скачкообразную нагрузку: холодный пуск, выход на базовые частоты, суточные колебания температуры и сети. Когда:

  • входная линия «гуляет» (удлинители, слабая розетка, тройники),
  • пины и жгуты перегреты или окислены,
  • внутри жарко из-за пыли и рециркуляции,

он начинает выдавать питание с повышенным пульсом и «проседать». В логах это выглядит как ошибки целостности и «пилу» по оборотам; чуть позже — как срыв инициализации плат и перезапуски.

Пошаговая диагностика без пайки

Ниже — последовательность, которая экономит часы. Заголовки без цифр, но шаги соблюдаем.

Шаг первый — сток-профиль Верните штатные частоты и напряжения. Разгон маскирует первопричины и увеличивает токовые пики.

Шаг второй — журналы холодного старта Сразу после включения сохраните kernel/current/history. Отметьте временные точки первых CRC, первых fan/thermal и момента, где «сыпется» инициализация.

Шаг третий — воздухотракт и рециркуляция Продуйте решётки и радиаторы, убедитесь, что выхлоп не подсасывается во вход. Если обороты взлетают ещё до выхода в хеширование — уже плохо. База и формулы — в гайде по среде.

Шаг четвёртый — визуальный осмотр электрики Силовые кабели, вилки, удлинители, распределители:

  • потемневшие пины, «поджаренная» изоляция, запах — сигналы к замене;
  • минимизируйте переходники и «сопли»; путь до розетки должен быть коротким;
  • проверьте заземление и отсутствие люфта в розетке.

Шаг пятый — проверка коннекторов и жгутов На стороне майнера разберите и осмотрите силовые коннекторы:

  • пины должны быть чистыми и упруго фиксироваться;
  • жгуты не тянут разъёмы своим весом, нет острых перегибов;
  • раскладывайте ток равномерно по платам, не «кормите» всё одной жилой.

Шаг шестой — эталонный блок питания Повторите запуск на заведомо исправном PSU той же мощности, по короткой линии, с теми же платами. Если на эталоне тихо — исходный PSU/линия виноваты. Если симптом остаётся — идём дальше.

Шаг седьмой — шлейфы и порты Поменяйте шлейфы между платами и порты на контроллере. Если «адрес» сбоев меняется вместе с кабелем — виноват кабель/порт. Если остаётся за конкретной платой — сузили круг.

Шаг восьмой — изоляция плат Запускайте по одной плате. Если с одной платой всё идеально, а с другой появляются CRC → fan → find 0 asic, значит на второй плате локально «падает» питание или уставшие коннекторы.

Шаг девятый — повтор на другой розеточной группе Перенесите стенд на независимую линию. Регулярные сбои «по часам» часто совпадают с чужой нагрузкой в сети.

Шаг десятый — фиксация вывода Если эталон и короткая линия лечат — меняйте PSU/кабели/схему подключения. Если симптом следует за платой — готовьте её к стендовой диагностике (силовая часть, разъёмы, дорожки).

Матрица симптомов и первичных гипотез

Симптом в журнале/панели Вероятная зона Действие сейчас
Ранние CRC и «пила» по RPM Линия, PSU, земля Эталонный PSU, короткая линия, проверить заземление
find 0 asic сразу после «завывания» вентиляторов Просадка на старте, перегрев силовой части Чистка, убрать рециркуляцию, проверить коннекторы и раскладку жгутов
fan error/low RPM без явной механики Плохая опора тахо из-за просадок, разъём Перестановка вентиляторов, осмотр разъёмов, эталонный PSU
Перезапуски под нагрузкой Перегрев PSU, слабая сеть Охлаждение тракта, отдельная линия, замена удлинителей/тройников
Симптом «ходит» с кабелем Шлейф/порт/коннектор Заменить кабель, другой порт, закрепить жгут без натяжения
Симптом «привязан» к плате Локальная силовая часть/контакт Изоляция платы, сервисная диагностика платы

Как линия питания и земля ломают лог обмена

Просадки и «пила» по напряжению делают уровни сигналов и пороги детектирования «плавающими». В логе это выглядит так:

  • немедленный всплеск CRC при старте;
  • ступени PWM и срыв оборотов;
  • затем сообщения find 0 asic/chain missing либо перезапуск инициализации.

Если на эталонном PSU и независимой розетке журнал «чистый», первопричина была за пределами майнера. Возвращайтесь к исходной схеме, убирайте удлинители, меняйте «слабые» розетки, разделяйте нагрузки.

Коннекторы, жгуты и локальные просадки

Даже при идеальной сети можно «уронить» плату плохим контактом внутри:

  • нагретые пины и «осевшая» обжимка добавляют сопротивление → локальный нагрев → ещё большее сопротивление → лавина;
  • жгуты с натяжением вырывают контакт и «дергают» питание на вибрациях;
  • неравномерная раскладка даёт перегруз одной линии и роняет напряжение именно на «уделенном» пучке.

Признаки локальной проблемы:

  • симптом закреплён за одной платой при любых перестановках;
  • лёгкое «пошевеливание» жгута меняет характер ошибок;
  • на пинах заметна радуга/потемнение, пластик «пожеван».

Решение — обслуживание контактов, замена уставших жгутов, грамотная раскладка тока. Подробности про влияние на обмен — в CRC.

Температура и рециркуляция как скрытый враг питания

Горячий выхлоп, возвращаясь во вход, перегревает силовую часть и на PSU, и на платах. Пульсации растут, токовые пики «обезьянничают» оборотами вентиляторов, а контроллер ловит всё новые CRC. Решение — классика из гайда по среде:

  • разделите горячую и холодную зоны экраном;
  • уберите ненужные повороты и «мешки» в трактах;
  • держите запас по притоку/вытяжке и регулярно чистите фильтры.

Как отличить «плохой PSU/линия» от «умирающей платы»

  • Эталонный PSU на короткой линии, та же комната: если всё чисто — PSU/линия виноваты.
  • Перестановка плат: если симптом следует за конкретной платой при любой схеме питания — локальная силовая часть или коннекторы этой платы.
  • Синхронность событий: когда первые CRC и «пила» по RPM появляются до попытки поднять цепочки — это питание. Когда всё распадается после чтения EEPROM — скорее платная логика, см. EEPROM error.

Тест на эталонном PSU: как провести правильно

  • Используйте блок известно исправный и сопоставимой мощности.
  • Подключение — прямое и короткое, без тройников и удлинителей.
  • Повторите холодный старт, снимите журналы и сравните точки появления CRC, fan/thermal и статусов инициализации.
  • Если различия кардинальные — фиксируйте вывод, возвращаться к гаданию нет смысла.

Частые ошибки при работе с питанием

  • Начинать «лечение» с прошивки. Пока не исключены сеть/коннекторы/воздух, софт бессилен.
  • Держать «гирлянду» переходников и проводов. Каждый переход — сопротивление и тепловая точка.
  • Класть жгуты в натяг и через острые ребра корпуса.
  • Считать, что «вентиляторы на максимум» — это «так надо». Так бывает только при бедном потоке и пыли.

Практические сценарии

  • Комната с обратной тягой. Выхлоп частично возвращался во вход. В логах — ранние CRC, ступени PWM, периодический find 0 asic. Перегородка и усиление вытяжки стабилизировали питание — журнал «успокоился».
  • Уставшие коннекторы. Пины потемнели, пластик размягчён. При лёгком касании жгута стиль ошибок менялся. Замена коннекторов и равномерная раскладка тока устранили ребуты.
  • Плохая розеточная группа. Соседний нагреватель включался по таймеру — майнер падал «по расписанию». Перенос на независимую линию и эталонный PSU сняли вопрос.
  • Локальная платная проблема. На эталоне и короткой линии симптом оставался только с одной платой. Перестановка плат не меняла картину. Сервис выявил деградацию силовых дорожек и контактного узла — после ремонта всё стабильно.

Профилактика и эксплуатационная дисциплина

  • Короткая и чистая линия питания, без тройников и «соплей».
  • Заземление и плотная посадка вилок, качественные удлинители с запасом по току.
  • Обслуживание коннекторов: осмотр пинов раз в сезон, замена «пожеванных», отсутствие натяжения жгутов.
  • Запас по воздуху и отсутствие рециркуляции, регулярная чистка фильтров и радиаторов.
  • Стоковый профиль в жаркий сезон; разгон — только при явном запасе по PSU и охлаждению.
  • Журнал обслуживания: когда чистили, какие были температуры «вход/выход», когда ловили CRC, что меняли в электрике.

Ответы на частые вопросы

Почему рядом с проблемами питания почти всегда вспыхивает CRC Потому что при просадках и «пиле» искажаются уровни сигналов и тайминги — обмен «пачкается» ещё до того, как плата успеет прогреться.

Зачем проверять вентиляторы, если речь о PSU Потому что перегрев силовой части из-за плохого потока напрямую делает питание «грязным». Fan/thermal — индикаторы здоровья электрики не хуже мультиметра.

Эталонный PSU показал норму, но дома снова плохо. Что менять Убирайте удлинители, меняйте розетку, ставьте независимую линию, ревизуйте коннекторы и раскладку жгутов. Эталон уже доказал, что плата и прошивка ни при чём.

Можно ли «прибавить обороты» и забыть Нет. Высокий PWM лишь маскирует рециркуляцию и пыль, а PSU по-прежнему будет «пилить». Лечим первопричину — воздух и электрику.

Как понять, что проблема в одной плате Если на эталонном PSU и короткой линии только одна плата даёт связку «CRC → fan → find 0 asic», а остальные тихие — это её локальная силовая/контактная проблема.

См. также

Task Runner