Whatsminer: find 0 asic — расшифровка сообщения и что делать

Фраза «find 0 asic» в интерфейсе или в Kernel log Whatsminer означает срыв инициализации цепочки чипов: контроллер не «увидел» ни одного ASIC на соответствующей плате и не смог поднять хеширование. На практике это не одна конкретная неисправность, а группа сценариев, в которых страдает стартовая последовательность: питание «на грани», шлейфы «шумят» или теряют контакт, локальная логика платы не отдаёт корректный паспорт/калибровки из EEPROM, датчики температуры «выпадают», а иногда всё сразу.

Whatsminer: find 0 asic — расшифровка сообщения и что делать

Практический гид. Ниже — что именно проверять, как отделить «среду» от проблем самой платы, на что смотреть в логах и почему «случайно завелось после ребута» — не решение. Всё — без пайки, шаг за шагом.

Коротко о сути сообщения find 0 asic в Whatsminer

  • Контроллер не может обнаружить активные ASIC-чипы на одной из плат и прерывает запуск.
  • В большинстве кейсов это симптом сорванной инициализации: питание нестабильно, связь «шумит», датчики/память отдают недостоверные данные.
  • Рядом в логах часто идут: chain missing, EEPROM error/NG, PIC init fail/MCU init, nonce CRC/CRC high, fan error/thermal.
  • Первые действия — вернуть сток-профиль, снять kernel/current/history сразу после холодного старта, исключить PSU/шлейфы/охлаждение, изолировать плату.

Где смотреть и как читать журналы

Открывайте kernel log с самого начала холодного пуска. Смотрите последовательность: проверка вентиляторов → чтение паспортов плат → опрос датчиков → инициализация цепочки чипов → выход на базовые частоты. Найдите участок, где упоминается «find 0 asic» или «chain missing». Отметьте соседние строки про EEPROM, MCU/PIC, CRC, fan/thermal: они подскажут первичную зону.

Подсказки по формулировкам — в разборе Kernel log. Если в логах параллельно вспыхивают CRC и fan/thermal, велика вероятность, что первична среда: питание, земля, воздух.

Что это значит для пользователя

  • Хешрейт не поднимется или будет «плавать» с периодическими срывами.
  • Перезапуск иногда даёт кратковременный эффект, но первопричина остаётся — при следующем неблагоприятном сочетании условий всё повторится.
  • Эксплуатация «на авось» ускоряет износ вентиляторов, коннекторов и силовой части, повышает вероятность повреждения данных в памяти платы.

Ключевые причины по группам

  • Питание и земля. Просадки на старте, «пила» под нагрузкой, перегретые и окисленные коннекторы, сомнительные удлинители и тройники. См. PSU.
  • Шлейфы и порты. Окисление, микротрещины, неплотная посадка, натянутые жгуты, изгибы. «Цепочка отсутствует» нередко «переезжает» вместе с кабелем.
  • Датчики и охлаждение. «Выпавшие» NTC, забитые решётки, рециркуляция горячего потока. Контроллер уходит в защиту, не давая поднять цепочку. См. NTC-термистор, PWM.
  • Память и локальная логика. «Паспорт» и калибровки не читаются или считаются невалидными; локальный MCU («PIC») не завершает инициализацию. См. EEPROM и PIC-контроллер.
  • Целостность обмена. Ошибки CRC в момент старта, «шумная» земля, перегрев силовой части, агрессивные частоты. См. CRC.
  • Несостыкованные версии/профили. Редко, но возможно после вмешательств: ревизия платы и профиль не совпадают по ожиданиям.

Пошаговая методика диагностики без пайки

Ниже — от простого к сложному. Смысл — отсекать окружение и выявлять, «ходит» ли проблема за платой, кабелем или портом.

Шаг первый — вернуть сток Отключите разгон и кастомные профили. Стартовый алгоритм и «пороговые» проверки датчиков рассчитаны на штатные частоты и напряжения. Повторите холодный запуск, сохраните журналы.

Шаг второй — привести в порядок воздух Продуйте решётки, радиаторы, уберите пыль с фронта, проверьте свободный ход крыльчаток. Убедитесь, что выхлоп не возвращается во вход. Если обороты почти сразу уходят в потолок при умеренной температуре входного воздуха — поток недостаточен или датчик «врёт». См. Влияние среды.

Шаг третий — проверить питание и коннекторы Осмотрите силовые кабели и разъёмы: потемнение, следы нагрева, расшатанная посадка. При возможности повторите запуск на эталонном PSU той же мощности и на короткой линии. Если сообщение исчезает — первична электрика. Подробно — PSU.

Шаг четвёртый — перекинуть шлейфы и порты Поменяйте местами шлейфы между платами и/или используйте другой порт на контроллере. Если «find 0 asic» «переезжает» — виноват кабель/порт. Если остаётся за платой — круг сужается.

Шаг пятый — изоляция плат Запускайте устройство по одной плате. Если с двумя платами всё хорошо, а с третьей появляется «find 0 asic» — уже ясно, где искать.

Шаг шестой — сверка датчиков и вентиляторов Сравните температуры «вход/выход», посмотрите реакцию PWM и RPM. Переставьте вентиляторы местами. Если «аномалия» остаётся на разъёме — вероятна проблема в цепи управления вентилятором или в датчиках платы.

Шаг седьмой — оценить память и локальную логику Если рядом в журнале «EEPROM error/NG» или «PIC init fail», велика вероятность, что плата не отдаёт валидный «паспорт» либо MCU не завершает старт. В домашних условиях не прошивайте вслепую: задача — собрать корректные журналы и исключить окружение, затем — сервис платы. См. EEPROM, PIC-контроллер.

Шаг восьмой — проверить программные соответствия Убедитесь, что перед появлением проблемы не менялись прошивка/профили/конфиги. Несовместимость может проявляться как постоянный срыв инициализации.

Шаг девятый — повтор на другой линии Другая розеточная группа, другой удлинитель, по возможности другое помещение. Сравните журналы — часто именно сеть «подсвечивает» себя всплесками CRC и рывками оборотов на старте.

Шаг десятый — сформировать вывод Если среда, электрика и связь исключены, а «find 0 asic» жёстко связан с конкретной платой — нужна стендовая диагностика хэшборда.

Матрица «симптом → вероятная зона → действие»

Симптом в журналах Вероятная зона Что сделать сейчас
find 0 asic рядом с EEPROM error/NG Память и калибровки платы Сток, новый шлейф, запуск только с этой платой, сбор логов → сервис платы
find 0 asic и всплески CRC на старте Питание, земля, помехи, перегрев силовой части Эталонный PSU, чистка, баланс притока/вытяжки, снижение частот
find 0 asic и fan/thermal в первых строках Датчики, воздух, рециркуляция Продувка, исключить возврат выхлопа, сверка NTC и PWM
Симптом «переезжает» при перестановке кабеля Шлейф/порт Заменить шлейф, осмотреть порт/разъём на контроллере
Симптом «привязан» к одной плате при любой конфигурации Хэшборд Сервисная диагностика платы: логика/шины/силовые/датчики

Почему среда «ломает» старт чаще всего

Старт — это резкий переход по току и температуре. Слабый PSU и шумная земля дают просадки, на которых контроллер не может корректно опросить датчики, прочитать паспорт платы и поднять цепочку чипов. Пыль и рециркуляция «подгоняют» вентиляторы в потолок, усложняют тепловой режим силовой части и снижают качество питания на плате. В логах вы увидите связку: вспышки CRC, потом аномалии по fan/thermal, затем — «find 0 asic». Это классическая картина средовой первопричины.

Подробная логика и формулы для расчёта расхода воздуха — в гайде по среде. Стоит привести в порядок приток/вытяжку, устранить рециркуляцию, добавить запас по воздуху — и старт станет предсказуемым.

Питание и земля: что проверить детально

  • Силовые кабели не должны быть натянуты и перегреты; пины — чистые, без нагара.
  • Никаких «тройников» и длинных «соплей»; лучше короткая качественная линия.
  • На старте следите за поведением: если CRC и fan вспыхивают синхронно с подскоком потребления, картина указывает на просадку.
  • Распределяйте жгуты питания равномерно по платам. Один перегруженный пучок даёт локальную «темновую зону» на плате и срывает инициализацию.

Больше приёмов и признаков — в PSU и чек-листе диагностики.

Связь и шлейфы: как быстро отделить кабель от платы

  • Переставьте шлейфы между платами и порты на контроллере.
  • Если «find 0 asic» переезжает вместе с кабелем — виноват шлейф/порт.
  • Если остаётся за одной платой при любых перестановках — вопрос к самой плате: её логике, шинам и силовой части.
  • Не держите жгуты натянутыми; вибрации и перегибы — источник микротрещин.

Память и локальная логика: когда смотреть в их сторону

  • Рядом в журнале фигурируют «EEPROM error/NG», «PIC init fail/MCU».
  • Плата «немеет» именно на шаге чтения «паспорта» или сразу после него.
  • Температуры/вентиляторы ведут себя штатно, питание и шлейфы исключены.
  • В этой точке не нужно пытаться «прошить» плату без официальной процедуры: риск ок кирпичивания высок.
  • Грамотный путь — собрать логи, зафиксировать условия и направить плату в стендовый сервис. Обзор ролей узлов — в EEPROM и PIC-контроллер.

Датчики и охлаждение: как отличить ложный перегрев от реального

  • «Вентиляторы на максимум сразу» при умеренном входе и без пыли — ищите NTC или цепи управления вентиляторами.
  • «Лестница» оборотов и резкие скачки температуры в логах — признак «шумного» контакта датчика или нестабильной опоры АЦП.
  • Если перестановка вентиляторов меняет поведение — вентилятор уставший. Если нет — смотрим разъём и логику управления.
  • Датчики подробно — в NTC-термистор, логика оборотов — в PWM.

Разделение причин по времени возникновения

  • Сразу после подачи питания вспыхивают CRC и следом «find 0 asic» — картина просадки и «шумной» земли.
  • После проверки датчиков поднимается форсаж вентиляторов и сразу «find 0 asic» — картина ложного перегрева или выпавших датчиков.
  • После чтения EEPROM всё замирает и «find 0 asic» — картина «паспорта», не прошедшего проверку, или локальной логики.
  • На равномерном прогреве цепочка падает в «find 0 asic» — перегрев силовой части и падение качества питания на плате.

Сценарии из практики

  • Пыльная комната и обратная тяга. Выхлоп уходил в общий коридор и подсасывался обратно во вход. В логах — ранний форсаж вентиляторов, вспышки CRC, затем «find 0 asic». Разделили горячую и холодную зоны, усилили вытяжку — старт стабилизировался.
  • Ослабленный шлейф. «Цепочка отсутствует» переезжала при перестановке кабеля. Новый шлейф и фиксация жгутов убрали симптом.
  • Плата «немая». При любых перестановках именно с одной платой — «find 0 asic». В журнале соседствовали «EEPROM NG» и «PIC init fail». Плата отправлена на стенд: восстановление «паспорта» и ревизия силовой части.
  • Жара и просадки. В жару аппарат чаще падал в «find 0 asic». На эталонном PSU и сниженных частотах старт проходил; финальное решение — усилить вытяжку, вернуться к стоку, заменить уставшие коннекторы.

Частые ошибки при диагностике

  • Начинать с прошивки. Пока не исключены питание, воздух и шлейфы, любая «прошивка» лишь добавит рисков.
  • Игнорировать журналы холодного старта. Именно там видна связка событий.
  • Держать «змеиное гнездо» из кабелей. Натянутые и перекрученные жгуты ломают контакт и перетирают изоляцию.
  • Пытаться «лечить оборотами». Если причина в датчике или воздухе, «накрутка» PWM лишь маскирует проблему.

Профилактика и правила эксплуатации

  • Рабочий профиль — штатный, особенно в тёплое время и при высокой запылённости.
  • Фильтрация притока и регулярная чистка решёток и радиаторов. Рециркуляции быть не должно.
  • Электрика: короткая линия, качественные кабели, плотная посадка без натяжения, равномерное распределение жгутов.
  • Журнал обслуживания: даты чистки, версии прошивок, температуры «вход/выход», обороты при типовой нагрузке, случаи «find 0 asic» и что помогло.

Вопросы и ответы

Почему после перезапуска иногда «вдруг» всё запускается Потому что условия оказались благоприятными: воздух чуть холоднее, контакт временно «прихватился», ток вырос мягче. Но первопричина никуда не делась.

Если в журнале фигурируют и «find 0 asic», и «EEPROM NG», что главное Главное — последовательность. Если ошибки памяти идут до попытки поднять цепочку — работаем по памяти/логике. Если память чистая, а цепочка не поднимается — смотрим связь, питание и датчики.

Можно ли «обмануть» датчики и заставить плату стартовать Не стоит. Защитные пороги — не прихоть: ложный старт быстро добьёт силовую часть и ускорит деградацию.

Как понять, что проблема точно не в комнате Повтор на эталонном PSU, с чистым воздухом и без рециркуляции. Если на таком стенде всё стабильно — первична была среда. Если нет — ищем конкретную плату/кабель/порт.

Чем «find 0 asic» отличается от «chain missing» В реальной диагностике почти ничем: оба сообщают, что цепочка не поднялась. Практические шаги одинаковые.

Навигация и связанные материалы

Task Runner