NTC-термистор в майнинге — датчик температуры: как работает, почему вентиляторы крутятся на 100% и как диагностировать

NTC-термистор (Negative Temperature Coefficient) — это резистивный датчик, сопротивление которого уменьшается при росте температуры. В майнинге NTC используются для измерения температуры воздуха и/или элементов на плате (VRM, радиаторы, зона чипов). Контроллер сравнивает показания с порогами и через алгоритм управления оборотами подаёт нужную скважность на вентиляторы (см. PWM вентилятора). Любые проблемы с NTC — от обрыва цепи до плохого контакта — немедленно отражаются на охлаждении: вентиляторы «залипают» на 100%, включаются аварии перегрева, либо, наоборот, система недокручивает обороты.

NTC-термистор в майнинге — датчик температуры: как работает, почему вентиляторы крутятся на 100% и как диагностировать

Коротко по NTC

  • NTC — основной источник температурных данных для контроллера майнера.
  • Некорректные показания → неправильный режим PWM: перманентные 100% оборотов, троттлинг, остановка по перегреву.
  • Первые шаги: сток-профиль, очистка, проверка потоков воздуха, внятная проверка кабелей/разъёмов/шлейфов, наблюдение логов.
  • Если симптом «ходит» за конкретной платой/датчиком даже в стоке и на другом PSU — вероятна аппаратная проблема датчика/цепи.

Что такое NTC-термистор и как он измеряет температуру

  • NTC — резистор с отрицательным ТКС (температурным коэффициентом): при нагреве сопротивление падает.
  • Характеристика задаётся параметрами (например, R25 и B-параметр). Часто в электронике применяются 10 кОм NTC с типовым диапазоном −40…+125 °C (номиналы и допуски отличаются по моделям майнеров и ревизиям плат).
  • Схема включения: NTC образует делитель напряжения, который оцифровывается АЦП контроллера. По напряжению рассчитывается температура по калибровочной кривой (или по таблице).
  • Калибровки: для адекватной работы важна верная калибровка/коэффициенты. Сбитые калибровки дают «врет» датчик даже при живом NTC (см. EEPROM про хранение «паспорта/калибровок»).

Где находятся NTC в майнерах

  • На хэшбордах — контролируют локальные температуры в ключевых точках (радиаторы, VRM, зона чипов).
  • В тракте воздуха — «вход» и «выход» для оценки эффективности обдува и окружающей среды.
  • Возле силовых элементов — защита от перегрева силовой части и корректное управление оборотами.

Конкретные места и количество NTC зависят от модели и ревизии. В логах обычно есть упоминания температур, по которым видно, какой датчик «выпадает» из картины.

Как контроллер использует данные NTC

  • Целевые пороги: есть диапазон нормальной работы и критические уровни.
  • Кривая оборотов: чем жарче — тем выше скважность PWM, пока вентиляторы не достигнут 100% (см. PWM вентилятора).
  • Защита: при превышении критических уровней — аварийные реакции: форсаж вентиляторов, понижение частот, остановка по перегреву (thermal throttling/shutdown).

Типичные симптомы неисправности NTC или его цепей

Симптом Что видим на практике Что это значит
Вентиляторы постоянно 100% Даже в прохладном помещении, сразу после старта Контроллер «думает», что очень жарко, или не получает валидное значение от датчика (обрыв/плохой контакт/ошибка калибровки)
Провалы/скачки температуры Температура резко прыгает на десятки градусов «Шумный» контакт, трещина дорожки, нестабильное питание/АЦП, влажность/конденсат
Троттлинг без видимых причин Частоты падают, хешрейт проседает, вентиляторы шумят Контроллер реагирует на ложный перегрев по датчику или на локальную горячую точку
Один датчик «выпал» У одного источника температура 0 °C, 255 °C или «—» Обрыв/короткое в датчике/цепи, сбой калибровки, ошибка в чтении
Невозможность пройти инициализацию Ошибка в логах на старте, форсаж вентиляторов Датчик вне диапазона, контроллер не может корректно выбрать кривую оборотов

Почему «залипают» 100% обороты

  • Обрыв/короткое в цепи датчика: АЦП получает «нелепое» напряжение → контроллер исходит из худшего случая.
  • Плохие контакты: вибрации/окисление, неустойчивый сигнал → алгоритм видит риск перегрева и держит 100%.
  • Сбитые калибровки: неверные коэффициенты/таблицы — датчик «врет». Калибровки иногда лежат в памяти платы (см. EEPROM).
  • Неправильное расположение/обдув: датчик «видит» не то, что реально греется (мертвое место потока).
  • Нестабильное питание: шум/просадки на линии опорного напряжения АЦП, общих проводниках. Иногда совпадает со всплесками ошибок в журнале температур/CRC/вентиляторов. Смотрите PSU.

Пошаговая диагностика (без пайки)

  1. Сток-профиль: отключить разгон/касты; вернуть рекомендуемые частоты/напряжения.
  2. Чистота и поток воздуха: очистить от пыли, убедиться в свободном прохождении воздуха, проверить ориентацию и состояние решёток/фильтров.
  3. Наблюдение температур: сравнить «вход/выход» и локальные датчики. Ищем аномалии (0 °C, 255 °C, «—», прыжки).
  4. Логи: зафиксировать kernel/current/history вокруг событий перегрева/форсажа вентиляторов; сверить время с изменением оборотов.
  5. Перестановка плат/шлейфов: изолировать, за какой платой «ходит» аномалия. Меняем местами шлейфы/платы, чтобы понять, где первопричина.
  6. Питание и земля: проверить шнуры/контакты/распределение нагрузки; если можно — другой блок питания на том же стенде (см. PSU).
  7. Температурный тест: холодный старт → наблюдать рост показаний; лёгкий прогрев (нагрузка) → рост должен быть плавным. Резкие ступени указывают на контакт/цепь.
  8. Повторяемость: проблема держится в стоке и на другом PSU/шлейфах → вероятна аппаратная неисправность датчика/цепи на конкретной плате → сервисная диагностика.

Таблица «симптом → причина → действие»

Симптом Вероятные причины Что сделать сначала Если не помогло
Вентиляторы 100% постоянно Обрыв/короткое в NTC, плохой контакт, неверные калибровки Сток, чистка, проверка логов, сравнение датчиков, перестановка плат/шлейфов Диагностика цепи датчика на плате, проверка калибровок, ремонт
Скачки температуры Контакт/влажность/АЦП/питание Проверить кабели/разъёмы, стабилизировать питание, контроль влажности Диагностика платы (цепи АЦП/NTC), ремонт
Троттлинг «на ровном месте» Ложный перегрев или локальная горячая зона Улучшить обдув, проверить «выпадающий» датчик, логика PWM Ревизия охлаждения, диагностика NTC на плате
Один датчик «выпал» Обрыв датчика/цепи, неверные коэффициенты Изоляция по платам/датчикам, сверка калибровок Ремонт цепи/замена датчика, корректировка калибровок
Ошибка при старте Датчик вне диапазона, нет валидного чтения Холодный рестарт в стоке, проверка разъёмов/шлейфов Сервис платы/цепей измерения

Практика измерений и калибровок (общая логика)

  • Номинал: часто встречается 10 кОм при 25 °C, но в конкретных моделях возможны отличия (смотрите документацию/ревизию).
  • B-параметр определяет кривую «сопротивление ↔ температура». При замене критично подобрать аналог с близкими параметрами.
  • Монтаж: термический контакт с измеряемой зоной важнее «красивой» цифры в даташите — датчик не должен висеть «в воздухе».
  • Геометрия потока: датчик «в воздухе» лучше ставить так, чтобы на него влиял именно общий поток через майнер, а не локальные завихрения.
  • Влажность/конденсат: повышенная влажность делает контакты «шумными», что приводит к скачкам показаний.

Профилактика и эксплуатация

  • Регулярная чистка от пыли, контроль притока/вытяжки.
  • Стабильное питание, корректное заземление, отсутствие «пилы» на линии.
  • Ведение журнала: когда чистили, какие температуры в норме, при какой ambient начался троттлинг.
  • Отказ от разгона в жаркие периоды: перегрев быстрее разрушает окружающие элементы, включая термисторы.

Вопросы и ответы

Почему вентиляторы крутятся на 100% сразу после включения? Контроллер не видит валидных данных по температуре (обрыв/ошибка датчика) или видит опасно высокую температуру. По умолчанию включается форсаж как безопасный режим.

Можно ли «калибровкой» исправить скачки? Калибровка не починит «шумный» контакт/влажность/обрыв. Сначала диагностика цепи, потом — проверка коэффициентов/таблиц.

Стоит ли ставить «любой 10к NTC»? Нельзя вслепую: важен не только номинал, но и B-параметр, допуск, корпус и тепловая связь. Неподходящий NTC даст неверные температуры и неправильную работу PWM.

Если один датчик показывает 0 °C, а остальные норму — это он «умер»? Чаще всего да: для контроллера это признак обрыва/вне диапазона. Но исключите проблему АЦП/цепей измерения на плате.

Как соотнести температуру и поведение вентиляторов

  • В холодном помещении обороты должны плавно нарастать при нагрузке.
  • При уменьшении нагрузки/охлаждении — плавно снижаться (без «пилы» и резких ступеней).
  • Если обороты скачут при стабильной температуре — ищите контакт/питание/логическую ошибку (см. PWM вентилятора).

Где смотреть и как читать логи

Для понимания причин используйте kernel/current/history: отметьте, когда стартуют вентиляторы на 100%, какие температуры зафиксированы, есть ли аномалии по одному из датчиков. Подсказки по сообщениям смотрите в разборе Kernel log.

См. также

Task Runner