Можно ли доказать, что запуск графического процессора при высоких температурах вреден для карты?


11

Если ваша видеокарта постоянно работает при температуре от 80 ° C до 90 ° C (176 ° F и 194 ° F), это действительно плохо для видеокарты? Т.е. это уменьшает срок службы карты? Можно ли это доказать? Или это только предположения?

Я понимаю, что безопасное отключение для графических процессоров обычно составляет 90 ° C (194 ° F).


«Безопасное отключение» во многом зависит от того, где измеряется температура и с каким процессом и максимальной температурой была разработана схема. Я помню некоторое время назад, что у определенного поколения процессоров Intel была максимальная номинальная температура 110 ° C, что беспокоило некоторых энтузиастов оборудования, потому что они думали, что чипы разрушат себя. Спойлер: Они этого не сделали.
Joren Vaes

1
Я думаю, что этот вопрос тесно связан с другим вопросом: « время жизни продукта как функция температуры соединения» . Суть этого вопроса в том, что каждые 15 ° C выше комнатной температуры вдвое сокращают продолжительность жизни микросхемы. Таким образом, использование графической карты при температуре 90 ° C по сравнению с 80 ° C сократит срок ее службы на ~ 37% (поэтому, если ожидаемая продолжительность жизни составляет 8 лет при температуре 80 ° C, вместо этого ~ 5 лет при температуре 90 ° C)
Гарри Свенссон,

1
Закон Аренниуса ближе к 50% снижению MTBF / 10'C, но есть другие факторы, которые следует учитывать для диэлектриков, когда они начинаются с гораздо более низкого MTBF, например 1000 ч при 85 ч или 105 ч, поэтому я подозреваю, что они используют предельные значения 105 ° C или лучше.
Тони Стюарт Sunnyskyguy EE75

Ответы:


21

Давайте изучим механизмы отказа и посмотрим, как на них влияет тепло. Очень важно помнить, что из-за того, что механизм отказа происходит быстрее с температурой, графический процессор не обязательно будет работать быстрее! Если подкомпонент, который длится 100 лет при комнатной температуре, длится только 20 лет, если он горячий, но другой подкомпонент длится всего 1 год с начала (но не зависит от тепла), срок службы вашего продукта вряд ли изменится с температура.

Я буду игнорировать проблему велосипедного движения, о которой говорил Симеон, поскольку это не моя экспертиза.

На уровне платы я могу представить себе один основной компонент, который «сломается» вместе с головкой: электролитические конденсаторы. Эти конденсаторы высыхают, и хорошо известно, что они быстрее высыхают при нагревании. (у танталовых конденсаторов также, как правило, более короткий срок службы, но я не знаю, как это меняется при нагревании).

Но как насчет кремния?

Здесь, насколько я понимаю, есть несколько вещей, которые могут вызвать сбой. Одним из главных здесь является электромиграция. В цепи электроны, проходящие сквозь куски металла, фактически физически движутся вокруг атомов. Это может стать настолько плохим, что это приведет к зазорам в проводниках, что может привести к выходу из строя.

Это изображение дает хорошую иллюстрацию (от Татьяны Козловой, Хенни В. Зандберген; исследование электромиграции in situ с помощью наномостиков Ni):

введите описание изображения здесь

Этот процесс увеличивается экспоненциально с температурой, и, таким образом, чип будет работать дольше, если температура выше, а электромиграция является основной причиной отказа.

Механизм пыльника представляет собой оксидный пробой, где внутри цепи транзисторы пострадают от пробивки затвора. Это также зависит от температуры. Тем не менее, напряжение имеет гораздо большее влияние здесь.

Существует также сдвиг VT, либо из-за дрейфа присадок, либо из-за инъекции горячего носителя. Сдвиг легирующей примеси увеличивается с температурой (но вряд ли это будет проблемой, особенно с цифровыми цепями, поскольку это очень медленный процесс). Я не уверен насчет температурной зависимости впрыска горячего носителя, но, опять же, я думаю, что напряжение является гораздо более важным фактором.

Но тогда возникает важный вопрос: насколько это уменьшает продолжительность жизни? Зная это, стоит ли следить за тем, чтобы ваша видеокарта все время оставалась прохладной? Мое предположение - нет, если только на этапе проектирования не была допущена ошибка. Цепи разработаны с учетом этих наихудших ситуаций и сделаны так, что они выживут, если они будут доведены до предельных значений для номинального срока службы производителя. В случае людей, разгоняющих цепи: увеличение напряжения, которое они часто используют для поддержания стабильности схемы (поскольку это может немного ускорить цепи), принесет гораздо больше вреда, чем сама температура. Кроме того, это увеличение напряжения приведет к увеличению тока, что значительно ускорит проблемы электромиграции.


2
Это фантастические изображения, мне всегда было интересно, как физически будет выглядеть электромиграция.
Cursorkeys

9

Да, было доказано, что тепло разрушает электрические компоненты. Металлы расширяются при нагревании, припой (используемый для соединений электрических цепей) представляет собой металлический сплав, поэтому он расширяется при нагревании. Постоянный нагрев и охлаждение будут вызывать постоянное расширение и сжатие соединений, что может привести к растрескиванию и, в конечном итоге, к разрушению соединения.

                                                      График частоты отказов против температуры

Приведенный выше график показывает, как Arrhenius'Law дает корреляцию между увеличением нагрева и поломкой полупроводника. Эта статья подробно описывает воздействие тепла на электронные компоненты. Это больше касается вещей на электронном уровне, что немного выходит за рамки моих знаний


1
Я могу поверить, что езда на велосипеде плохая из-за, как вы говорите, расширения и сжатия, но есть ли проблема с работой при высокой нагрузке и, следовательно, при высокой температуре все время?
Колин

Я разработчик ИС, поэтому у меня мало знаний о режимах сбоев на уровне платы, но за все время, что я ремонтирую (в качестве хобби), мне еще не приходилось сталкиваться с ошибками из-за циклов расширения, поэтому мне приходится сомневаться в том, насколько значительными они являются. это по сравнению с другими механизмами.
Joren Vaes

1
@Colin нет такой вещи как «высокая нагрузка все время»; если вы просто, например, не добываете биткойны на своем графическом процессоре, будут секунды, когда нагрузка будет выше, чем у других. Поскольку охлаждение должно быть достаточно мощным на графических процессорах, это уже приводит к упомянутым проблемам. Смотрите: XBox кольцо смерти.
Маркус Мюллер

@ МаркусМюллер там абсолютно есть. И не важно, что нагрузка не является абсолютно постоянной. Для езды на велосипеде важна температура дельты. Карта, которая работает в 99% случаев при нагрузке 95-100% (т.е. вычисляет) в течение заданных временных параметров, будет гораздо менее восприимчива к гипотетическому циклическому урону, чем та же самая карта, колеблющаяся между 0% и 100%, в диком выражении 50% от если (т.е. игры).
Дэн М.

6

Взаимосвязь между повышением температуры перехода полупроводника и уменьшением его MTBF (среднего времени между отказами) хорошо понятна.

Эта техническая записка от Micron говорит об этом

На практике частота отказов будет экспоненциально возрастать, когда температура перехода приближается и превышает ~ 125 ° C, поэтому, если вы работаете значительно ниже этой температуры, небольшие приращения могут быть не столь критичными.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.