Выход в DRAM и другие массово избыточные процессы


9

Сейчас я собираю литературу по электротехнике о стратегиях, используемых для надежного производства очень сложных, но и чрезвычайно хрупких систем, таких как DRAM, где у вас есть множество миллионов компонентов и где один отказ может разрушить всю систему. ,

Похоже, что используемой общей стратегией является изготовление гораздо более крупной системы, а затем выборочное отключение поврежденных строк / столбцов с помощью устанавливаемых предохранителей. Я читал [1], что (по состоянию на 2008 г.) ни один модуль DRAM не выходит из строя, и что для модулей DDR3 емкостью 1 ГБ со всеми технологиями восстановления общий выход составляет от ~ 0% до приблизительно 70%. ,

Однако это всего лишь одна точка данных. Что мне интересно, так это то, что рекламируется на местах? Есть ли достойный источник для обсуждения улучшения урожайности по сравнению с SoA? У меня есть источники, подобные этому [2], которые достойно обсуждают доходность рассуждений из первых принципов, но это 1991 год, и я думаю / надеюсь, что сейчас все лучше.

Кроме того, используется ли избыточные строки / столбцы до сих пор? Сколько дополнительного места на плате требует эта технология резервирования?

Я также смотрел на другие параллельные системы, такие как TFT-дисплеи. Коллега упомянул, что Samsung однажды обнаружил, что дешевле производить сломанные дисплеи, а затем ремонтировать их, а не улучшать процесс до приемлемой производительности. Однако я пока не нашел достойного источника по этому вопросу.

Refs

[1]: Gutmann, Ronald J, et al. Технологическая технология Ics уровня 3-й пластины. Нью-Йорк: Спрингер, 2008. [2]: Хоригучи, Масахи и др. «Гибкий метод резервирования для DRAM высокой плотности». Твердотельные схемы, IEEE Journal of 26.1 (1991): 12-17.


3
Резервирование строк и столбцов все еще используется сегодня. В кеше Itanium 2 L3 использовалась избыточность на уровне блоков (см. Stefan Rusu et al., «Процессор Itanium 2 6M: более высокая частота и больший кэш L3», 2004). Еще одним соображением относительно производительности является распределение по скорости / мощности / рабочей температуре и «емкости» (например, чиповые мультипроцессоры могут продаваться с диапазоном количества ядер; даже DRAM с большим количеством дефектов теоретически может продаваться как половина емкости). часть).
Пол А. Клейтон

увлекательно, спасибо. Глядя на структуру кэша, я вижу 140 подмассивов, каждый с 2 ​​подбанками, которые в свою очередь имеют восемь блоков массивов 96x256. Каждый блок имеет 32 бита. Это означает, что в общей сложности 140 * 2 * 8 * 96 * 256 * 32 = 1.762x10 ^ 9 бит требуется для получения 48x10 ^ 6 бит памяти. Это правильно?
Мефистофель

3
Нет, 32 бита являются частью блока 96x256 (12 способов кэширования * 8 * 4 * 32 бита на строку кэша). Также следует отметить, что некоторые биты используются для ECC, поэтому в кеше было 6 МБ данных . (Использование ECC приводит к еще одному сокращению урожайности при биннинге. Требования ECC варьируются в зависимости от приложения, и избыточный ECC может использоваться для поддержки более низкого напряжения (или частоты обновления для DRAM) без потери данных для части с низким энергопотреблением, а также для обеспечения коррекции для производства. дефекты. Это более теоретическое соображение, так как маркетинговые факторы обычно не допускают такой гибкости.)
Пол А. Клейтон

еще раз спасибо. Это больше для оценки общей стоимости производственного процесса. То есть, сколько дополнительного места на плате (в качестве представителя затраченных физических ресурсов) требуется для достижения этих 6 МБ? Я попытаюсь оценить это по площади, занятой кешем L3, и вернусь к вам.
Мефистофель

2
Использование области битовых ячеек не учитывает декодирование строк и другие издержки. Издержки области избыточности можно было бы просто оценить, если признать, что 4 из 140 подмассивов являются запасными (чуть меньше 3% накладных расходов), игнорируя дополнительные издержки маршрутизации. Также следует отметить, что 3-мегабайтные версии L3-кеша были проданы, поэтому доходность для 6-мегабайтных версий была ниже. (Я предполагаю, что использование транзисторов большего размера, чем минимальный для ячеек SRAM, для более низкой утечки может также немного снизить эффективную частоту дефектов.) 136 используемых подмассивов указывает 8 для ECC (6 +% служебных данных).
Пол А. Клэйтон,

Ответы:


1

Ни один производитель никогда не выпустит данные об урожае, если они не будут вынуждены по какой-либо причине. Это считается коммерческой тайной. Так что, чтобы ответить на ваш вопрос напрямую, нет, это не рекламируется в отрасли.

Тем не менее, есть много инженеров, чья работа заключается в повышении пропускной способности и производительности в конце линии. Это часто состоит в использовании таких методов, как группирование и избыточность блоков, чтобы сделать потери от линейной функции достаточными для реализации. Блочная избыточность, безусловно, используется сегодня. Это довольно легко проанализировать:

(отказавшие блоки на часть) / (блоки на часть) * (отказавшие блоки на часть) / (блоки на часть)

Это даст вам вероятность отказа обоих параллельных блоков. Я сомневаюсь, что вы получите доходность до 70%, так как обычно 90% - это минимально допустимая доходность.


2
Хотя я ценю ваш ответ, @ Paul-a-clayton предоставил эту информацию и также смог привести в комментариях реальные публикации (в частности, Itanium 2). Кроме того, хотя в этих статьях обсуждается избыточность блоков, в нем говорится: «Такое использование подрешеток оптимизирует использование площади матрицы, не ограничивая план этажа ядра», без упоминания отказоустойчивости. Если у вас есть документы, которые специально предлагают избыточность блоков в качестве инструмента для устранения ошибок, они будут очень благодарны.
Мефистофель
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.