Это проблема выравнивания виртуальных процессоров (VP) с физическими процессорами (PP) графического процессора. Поскольку число PP часто является степенью 2, использование числа VP, отличного от степени 2, приводит к снижению производительности.
Вы можете увидеть отображение ПО на ПП в виде кучи кусочков размером ПП .
Скажем, у вас есть 16 пп.
Вы можете нанести на них 16 ПО: 1 ПО сопоставлено с 1 ПО.
Вы можете нанести на них 32 ПО: 2 среза по 16 ПО, 1 ПО будет отвечать за 2 ПО.
И т. Д. Во время исполнения каждый ПП будет выполнять задание 1-го ПП, за которое он отвечает, затем задание 2-го
ПП и т. Д. Если вы используете 17 ПП, каждый ПП будет выполнять задание своего 1-го ПП, тогда 1 ПП будет выполнить задание 17-го Иостальные ничего не сделают (уточнено ниже).
Это связано с парадигмой SIMD (называемой вектором в 70-х годах), используемой графическими процессорами. Это часто называют параллелизмом данных: все PP делают одно и то же одновременно, но с разными данными. Смотрите https://en.wikipedia.org/wiki/SIMD .
Точнее, в примере с 17 VP, после выполнения работы 1-го среза (всеми PP, выполняющими работу 1-го VP), все PP будут выполнять одну и ту же работу (2nd VP), но только у одного есть несколько данные для работы .
Ничего общего с обучением. Это всего лишь программирование.