Первое, что нужно сделать, это формализовать то, что мы подразумеваем под «более тяжелым хвостом». Можно условно посмотреть, насколько высока плотность в крайнем хвосте после стандартизации обоих распределений, чтобы иметь одинаковое местоположение и масштаб (например, стандартное отклонение):
(из этого ответа, который также имеет отношение к вашему вопросу )
[Для этого случая масштабирование в действительности не имеет значения; t все равно будет «тяжелее», чем нормальное, даже если вы используете очень разные весы; нормальное всегда опускается в конце концов]
Тем не менее, это определение - хотя оно работает хорошо для этого конкретного сравнения - не очень хорошо обобщает.
В более общем смысле, гораздо лучшее определение можно найти в ответе Уубера . Поэтому, если имеет более тяжелый хвост, чем , так как становится достаточно большим (для всех некоторого ), то , где , где - это cdf (для более тяжелых - справа, есть аналогичное очевидное определение с другой стороны).YXtt>t0SY(t)>SX(t)S=1−FF
Здесь он находится в логарифмическом масштабе и в квантильной шкале нормали, что позволяет нам увидеть более подробно:
Таким образом, «доказательство» более тяжелой хвостика будет включать сравнение cdf и показ того, что верхний хвост t-cdf в конечном итоге всегда лежит выше, чем у нормали, а нижний хвост t-cdf в конечном итоге всегда лежит ниже, чем у нормали.
В этом случае проще всего сравнить плотности, а затем показать, что из этого должно следовать соответствующее относительное положение файлов cdf (/ функций оставшихся в живых).
Так, например, если вы можете утверждать, что (при некотором заданном )ν
x2−(ν+1)log(1+x2ν)>2⋅log(k)†
для необходимой константы (функция ), для всех некоторого , тогда можно было бы установить более тяжелый хвост для также в определении в терминах большего (или большего на левый хвост).kνx>x0tν1−FF
† (эта форма следует из разности логарифмов плотностей, если это имеет место для соблюдения необходимой взаимосвязи между плотностями)
[На самом деле это возможно показать для любого (не только для конкретного, который нам нужен, исходя из соответствующих констант, нормализующих плотность), поэтому результат должен сохраняться для нам нужно.]kk