Если я даю два квантиля и соответствующие им местоположения (каждый) в открытом интервале , могу ли я всегда найти параметры бета-распределения, в котором эти квантили находятся в указанных местоположениях?( l 1 , l 2 ) ( 0 , 1 )
Если я даю два квантиля и соответствующие им местоположения (каждый) в открытом интервале , могу ли я всегда найти параметры бета-распределения, в котором эти квантили находятся в указанных местоположениях?( l 1 , l 2 ) ( 0 , 1 )
Ответы:
Ответ - да, при условии, что данные удовлетворяют очевидным требованиям согласованности. Аргумент прост, основан на простой конструкции, но требует некоторой настройки. Это сводится к интуитивно привлекательному факту: увеличение параметра в бета- распределении увеличивает значение его плотности (PDF) больше при большем чем меньшем ; и увеличение делает противоположное: чем меньше , тем больше значение PDF увеличивается.
Подробности следуют.
Пусть желаемый квантиль будет а желаемый квантиль будет с и (следовательно) 1 > x 2 > x 1 > 0 . Тогда существуют уникальные a и b, для которых распределение Beta ( a , b ) имеет эти квантили.
Сложность с демонстрацией этого заключается в том, что распределение бета включает в себя непостоянную нормализующую константу. Напомним определение: для и распределение Beta имеет функцию плотности (PDF)
Нормализующая константа - это бета-функция
Все становится грязным, если мы пытаемся дифференцировать напрямую по отношению к и , что было бы грубым способом сделать попытку демонстрации.
Один из способов избежать анализа бета-функции - это отметить, что квантили являются относительными областями. Это,
для . Здесь, например, являются PDF и функция распределения (CDF) , из Beta распределения , для которых и .
Функция плотности показана слева. - площадь под кривой слева от , обозначенная красным цветом, относительно общей площади под кривой. - область слева от , равная сумме красных и синих областей, опять же относительно общей площади . CDF справа показывает, как и отметьте две разные точки на нем.
На этом рисунке был установлен на уровне , был выбран , чтобы быть 1,15 , а затем значение б было найдено , для которых ( х 1 , д 1 ) лежит на Бета ( а , б ) CDF.
Лемма : Такой всегда можно найти.
Чтобы быть точным, пусть будет исправлена раз и навсегда. (Они остаются неизменными на следующих рисунках: во всех трех случаях относительная площадь слева от равна ) Для любого Лемма утверждает, что существует уникальное значение , написанное для которого - квантиль беты распределение.
Чтобы понять почему, сначала отметим, что, когда приближается к нулю, все вероятности накапливаются вблизи значений , откуда приближается к . Когда приближается к бесконечности, все вероятности накапливаются вблизи значений , откуда приближается к . Между ними функция строго увеличивается в .
Это утверждение геометрически очевидно: это означает, что если мы посмотрим на область слева под кривой относительно общей площади под кривой и сравним ее с Относительная площадь под кривой при , тогда последняя область является относительно большей. Соотношение этих двух функций . Это функцияравная при сбросив устойчиво к при Поэтому высоты функции являютсяотносительно большечем высота для слева от чем они для справа от Следовательно,площадьслева от в первом должна бытьотносительнобольше, чем площадь справа от (Это легко перевести в строгий аргумент, например, используя сумму Римана.)
Мы видим , что функция строго монотонно возрастает с предельных значений на и , как и соответственно. Это также (ясно) непрерывно. Следовательно, существует число где и это число уникально, доказывая лемму.
Тот же аргумент показывает, что с увеличением увеличивается площадь слева от . Следовательно, значения изменяются на некотором интервале чисел в прогрессии от почти до почти Предел при равен
Вот пример, где близко к (это равно ). С и (как и в предыдущем рисунке), Между и x 2 почти нет области :
CDF практически плоский между и откуда практически сверху В пределе при ,
В другом крайнем случае , достаточно большие значения приводят к сколь угодно близким к Ниже приведен пример с , как и раньше.
Здесь и составляет почти Теперь по существу равно справа от x 2 почти нет области .
Следовательно, вы можете выбрать любое между и и изменять до Так же , как и раньше, это должно быть уникальным, что и требовалось доказать .
Рабочий R
код для поиска решений размещен в разделе Определение параметров бета-распределения и β из двух произвольных точек (квантилей) .