Поскольку вопрос может быть истолкован разными способами, я разделю этот ответ на две части.
- A: распределение семей.
- B: семейства распределения масштаба местоположения.
Проблема со случаем A может быть легко решена / продемонстрирована многими семействами с параметром формы.
Проблема со случаем B является более сложной, поскольку кажется, что для определения местоположения и масштаба достаточно указать полтора параметра (местоположение в и масштаб в ), и возникает проблема: два параметра могут также использоваться для кодирования (нескольких) форм. Это не так тривиально. Мы можем легко придумать конкретные семейства шкал с двумя параметрами и продемонстрировать, что у вас нет разных форм, но это не доказывает, что это фиксированное правило для любых семейств с двумя параметрами.RR>0
A: Могут ли два разных распределения из одного и того же семейства двухпараметрических распределений иметь одинаковое среднее значение и дисперсию?
Ответ - да, и это уже можно показать, используя один из явно упомянутых примеров: нормализованное гамма-распределение
Семейство нормированных гамма-распределений
Пусть а - гамма-распределенная переменная. (Кумулятивное) распределение является следующим:Z=X−μσXZ
FZ(z;k)={01Γ(k)γ(k,zk−−√+k)ififz<−k−−√z≥−k−−√
где - неполная гамма-функция.γ
Таким образом, здесь ясно, что разные и (распределения из семейства нормированных гамма-распределений) могут иметь одинаковое среднее значение и дисперсию (а именно и ), но различаться в зависимости от параметра (часто обозначаемого как параметр 'shape'). Это тесно связано с тем фактом, что семейство гамма-распределений не является семейством масштабов местоположения.Z1Z2μ=0σ=1k
B: Могут ли два разных распределения из одного и того же семейства распределений масштаба расположения с двумя параметрами иметь одинаковое среднее значение и дисперсию?
Я считаю, что ответ будет отрицательным, если мы рассмотрим только гладкие семейства (гладкие: небольшое изменение параметров приведет к небольшому изменению распределения / функции / кривой). Но этот ответ не так тривиален, и когда мы будем использовать более общие (негладкие) семейства, тогда мы можем сказать « да» , хотя эти семейства существуют только в теории и не имеют практической значимости.
Создание семейства масштабов местоположения из одного распределения путем перевода и масштабирования
Из любого конкретного отдельного дистрибутива мы можем создать семейство масштабов местоположения путем перевода и масштабирования. Если является функцией плотности вероятности одиночного распределения, то функция плотности вероятности для члена семейства будетf(x)
f(x;μ,σ)=1σf(x−μσ)
Для семейства масштабов местоположения, которое может быть сгенерировано таким образом, мы имеем:
- для любых двух членов и если их средние значения и дисперсии равны, тоf(x;μ1,σ1)f(x;μ2,σ2)f(x;μ1,σ1)=f(x;μ2,σ2)
Могут ли для всех двух семейств параметров масштабирования местоположения их распределения элементов быть сгенерированы из одного распределения элементов путем преобразования и масштабирования?
Таким образом, перевод и масштабирование могут преобразовать один дистрибутив в семейство масштабов местоположения. Вопрос заключается в том, верно ли обратное, и можно ли с помощью перевода и масштабирования описать каждые два параметра семейства масштабов местоположений (где параметры и не обязательно должны совпадать с местоположением и scale ) из одного члена из этой семьи.θ1θ2μσ
Для конкретных двухпараметрических семейств с масштабом местоположения, таких как семейство нормальных распределений, не так уж сложно показать, что они могут быть сгенерированы в соответствии с описанным выше процессом (масштабирование и преобразование одного примера члена).
Можно задаться вопросом, возможно ли, чтобы каждые два параметра семейства масштабов местоположения генерировались из одного члена путем преобразования и масштабирования. Или противоречивое утверждение: «Может ли двухпараметрическое семейство масштабов местоположения содержать два разных распределения членов с одинаковым средним и дисперсией?», Для которого необходимо , чтобы семейство представляло собой объединение нескольких подсемейств, каждое из которых генерируется переводом и масштабирование.
Случай 1: Семейство обобщенных t-распределений Стьюдентов, параметризованных двумя переменными
Придуманный пример возникает, когда мы делаем какое-то отображение из в ( cardinality-of-mathbbr-and-mathbbr2 ), которое позволяет свободно использовать два параметра и для описания объединения нескольких подсемейств, которые генерируется переводом и масштабированием.R2R3θ1θ2
Давайте используем (трехпараметрическое) обобщенное t-распределение Стьюдента:
f(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πν√σ(1+1ν(x−μσ)2)−ν+12
с тремя параметрами, измененными следующим образом:
μσν===tan(θ1)θ2⌊0.5+θ1/π⌋
тогда мы имеем
f(x;θ1,θ2)=Γ(⌊0.5+θ1/π⌋+12)Γ(⌊0.5+θ1/π⌋2)π⌊0.5+θ1/π⌋√θ2(1+1⌊0.5+θ1/π⌋(x−tan(θ1)θ2)2)−⌊0.5+θ1/π⌋+12
который можно рассматривать как семейство масштабов с двумя параметрами (хотя и не очень полезное), которое не может быть сгенерировано путем перевода и масштабирования только одного члена.
Случай 2: семейства масштаба местоположения, созданные отрицательным масштабированием одного распределения с ненулевым перекосом
Менее надуманный пример, чем использование этой функции загара, дается Уубер под комментариями ответа Карла. У нас может быть семейство котором изменение знака сохраняет среднее значение и дисперсию неизменными, но, возможно, изменяет неравные более высокие моменты. Таким образом, это немного упрощает семейство шкал с двумя параметрами, где члены с одинаковым средним и дисперсией могут иметь разные моменты более высокого порядка. Этот пример из Whuber можно разделить на два подсемейства, каждое из которых может быть сгенерировано из одного члена путем преобразования и масштабирования.x↦f(x/b+a)b
Гладкие семьи
Если мы попытаемся создать одно гладкое семейство двухпараметрических распределений (гладкое: небольшое изменение параметров приведет к небольшому изменению распределения / функции / кривой), каким-то образом составив композицию из двух или более семейств, которые генерируются в результате преобразования и масштабирование, тогда мы сталкиваемся с проблемами, чтобы два параметра охватывали как изменение «среднего» и «дисперсии», так и третий параметр «форма». Формальное доказательство должно идти тем же путем, что и ответ на вопрос: существует ли гладкая сюръективная функция ? f:R2↦R3(где ответ отрицательный в случае гладких , т.е. бесконечно дифференцируемых, функций, хотя существуют непрерывные функции, которые будут выполнять работу, такие как кривые Пеано).
Интуиция: представьте, что есть некоторые параметры , которые описывают распределения в некотором семействе распределений в масштабах местоположения и с помощью которых мы можем изменить среднее значение и дисперсию, а также некоторые другие моменты, тогда мы сможем выразить , , в терминах среднего значения и дисперсииθ1θ2θ1θ2μσ
θ1θ2==fθ1(μ,σ)fθ2(μ,σ)
но это должны быть многозначные функции, и они не могут выполнять непрерывные переходы; различные значения из для конкретного и не являются непрерывными и не смогут моделировать параметр непрерывной формы.fθ1(μ,σ)μσ
Я на самом деле не так уверен в этой заключительной части. Мы могли бы использовать кривую заполнения пространства (такую как кривая Пеано, если бы мы только знали, как выразить координаты на кривой в координаты гиперкуба), чтобы один параметр полностью моделировал множество объектов, таких как среднее значение и дисперсия, без отказ от свойства, что небольшое изменение параметра эквивалентно небольшому изменению функции в каждомθ1θ1f(x;θ1)x