Определение семейства раздачи?


14

Имеет ли семейство распределения другое определение статистики, чем в других дисциплинах?

В общем, семейство кривых - это набор кривых, каждая из которых задается функцией или параметризацией, в которой один или несколько параметров варьируются. Такие семейства используются, например, для характеристики электронных компонентов .

Для статистики семейство в соответствии с одним источником является результатом изменения параметра формы. Как тогда мы можем понять, что гамма-распределение имеет параметр формы и масштаба, и, кроме того, только обобщенное гамма-распределение имеет параметр местоположения? Делает ли это семью результатом изменения параметра местоположения? Согласно @whuber значение семейства подразумевается неявно . «Параметризация» семейства - это непрерывное отображение из подмножества ℝ n с его обычной топологией в пространство распределений, образ которого является этим семейством.n

Что на простом языке означает семья для статистических распределений?

Вопрос об отношениях между статистическими свойствами распределений из одного и того же семейства уже породил значительное противоречие с другим вопросом, поэтому представляется целесообразным изучить его значение.

То, что это не обязательно простой вопрос, вытекает из его использования во фразе экспоненциального семейства , которое не имеет ничего общего с семейством кривых, но связано с изменением формы PDF распределения путем репараметризации не только параметров , но также подстановка функций независимых случайных величин.


1
Выражая выражение «семья распределения», подразумеваете ли вы что-то еще «семейство распределения»? Экспоненциальное семейство - это семейство распределений (с определенными свойствами), и, интерпретируя pdf каждого распределения как кривую, оно даже соответствует семейству кривых, поэтому последние абзацы кажутся запутанными.
Юхо Коккала

@JuhoKokkala Это кажется странным, потому что значение «семья» зависит от контекста. Например, нормальное распределение неизвестного среднего значения и известной дисперсии относится к семейству экспонент. Нормальное распределение имеет бесконечный носитель , а экспоненциальное распределение имеет полубесконечный носитель [ 0 , + ) , поэтому семейства кривых для экспоненциального распределения, охватывающего область нормального распределения, не существует. распределение, они никогда не имеют одинаковую форму ...(,+)[0,+)
Карл

@JuhoKokkala ... и экспоненциальный PDF даже не имеет параметра местоположения, тогда как нормальное распределение не может обойтись без него. См. Ссылку выше для необходимых замен и контекста, в котором нормальный PDF находится в экспоненциальном семействе.
Карл

1
stats.stackexchange.com/questions/129990/… может иметь отношение к делу. «нормальное распределение неизвестного среднего значения и известной дисперсии в экспоненциальной семье», насколько мне известно, злоупотребление терминологией (хотя и довольно распространенное). Точнее, экспоненциальное семейство - это семейство распределений с определенными свойствами. Семейство нормальных распределений с неизвестной средней и дисперсией известной является экспоненциальным семейством; семейство экспоненциальных распределений - это другое экспоненциальное семейство и т. д.
Юхо Коккала

1
@JuhoKokkala: «Семейство» так часто (ab) используется, в особом случае, как «множество семей», возможно, стоит дать другой ответ. (Я не могу думать о других случаях - по какой - то причине, кажется , нет склонного к разговору о «не-один в расположении масштабе семьи».)
Scortchi - восстановит Моника

Ответы:


14

Статистические и математические концепции абсолютно одинаковы, понимая, что «семья» - это общий математический термин с техническими вариациями, адаптированными к различным обстоятельствам:

Параметрическое семейство - это кривая (или поверхность, или другое ее конечномерное обобщение) в пространстве всех распределений.

Остальная часть этого поста объясняет, что это значит. Кроме того, я не думаю, что что-либо из этого является спорным, ни математически, ни статистически (кроме одной незначительной проблемы, которая отмечена ниже). В поддержку этого мнения я привел много ссылок (в основном на статьи Википедии).


Эта терминология «семейств» имеет тенденцию использоваться при изучении классов функций в виде множества Y или «отображений». Учитывая область X , А семейство F отображений на X параметрироваться на некотором множестве thetas ; ( «параметры») является функцияCYYX FX Θ

F:X×ΘY

для которых (1) для каждого & ; , функция F θ : X Y задается F & thetas ; ( х ) = Р ( х , θ ) в C Y и (2) Р сама по себе имеет некоторые "хорошие" свойства.θΘFθ:XYFθ(x)=F(x,θ)CYF

Идея состоит в том, что мы хотим варьировать функции от до Y «плавным» или контролируемым образом. Свойство (1) означает, что каждая θ обозначает такую ​​функцию, в то время как детали свойства (2) будут охватывать тот смысл, в котором «небольшое» изменение θ вызывает достаточно «небольшое» изменение F θ .XYθθFθ

Стандартный математический пример, близкий к упомянутому в вопросе, является гомотопией . В этом случае - категория непрерывных отображений из топологических пространств X в топологическое пространство Y ; Θ = [ 0 , 1 ] R единичный интервал с его обычной топологией, а также потребовать , чтобы Р быть непрерывное отображением из топологического произведения X × thetas ; в Y . Это можно рассматривать как «непрерывную деформацию карты FCY XYΘ=[0,1]RFX×ΘY до F 1. "Когда X = [ 0 , 1 ] сам является интервалом, такие отображения являютсякривымив Y, а гомотопия представляет собой плавную деформацию от одной кривой к другой.F0F1X=[0,1]Y

Для статистических приложений - это множество всех распределений на R (или на практике на R n для некоторого n , но для простоты изложения я сосредоточусь на n = 1 ). Мы можем отождествить его с набором всех неубывающих функций Кадляга R[ 0 , 1 ], где замыкание их диапазона включает в себя как 0, так и 1 : это кумулятивные функции распределения или просто функции распределения. Таким образом, X = R иCYRRnnn=1R[0,1]01X=R .Y=[0,1]

Семейство распределений является любое подмножество . CY Другое название семьи - статистическая модель. Он состоит из всех распределений, которые, как мы полагаем, управляют нашими наблюдениями, но в противном случае мы не знаем, какое распределение является действительным.

  • Семья может быть пустой.
  • сама семья.CY
  • Семья может состоять из одного распределения или только конечного их числа.

Эти абстрактные теоретико-множественные характеристики представляют относительно небольшой интерес или полезность. Только когда мы рассматриваем дополнительную (соответствующую) математическую структуру на , эта концепция становится полезной. Но какие свойства C Y представляют статистический интерес? Некоторые, которые появляются часто:CYCY

  1. -выпуклое множество: для любых двух распределений F , G C Y мы можем сформироватьраспределение смеси(1-t) F +t GYдля всехt[0,1]. Это своего рода «гомотопности» отFкG.CYF,GCY (1t)F+tGYt[0,1]FG

  2. Большие части поддерживают различные псевдометрики, такие как расхождение Кульбака-Лейблера или тесно связанная метрика информации Фишера.CY

  3. имеет аддитивную структуру: соответствующая любых двух распределенийFиGявляется их суммой, Р С .CYFGFG

  4. поддерживает много полезных, естественных функций, часто называемых «свойствами». К ним относятся любой фиксированный квантиль (например, медиана), а такжекумулянты.CY

  5. является подмножествомфункционального пространства. Как таковой, он наследует много полезных метрик, таких какsup-норма( L ∞- норма), заданная как | | F-G | | = sup x R | F(x)-G(x) | ,CYL

    ||FG||=supxR|F(x)G(x)|.
  6. Естественные действия группы на индуцируют действия на C Y . Наиболее распространенными действиями являются трансляции T μ : x x + μ и масштабирования S σ : x x σ для σ > 0 . Влияние, которое они оказывают на распределение, заключается в отправке F в распределение, определяемое как F μ , σ ( x ) = F ( ( x - μ )RCY Tμ:xx+μ Sσ:xxσσ>0F . Это приводит к понятиям семейства масштаба и их обобщений. (Я не предоставляю ссылку, потому что обширные поиски в Интернете приводят к множеству различных определений: здесь, по крайней мере, может быть немного противоречий.)Fμ,σ(x)=F((xμ)/σ)

Важные свойства зависят от статистической проблемы и от того, как вы собираетесь анализировать данные. Рассмотрение всех вариантов, предложенных предыдущими характеристиками, заняло бы слишком много места для этой среды. Давайте сосредоточимся на одном общем важном приложении.

Взять, к примеру, Максимальное правдоподобие. В большинстве приложений вы захотите использовать исчисление для получения оценки. Чтобы это работало, вы должны уметь «брать дериваты» в семье.

( Технический стороне: Обычный способ , в котором это достигается заключается в выборе домена & для D 0 и указать непрерывный, локально обратимое функцию р из & thetas в C Y (это означает , что для каждого. & Thetas ; ∈ & thetas ; есть существует шар B ( θ , ϵ ) с ϵ > 0, для которого p B ( θ , ϵ ) :ΘRdd0pΘCYθΘB(θ,ϵ)ϵ>0 взаимно однозначно. Другими словами, если мы изменим θ на достаточно малую величину, мы всегда получим другое распределение.))pB(θ,ϵ):B(θ,ϵ)ΘCYθ

Следовательно, в большинстве приложений ML мы требуем , чтобы быть непрерывным (и , надеюсь, дифференцируема почти всюду) в & thetas компонента. (Без преемственности максимизация вероятности обычно становится неразрешимой проблемой.) Это приводит к следующему ориентированному на вероятность определению параметрического семейства :pΘ

Параметрическое семейство (одномерных) распределений представляет собой локально обратимое отображение где Θ R n , для которого (a) каждый F θ является функцией распределения и (b) для каждого x R , функция L x : θ [ 0 , 1 ] определяется как L x ( θ ) = F ( x , θ )

F:R×Θ[0,1],
ΘRnFθxRLx:θ[0,1]Lx(θ)=F(x,θ) непрерывен и почти везде дифференцируем.

Обратите внимание, что параметрическое семейство - это больше, чем просто набор F θ : оно также включает конкретный способ, которым значения параметра θ соответствуют распределениям.FFθθ

Давайте в итоге приведем несколько иллюстративных примеров.

  • Пусть - множество всех нормальных распределений. Как дано, это не параметрическая семья: это просто семья. Чтобы быть параметрическим, мы должны выбрать параметризацию. Одним из способов является выбор Θ = { ( μ , σ ) R 2σ > 0 } и отображение ( μ , σ ) на нормальное распределение со средним μ и дисперсией σ 2 .CYΘ={(μ,σ)R2σ>0}(μ,σ)μσ2

  • Множество пуассоновских распределений(λ) представляет собой параметрическое семейство с .λΘ=(0,)R1

  • (θ,θ+1)θR1Fθ(x)=max(0,min(1,xθ))θθ{x,x1}

  • FGF(x,θ)=(1θ)F(x)+θG(x)θ[0,1]FθF(x)+G(x)

  • ΘR4

  • CYCYp:ΘCYCYΘCY


2
У меня уйдет около дня, чтобы переварить ваш ответ. Мне придется медленно жевать. Между тем, спасибо.
Карл

F:R×Θ[0,1]

1
Разве второе предложение этого ответа не служит тому требованию простоты?
whuber

ИМХО, какой бы неосведомленной она не была из-за незавершенности, она не говорит о том, чем не является семья. Концепция «в пространстве всех распределений», похоже, относится только к статистике.
Карл

1
Я принял ваш ответ. У вас достаточно информации, чтобы я мог применить ее к рассматриваемому вопросу.
Карл

1

Для решения конкретной проблемы, поднятой в вопросе: «экспоненциальное семейство» не обозначает набор распределений. (Стандартное, скажем, экспоненциальное распределение является членом семейства экспоненциальных распределений, экспоненциального семейства; семейства гамма-распределений, также экспоненциального семейства; семейства распределений Вейбулла, а не экспоненциального семейства; & любого числа о других семьях, о которых вы могли бы мечтать.) Скорее, «экспоненциальный» здесь относится к собственности, которой владеет семья распределений. Поэтому мы должны говорить не о «распределениях в экспоненциальном семействе», а о «экспоненциальных семействах распределений» - первое - это злоупотребление терминологией, как указывает @JuhoKokkala. По какой-то причине никто не совершает это насилие, когда речь идет о семьях масштаба.


0

Благодаря @whuber достаточно информации, чтобы подвести итог, я надеюсь, в более простой форме, касающейся вопроса, из которого возник этот пост. «Другое название семьи [ Sic , статистическая семья] - [ статистическая модель ] ».

(S,P)SPS

(S,P)P={Pθ:θΘ}ΘΘRddRd


P={Pμ,σ(x)12πσexp((xμ)22σ2):μR,σ>0}.
In this example, the dimension, d, equals 2, end quote.

Thus, if we reduce the dimensionality by assigning, for the example above, μ=0, we can show a family of curves by plotting σ=1,2,3,4,5 or whatever choices for σ.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.