Краткий ответ: да, вероятностным путем. Можно показать, что при любом расстоянии , любом конечном подмножестве пространства выборки и любом предписанном «допуске» для подходящих больших размеров выборки мы можем быть убедитесь, что вероятность того, что выборочная точка находится на расстоянии от составляет для всех .{ x 1 , … , x m } δ > 0 ϵ x i > 1 - δ i = 1 , … , mϵ>0{x1,…,xm}δ>0ϵxi>1−δi=1,…,m
Длинный ответ: я не знаю ни о какой прямо связанной цитате (но см. Ниже). Большая часть литературы по Латинской выборке гиперкубов (LHS) относится к ее свойствам уменьшения дисперсии. Другой вопрос: что значит сказать, что размер выборки имеет тенденцию к ? Для простой случайной выборки IID выборка размера может быть получена из выборки размера путем добавления дополнительной независимой выборки. Что касается LHS, я не думаю, что вы можете сделать это, так как количество образцов указано заранее как часть процедуры. Получается, что вы должны взять последовательность независимых выборок LHS размера .п п - 1 1 , 2 , 3 , . , ,∞nn−11,2,3,...
Также должен быть какой-то способ интерпретации «плотного» предела, поскольку размер выборки стремится к . Плотность, по-видимому, не поддерживается детерминистически для LHS, например, в двух измерениях вы можете выбрать последовательность выборок LHS размером , чтобы они все придерживались диагонали . Так что какое-то вероятностное определение кажется необходимым. Пусть для каждого , быть образцом размера генерируется в соответствии с некоторым стохастическим механизмом. Предположим, что для разных эти выборки независимы. Тогда для определения асимптотической плотности нам может потребоваться, чтобы для каждого и для каждого∞1,2,3,...[0,1)2nXn=(Xn1,Xn2,...,Xnn)nnϵ>0x в выборочном пространстве (предполагается, что ), мы имеем ( как ).[0,1)dP(min1≤k≤n∥Xnk−x∥≥ϵ)→0n→∞
Если выборка получается путем взятия независимых выборок из распределения («случайная выборка IID»), то где - объем мерного шара радиуса . Так что, конечно, случайная выборка IID асимптотически плотна.XnnU([0,1)d)
P(min1≤k≤n∥Xnk−x∥≥ϵ)=∏k=1nP(∥Xnk−x∥≥ϵ)≤(1−vϵ2−d)n→0
vϵdϵ
Теперь рассмотрим случай, когда образцы получены LHS. Теорема 10.1 в этих заметках гласит, что все члены выборки распределены как . Тем не менее, перестановки, используемые в определении LHS (хотя и независимые для разных измерений), вызывают некоторую зависимость между членами выборки ( ), поэтому менее очевидно, что свойство асимптотической плотности выполняется.XnXnU([0,1)d)Xnk,k≤n
Исправьте и . Определите . Мы хотим показать, что . Для этого мы можем использовать предложение 10.3 в этих заметках , которое является своего рода центральной теоремой о пределе для выборки из латинского гиперкуба. Определите как если находится в шаре радиуса вокруг , в противном случае . Тогда предложение 10.3 говорит нам, что где иϵ>0x∈[0,1)dPn=P(min1≤k≤n∥Xnk−x∥≥ϵ)Pn→0f:[0,1]d→Rf(z)=1zϵxf(z)=0Yn:=n−−√(μ^LHS−μ)→dN(0,Σ)μ=∫[0,1]df(z)dzμ^LHS=1n∑ni=1f(Xni) .
Возьмите . В конце концов, для достаточно большого у нас будет . Таким образом, в конечном итоге у нас будет . Поэтому , где - стандартный нормальный cdf. Поскольку был произвольным, отсюда следует, что как требуется.L>0n−n−−√μ<−LPn=P(Yn=−n−−√μ)≤P(Yn<−L)lim supPn≤lim supP(Yn<−L)=Φ(−LΣ√)ΦLPn→0
Это доказывает асимптотическую плотность (как определено выше) как для случайной выборки iid, так и для LHS. Неформально это означает, что с учетом любого и любого в пространстве выборки вероятность того, что выборка окажется в пределах от может быть сделана настолько близкой к 1, насколько вы пожелаете, выбрав достаточно большой размер выборки. Понятие асимптотической плотности легко расширить, чтобы применить к конечным подмножествам выборочного пространства - применяя то, что мы уже знаем, к каждой точке конечного подмножества. Более формально это означает, что мы можем показать: для любого и любого конечного подмножества выборочного пространства,ϵxϵxϵ>0{x1,...,xm}min1≤j≤mP(min1≤k≤n∥Xnk−xj∥<ϵ)→1 (как ).n→∞