Говорить о « точек в гиперкубе » немного вводит в заблуждение, поскольку гиперкуб содержит бесконечно много точек. Давайте вместо этого поговорим о томе.99%
Объем гиперкуба является произведением длины его сторон. Для 50-мерного единичного гиперкуба мы получаемTotal volume=1×1×⋯×150 times=150=1.
Теперь давайте исключим границы гиперкуба и посмотрим на « внутренность » (я поставил это в кавычки, потому что математический термин « интерьер» имеет совершенно другое значение). Мы оставляем только те точки x=(x1,x2,…,x50) которые удовлетворяют
0.05<x1<0.95 and 0.05<x2<0.95 and … and 0.05<x50<0.95.
Каков объем этого «интерьера»? Что ж, «внутреннее пространство» снова является гиперкубом, а длина каждой стороны равна0.9 (=0.95−0.05 ... это помогает представить это в двух и трех измерениях). Таким образом, объемInterior volume=0.9×0.9×⋯×0.950 times=0.950≈0.005.
Сделайте вывод, что объем «границы» (определяется как единичный гиперкуб безинтерьер ) 1−0.950≈0.995.
Это показывает, что 99.5% объема 50-мерного гиперкуба сосредоточено на его « границе ».
Продолжение : Игнатий поднял интересный вопрос о том, как это связано с вероятностью. Вот пример.
Допустим, вы придумали модель (машинного обучения), которая прогнозирует цены на жилье на основе 50 входных параметров. Все 50 входных параметров независимы и равномерно распределены между 0 и 1 .
Допустим, ваша модель работает очень хорошо, если ни один из входных параметров не является экстремальным: пока каждый входной параметр остается в диапазоне от 0,05 до 0,95 , ваша модель почти идеально прогнозирует цену на жилье. Но если один или несколько входных параметров являются экстремальными (меньше 0,05 или больше 0,95 ), прогнозы вашей модели абсолютно ужасны.
Любой заданный входной параметр является экстремальным с вероятностью всего 10 % . Так ясно, что это хорошая модель, верно? Нет! Вероятность того, что хотя бы один из 50 параметров является экстремальным, составляет 1 - 0,950≈ 0,995.
Так что в 99,5 % случаев прогноз вашей модели ужасен.
Эмпирическое правило. В больших измерениях экстремальные наблюдения являются правилом, а не исключением.