В статистической литературе имеется много ссылок на « функциональные данные » (то есть данные, которые являются кривыми), и параллельно, на « высокоразмерные данные » (то есть, когда данные являются векторами с высокой размерностью). Мой вопрос о разнице между этими двумя типами данных.
Говоря о прикладных статистических методологиях, которые применяются в случае 1, можно понимать как перефразирование методологий из случая 2 через проекцию в конечномерное подпространство пространства функций, это могут быть полиномы, сплайны, вейвлет, Фурье, ... и переведет функциональную задачу в конечномерную векторную задачу (поскольку в прикладной математике все в некоторой точке становится конечным).
Мой вопрос: можем ли мы сказать, что любая статистическая процедура, которая применяется к функциональным данным, может также применяться (почти напрямую) к данным больших измерений и что любая процедура, предназначенная для данных больших размеров, может (почти напрямую) применяться к функциональным данным?
Если ответ «нет», можете ли вы проиллюстрировать это?
РЕДАКТИРОВАТЬ / ОБНОВИТЬ с помощью ответа Саймона Бирна:
- разреженность (S-разреженное предположение, ball и слабый l p ball при p < 1 ) используется в качестве структурного допущения в статистическом анализе высокой размерности.
- «Гладкость» используется в качестве структурного допущения при анализе функциональных данных.
С другой стороны, обратное преобразование Фурье и обратное вейвлет-преобразование преобразуют разреженность в гладкость, а гладкость преобразуется в разреженность посредством вейвлет-преобразования и преобразования Фурье. Это делает критическую разницу, упомянутую Саймоном, не такой критичной?