Я работаю с большим набором данных акселерометра, собранных несколькими датчиками, которые носят многие люди. К сожалению, здесь никто не знает технических характеристик устройств, и я не думаю, что они когда-либо были откалиброваны. У меня нет много информации об устройствах. Я работаю над магистерской диссертацией, акселерометры были заимствованы из другого университета, и в целом ситуация была немного прозрачной. Итак, предварительная обработка на борту устройства? Понятия не имею.
Что я знаю, так это то, что это трехосные акселерометры с частотой дискретизации 20 Гц; цифровой и предположительно MEMS. Меня интересует невербальное поведение и жесты, которые, по моим источникам, должны в основном производить активность в диапазоне 0,3-3,5 Гц.
Нормализация данных кажется совершенно необходимой, но я не уверен, что использовать. Очень большая часть данных близка к остальным значениям (необработанные значения ~ 1000 от силы тяжести), но есть некоторые крайности, например, до 8000 в некоторых журналах или даже 29000 в других. Смотрите изображение ниже . Я думаю, что это делает плохой идеей деление на max или stdev для нормализации.
Какой обычный подход в таком случае? Разделить на медиану? Процентиль значение? Что-то другое?
Как побочный вопрос, я также не уверен, должен ли я обрезать крайние значения ..
Спасибо за любой совет!
Изменить : вот график около 16 минут данных (20000 выборок), чтобы дать вам представление о том, как данные обычно распределяются.