Почему RANSAC не наиболее широко используется в статистике?


26

Исходя из области компьютерного зрения, я часто использовал метод RANSAC (Random Sample Consensus) для подгонки моделей к данным с большим количеством выбросов.

Тем не менее, я никогда не видел, чтобы он использовался статистиками, и у меня всегда было впечатление, что его не считают «статистически обоснованным» методом. Почему это так? Это случайный характер, что затрудняет анализ, но так же как и методы начальной загрузки.

Или это просто случай, когда академические бункеры не разговаривают друг с другом?


1
Я удивляюсь одной вещи о методах компьютерного зрения и статистических методах: производительность в первом случае обязательна. Возможно, существует компромисс между производительностью и «правильностью», и компьютерное зрение и статистика имеют разные веса для этих переменных.
Лукас Рейс

Ответы:


10

Я думаю, что ключевым моментом здесь является отбрасывание большой части данных в RANSAC.

В большинстве статистических приложений некоторые распределения могут иметь тяжелые хвосты, и поэтому небольшие числа выборок могут искажать статистическую оценку. Надежные оценки решают эту проблему, взвешивая данные по-разному. RANSAC, с другой стороны, не пытается приспособиться к выбросам, он создан для случаев, когда точки данных действительно не принадлежат, а не просто распределены ненормально.


1
Отличный ответ. Я видел RANSAC, наиболее часто используемый в CV для оценки гомографий. Это наиболее широко используется, когда мы знаем, что некоторые из соответствующих измерений чрезвычайно ненадежны. Кроме того, производительность в реальном времени и другие соображения сделали эту технику достаточно популярной, поскольку ее легко распараллелить.
Лука,

7

Для нас это всего лишь один пример сильной регрессии - я полагаю, что она используется и статистиками, но, возможно, не так широко, потому что у нее есть некоторые более известные альтернативы.


1
Можете ли вы привести примеры альтернатив? Я хотел бы изучить это.
Боссыкена

5
Наиболее известной и самой простой является средне-медианная регрессия, хорошо известная из умных калькуляторов (вздох!). Обратитесь также к Wikipedia en.wikipedia.org/wiki/Robust_regression и, возможно, к более надежному

Существуют ли альтернативы RANSAC, которые дают не только объективную регрессию, но и точки данных, по которым была оценена модель? Спасибо
Валерио

2

Это очень похоже на упаковку, которая часто используется.


3
RANSAC очень отличается - в упаковке все образцы учитываются в некотором роде. RANSAC используется в тех случаях, когда до 50% данных следует полностью отбросить.
nbubis

1

Вы отбрасываете данные с помощью RANSAC, возможно, не оправдывая их, но основываясь на увеличении соответствия модели. Отбрасывание данных для увеличения соответствия обычно избегается, поскольку вы можете потерять важные данные. Удаление выбросов без обоснования всегда проблематично.

Конечно, это можно оправдать. Например, если вы знаете, что данные должны следовать заданному шаблону, но также имеются отклонения в данных от шаблона из-за ошибки в измерениях.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.