Мы изучаем машинное обучение с помощью машинного обучения: вероятностная перспектива (Кевин Мерфи). Хотя в тексте объясняется теоретическая основа каждого алгоритма, в нем редко говорится, в каком случае какой алгоритм лучше, а когда - нет, но не говорится, как определить, в каком случае я нахожусь.
Например, для выбора ядра мне было предложено провести исследовательский анализ данных, чтобы оценить, насколько сложны мои данные. В простых двумерных данных я могу построить график и посмотреть, подходит ли линейное или радиальное ядро. Но что делать в более высоком измерении?
В целом, что люди имеют в виду, когда говорят «узнать ваши данные», прежде чем выбрать алгоритм? Прямо сейчас я могу различить только классификацию и алгоритм регрессии, и линейный и нелинейный алгоритм (который я не могу проверить).
РЕДАКТИРОВАТЬ: Хотя мой первоначальный вопрос о универсальном эмпирическом правиле, меня попросили предоставить больше информации о моей конкретной проблеме.
Данные: панель с каждой строкой, представляющей месяц страны (всего ~ 30 000 строк, охватывающих ~ 165 стран за ~ 15 лет).
Ответ: 5 бинарных переменных, представляющих интерес (т. Е. Произошли ли протест / переворот / кризис и т. Д. В этом месяце).
Особенности: ~ 400 переменных (смесь непрерывных, категориальных, двоичных), детализирующих набор характеристик двух предыдущих страновых месяцев (можно создать более длительное отставание). Мы используем только запаздывающую переменную, так как целью является прогноз.
Примерами могут служить обменный курс, рост ВВП (непрерывный), уровень свободной прессы (категориальный), демократия, конфликт между соседями (бинарный). Обратите внимание, что многие из этих 400 функций являются лаговыми переменными.