Для начала я бы предложил краткий поиск по « диагностике модели линейной регрессии ». Но вот некоторые, которые я бы посоветовал вам проверить:
Убедитесь, что предположения удовлетворительно выполнены
Используйте график рассеяния или компонент плюс остаточный график, чтобы исследовать линейные отношения между независимым предиктором (ами) и зависимой переменной.
Составьте график со стандартизированным остатком по сравнению с прогнозируемым значением и убедитесь, что не существует экстремальной точки с очень высоким остатком, а разброс остатка в значительной степени аналогичен по прогнозному значению, а также в значительной степени одинаково выше и ниже среднего значения остатка, нуль.
Вы также можете изменить ось Y на остаточное . Этот график помогает выявить неравную дисперсию.2
Пересмотрите план исследования, чтобы убедиться в его разумности.
Получите коэффициент инфляции дисперсии (VIF) или статистику толерантности для изучения возможной коллинеарности.
Изучить потенциальные влиятельные точки
- Проверьте статистику, такую как Cook's D, DFits или DF Beta, чтобы узнать, сильно ли определенная точка данных меняет ваши результаты регрессии. Вы можете найти больше здесь .
Изучите изменения в статистике и скорректированнойR2R2
- Будучи отношением суммы квадратов регрессии к общей сумме квадратов, может сказать вам, сколько% изменчивости в вашей зависимой переменной объясняется моделью.R2
- Скорректированное можно использовать, чтобы проверить, действительно ли дополнительная сумма квадратов, приведенная к моему дополнительному предиктору (ам), действительно стоит тех степеней свободы, которые они получат.R2
Проверьте необходимое взаимодействие
- Если существует основной независимый предиктор, прежде чем делать какую-либо интерпретацию его независимого эффекта, проверьте, взаимодействует ли он с другими независимыми переменными. Взаимодействие, если оно не отрегулировано, может повлиять на вашу оценку.
Примените вашу модель к другому набору данных и проверьте ее производительность
- Вы также можете применить формулу регрессии к другим отдельным данным и посмотреть, насколько хорошо они предсказывают. Хорошим началом может послужить график, подобный точечной диаграмме, и статистика, например, разница в% от наблюдаемого значения.
r-squared
тег иgoodness-of-fit
тег ..