У меня есть данные для двух групп (то есть выборок), которые я хочу сравнить, но общий размер выборки небольшой (n = 29) и сильно несбалансированный (n = 22 против n = 7).
Эти данные сложны с точки зрения логистики и дороги для сбора, поэтому «собрать больше данных» как очевидное решение в данном случае бесполезно.
Был измерен ряд различных переменных (дата отъезда, дата прибытия, продолжительность миграции и т. Д.), Поэтому существует несколько тестов, некоторые из которых сильно различаются (меньшая выборка имеет более высокую дисперсию).
Первоначально коллега проводил t-тесты на этих данных, и некоторые были статистически значимыми с P <0,001, другие не были значимыми с P = 0,069. Некоторые образцы были нормально распределены, другие - нет. Некоторые тесты включали большие отклонения от «равных» отклонений.
У меня есть несколько вопросов:
- уместны ли здесь t-тесты? Если нет, то почему? Относится ли это только к тестам, в которых выполняются предположения о нормальности и равенстве дисперсий?
- что является подходящей альтернативой (ами)? Возможно тест перестановки?
- неравная дисперсия раздувает ошибку I типа, но как? и как маленький несбалансированный размер выборки влияет на ошибку типа I?