Я не уверен, какой метод использовать для моделирования отношений между двумя переменными ( и y ) в эксперименте, описанном ниже:
- Есть 3 переменные: , x и y .
- Значение устанавливается при проведении эксперимента. Однако x и x a i m не всегда равны.
- Коэффициент корреляции Пирсона между и x составляет около 0,9.
- Коэффициент корреляции Пирсона между и y намного меньше: около 0,5.
- имеет максимально возможное значение ( y m a x ), которое не может быть превышено.
- Каждая точка данных получается после установки и считывания x и y .
Хотя коэффициент корреляции Пирсона между и y невелик, похоже, что y имеет тенденцию к увеличению с увеличением x .
После выполнения простых линейных регрессий и x = g ( y ) (и преобразования последнего обратно в g - 1 , чтобы отображаться на том же графике, что и f, например), оба наклона являются положительными, но наклон g - 1 больше, чем у f .
Имеет ли смысл говорить или x m a x = g ( y m a x ) ? ( x m a x будет достигнут раньше во втором случае.)
Учитывая, что связан с y m a x , что можно сказать о возможном максимальном значении x, которое может быть достигнуто?
Насколько я понимаю, имеет смысл выполнить линейную регрессию вида когда x является независимой переменной, а y является зависимой переменной. Однако в этом контексте я не уверен, имеет ли смысл считать, что x является независимым, а y - зависимым.
Будет ли более уместной полная регрессия наименьших квадратов? Существуют ли другие способы определения того, какие значения могут быть достигнуты (и с какой вероятностью)?
(Если это имеет значение, и y , кажется, не следуют нормальному распределению, так как было сделано больше попыток достичь более высоких значений x .)