Несколько месяцев назад я стажировался в этой организации; и, как уходящий подарок, я решил потратить мою последнюю неделю, в любое свободное время, чтобы исследовать факторы, которые влияют на зарплату учителей. Одна проблема, с которой я столкнулся с зарплатами учителей, состояла в том, что распределение для данного штата было искажено. У меня было много наблюдений, которые цеплялись за нижнюю границу спектра заработной платы. Я попытался решить эту проблему, включив сопоставимый индекс заработной платы в мою зависимую переменную (заработная плата учителя), но результаты, которые я нашел, были полностью устаревшими для объема моего проекта. Вместо этого я решил записать свою зависимую переменную. Это было хорошо, потому что теперь моя зарплата имела нормальное распределение, и она просто выглядела идеально на гистограмме. Когда я начал тестирование, я дошел до того, что остался с последней независимой переменной - декларацией о налоге на имущество. Проблема с моей нормативной заработной платой была также очевидна в моих наблюдениях за уплатой налога на недвижимость. У меня был огромный перекос номеров налоговых деклараций на недвижимость в нижней части спектра. Итак, я зарегистрировал эту переменную, и она все еще прошла тест на нулевую гипотезу.
Я не уверен, что это точно правильно, но сравнение изменения одной зарегистрированной переменной с другой зарегистрированной переменной дало мне эластичность. Предполагая, что это правильно, мое уравнение регрессии (что-то вроде LogWages = B0 + B1 (LogPropertyTaxReturns)) показывает эластичность между двумя переменными. Это имеет смысл, хотя? Если моя цель состояла в том, чтобы выяснить, какая переменная больше всего влияет на заработную плату учителей в каком-либо конкретном округе моего штата, то помогает ли показать эластичность между двумя переменными? Мы хотим поднять округа с самыми низкими зарплатами учителей выше, чтобы повысить их уровень жизни, но я боюсь, что я экстраполировал настолько далеко от реальных наблюдений, что мое заключительное уравнение регрессии не имеет смысла.
Редактировать: один из моих больших страхов заключается в том, что я должен был использовать нелинейную модель, чтобы показать отношения. Я чувствую, что принуждение как зависимой, так и независимой переменной к сотрудничеству в этой линейной регрессии в некотором смысле вводит в заблуждение.