У меня есть данные о серии выигрышных и проигрышных ставок за 5 раундов ставок с истощением после каждого раунда. Я использую дерево решений, подобное следующему, для отображения данных.
Узлы к вершине дерева - это те, которые имеют выигрышные ставки, а узлы к нижней части дерева имеют ряд проигрышных ставок. Я хочу посмотреть на (а) истощение в каждом узле (б) изменения средних размеров ставок в каждом узле. Я смотрю на уровень истощения в каждом узле от предыдущего узла и коэффициент выживания (используя ожидаемое количество людей в каждом узле, если вероятность составляет 50%). Например, если вероятность составляет 50% в каждом узле, из 1000 начавшихся примерно 500 человек должны быть в каждом из вторых узлов, W и L. Гипотеза состоит в том, чтобы (а) скорость истощения была выше после потери Ставки (b) означают, что размер ставки уменьшается после проигравших и повышается после победителей.
Я просто хочу сделать это в очень простой одномерной установке в первую очередь. Как я могу выполнить t-тест, чтобы показать, что изменение среднего размера ставки от узла WW к узлу WWW является статистически значимым, если выпало 50 человек? Я не уверен, что это правильный подход: каждая последующая ставка независима, но люди выбывают после проигравших, поэтому выборка не совпадает. Если бы это был случай, когда один и тот же класс сдавал серию экзаменов один за другим, и никто не выбывал, я бы понял, как выполнить соответствующий t-тест, но я думаю, что это немного по-другому.
Как я могу это сделать? Кроме того, если результаты искажаются небольшим количеством клиентов, как я могу вынуть верхние 5% и нижние 5%? Просто уберите клиентов с наибольшим совокупным размером ставки из ставки 1 - 3?
У меня есть данные, из которых была сгенерирована фигура, поэтому у меня есть среднее, стандартная ошибка, стандартная ошибка и т. Д. На каждом узле.