Что делать с смешанными переменными?


9

Мне нужно сделать эксперимент. Сначала позвольте мне описать текущую ситуацию. Компания, в которой я работаю, - это кино. Здесь есть игровой раздел, где люди, которые ждут фильмов, могут проводить время, играя в игры. Люди могут платить только с помощью предоплаченной членской карты. К сожалению, этот игровой раздел не дает достаточно продаж. Мы пытаемся найти причину (ы).

Моя гипотеза: если мы примем наличные в качестве оплаты, продажи увеличатся.

Мой план состоит в том, чтобы иметь экспериментальную группу и контрольную группу. Экспериментальная группа примет оплату наличными, контрольная группа - нет. Продажи обеих групп подсчитываются до и после эксперимента.

Сложность в том, что я не могу найти способ изолировать фактор «наличных платежей» от других факторов:

  • Когда фильм в кинотеатре будет хорошим, придет больше людей, и продажи также увеличатся
  • В каждом кинотеатре есть только одна игровая секция, я не могу разделить ее на две секции (одна принимает наличные, другая нет)
  • Если несколько сайтов принимают наличные, а несколько других нет, я не думаю, что могу сравнить результаты напрямую, потому что посетители разные, количество игровых единиц разное

Я ищу предложения, чтобы изолировать эту переменную «наличный платеж», или, возможно, другой подход в целом.


Сколько кинотеатров там, примерно?
2010 года

Ой, извините, пять, у одного нет игрового раздела
Энди Тяхджоно

Ответы:


6

Вот несколько советов, касающихся вашего пункта выше:

  • Как насчет использования ежедневных сборов в качестве объясняющей переменной?
    • Что вам нужно сделать, это сформировать уравнение, в котором вы прогнозируете продажи игр с учетом ряда других факторов. К таким факторам относятся вещи, которые вас интересуют, например, использовали ли они карту предоплаты. Тем не менее, вы должны также включить факторы, которые вас не интересуют, но которые необходимо скорректировать, такие как ежедневные поступления. Очевидно, что если фильм станет блокбастером, то продажи игр возрастут.
  • Предположим, у вас есть N кинотеатров. Выберите N / 2 кинотеатров и поместите их в группу A, а остальные перейдите в группу B. Теперь пусть группа A будет контрольной группой, а B - экспериментальной группой. Если возможно, чередуйте эту настройку, т.е. сделайте группу А экспериментальной установкой на несколько недель.
  • Если вы можете смешивать группы (точка выше), то это не проблема. Даже если вы не можете, вы можете включить переменную, представляющую количество игровых единиц.

Статистические методы, которые вам, вероятно, понадобятся, это множественная линейная регрессия (MLR). По сути, вы строите уравнение вида:

Gaming sales = a0 + a1*Prepaid + a2*Takens + a3*<other things>

где

  • a0 , a1 , a2 - просто числа
  • Предоплата либо 0, либо 1
  • Взятые являются ежедневными.

MLR позволит вам рассчитать значения a0-a2 . Таким образом, если a1 большое, это означает, что Prepaid важен.


Мне не ясно, как использовать ежедневные поступления, не могли бы вы уточнить это, пожалуйста?
Энди Тяхджоно

@endy_c Это помогает?
csgillespie

Хорошо, так что вместо того, чтобы пытаться устранить смещение из фильма, я могу включить его в эксперимент, понял, спасибо!
Энди Тяхджоно

2

Как насчет сравнения до и после того, как вы введете опцию наличных в двух группах? Скажем, вы назначаете половину кинотеатров опциону наличными (лечение), а половину - безналичным (контроль). Теперь вы можете сравнить, как продажи изменились в группе лечения после введения опции наличных, а также сравнить, как продажи изменились в контрольной группе. Если денежный вариант действительно эффективен, то изменение в группе лечения будет больше, чем изменение в контрольной группе.

Я вспоминаю, как читал интересный статистический анализ, проведенный профессором Айалой Коэн в статистической лаборатории Техниона для оценки влияния удаления рекламных щитов с главной магистрали в Израиле на несчастные случаи аналогичным образом: чтобы контролировать другие факторы, которые изменились за этот период, они сравнил снижение количества несчастных случаев до / после с параллельным шоссе, где рекламные щиты оставались там на протяжении всего периода.


Я полагаю, что кинотеатр лечения и управления кинотеатром должны быть максимально похожими для этого метода? Они распространены в 3 разных городах и могут играть в разные фильмы.
Энди Тяхджоно

@Endy Я не уверен, что эти различия имеют значение. Предполагается использовать изменения в продажах игр в лечении относительно контроля, а не базовых продаж в качестве показателя эффективности лечения. Таким образом, хотя разные кинотеатры, разные фильмы и т. Д. Могут иметь разные базовые продажи игр, изменение продаж игр будет зависеть от наличия или отсутствия режима.

1
(+1) Я собирался предложить что-то подобное. Иногда это называют оценкой «разницы в различиях» en.wikipedia.org/wiki/Difference_in_differences
onestop

Извините, мне все еще не ясно, фильмы не просто отличаются между кинотеатрами, фильмы тоже меняются. Если один кинотеатр начнет играть новый интересный фильм, а другие нет, у этого кинотеатра могут быть большие изменения в продажах игр, нет?
Энди Тяхджоно

0

Помимо моего практического статистического предложения, я хотел поднять немного другую проблему: я понимаю, что цель кинотеатра - максимизировать доходы, и, конечно, анализ (и стратегия) могут быть направлены на достижение этой цели. Однако я хотел бы предложить более широкую, целостную точку зрения, которую должны учитывать как компании, так и аналитики: общая выгода. В этом случае мы можем рассмотреть ценность игрового дополнения для любителей кино. Они довольны или более довольны общим опытом? (это можно оценить, например, с помощью быстрой анкеты). Или, например, если игра носит образовательный характер, то, возможно, у тех, кто играет, есть дополнительная выгода? Напоминаю, что в нескольких кинотеатрах в США на экране присутствуют игры в слова перед началом фильма. Они могут восприниматься как забавные и образовательные и, следовательно, могут быть добавленной стоимостью. По факту,

Я пытаюсь сказать, что полезно определить «успех» в широком смысле и мыслить масштабно. В конце концов, успех будет зависеть также от благополучия «клиентов» и влияния «лечения» на общество, культуру, окружающую среду и т. Д.

Извините, если это слишком философски, но у меня было так много студентов MBA, максимизирующих краткосрочные финансовые выгоды, и слишком мало думающих о проблемах, которые не являются денежными. Тем не менее, сбор данных и статистика могут быть использованы для более широких целей.


Предпочтительный подход к ответам на вопросы заключается в предоставлении одного ответа на вопрос. В идеале, любой новый материал должен быть интегрирован с существующим ответом. Возможно, вы захотите посмотреть это обсуждение на мета-сайте: meta.stats.stackexchange.com/q/635/28 FYI - мета-сайт - это то место, куда можно перейти, если вам нужно знать, как работает сайт, есть вопросы о функционировании сайта и т. д.

Спасибо за напоминание Galit, мы будем помнить общую картину.
Энди Тяхджоно
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.