Справочная информация. В настоящее время моя организация сравнивает свои статистические данные о разнообразии рабочей силы (например,% инвалидов,% женщин,% ветеранов) с общей доступностью рабочей силы для этих групп на основе обследования американского сообщества (проект обследования Бюро переписи населения США). Это неточный ориентир, потому что у нас очень специфический набор рабочих мест, которые отличаются по демографии от рабочей силы в целом. Скажем, например, что в моей организации в основном инженеры. Инженерия - это только около 20% женщин в моем штате. Если мы сравним себя с общим показателем рабочей силы, который больше похож на 50% женщин, это приведет к панике, что «у нас только 20% женщин, это катастрофа!» в действительности, 20% - это то, что мы должны ожидать, потому что так выглядит рабочая среда.
Моя цель: то, что я хотел бы сделать, - это взять данные о профессии Американского общественного опроса (по категориям разнообразия) и перевесить их, основываясь на структуре рабочих мест в моем бизнесе. Вот примерный набор данных для работников социальных и общественных служб . Я хочу добавить эти коды работы, перечисленные вместе (поскольку наш пешеходный переход относится к группам работы, а не к конкретным кодам работы), затем я хочу взвесить этот эталон на основе количества людей, которые у нас есть в этой категории (например, наши 3000 социальных и Работники службы сообщества), затем я хочу сделать то же самое для всех остальных рабочих групп, сложить эти цифры вместе и разделить на общее число работников. Это дало бы мне новую пересмотренную меру разнообразия (например, от 6% инвалидов до 2% инвалидов).
Мои вопросы: Как я могу подогнать пределы погрешности к этому окончательному свернутому тесту? У меня нет необработанного набора данных переписи (очевидно), но вы можете просмотреть поля ошибок для каждого числа в предоставленной мной ссылке, переключив поле «Оценка» на «Поле ошибки» в верхней части таблицы. Другие мои коллеги, работающие с этими данными, намерены полностью игнорировать границы ошибок, но я обеспокоен тем, что мы создаем статистически бессмысленный эталон для себя. Можно ли использовать эти данные даже после манипуляций, описанных выше?