Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных

4
Как прямолинейная функция активации решает проблему исчезающего градиента в нейронных сетях?
Я нашел выпрямленную линейную единицу (ReLU), восхваляемую в нескольких местах как решение проблемы исчезающего градиента для нейронных сетей. То есть, в качестве функции активации используется max (0, x). Когда активация положительна, очевидно, что это лучше, чем, скажем, функция активации сигмоида, поскольку ее вывод всегда равен 1, а не сколь угодно …

3
Что стандартное отклонение говорит нам в ненормальном распределении
В нормальном распределении правило 68-95-99.7 придает стандартному отклонению большой смысл, но что будет означать стандартное отклонение в ненормальном распределении (мультимодальное или перекошенное)? Будут ли все значения данных по-прежнему находиться в пределах 3 стандартных отклонений? Есть ли у нас правила типа 68-95-99.7 для ненормальных распределений?

5
Динамическая Кластеризация Деформации Времени
Каков будет подход к использованию динамической деформации времени (DTW) для кластеризации временных рядов? Я читал о DTW как способ найти сходство между двумя временными рядами, хотя они могут быть сдвинуты во времени. Могу ли я использовать этот метод в качестве меры сходства для алгоритма кластеризации, такого как k-means?

6
Эмпирическое правило для количества образцов начальной загрузки
Интересно, знает ли кто-нибудь какие-либо общие практические правила относительно количества выборок начальной загрузки, которые следует использовать, основываясь на характеристиках данных (количество наблюдений и т. Д.) И / или включенных переменных?

7
Признает ли байесовский факт, что существует одно фиксированное значение параметра?
В байесовском анализе данных параметры рассматриваются как случайные величины. Это связано с байесовской субъективной концептуализацией вероятности. Но признают ли байесовцы теоретически, что в «реальном мире» существует одно истинное фиксированное значение параметра? Кажется, что очевидный ответ - «да», потому что тогда попытка оценить параметр была бы почти бессмысленной. Академическая цитата для …


2
Как сделать правильные выводы из «больших данных»?
«Большие данные» повсюду в СМИ. Все говорят, что «большие данные» - это большая вещь для 2012 года, например, опрос KDNuggets на горячие темы 2012 года . Однако у меня есть глубокие опасения здесь. С большими данными, все , кажется , чтобы быть счастливым только , чтобы получить что - нибудь …

5
Связь между
Допустим, у меня есть два одномерных массива, a1a1a_1 и . Каждый содержит 100 точек данных. - фактические данные, а - прогноз модели. В этом случае значение будет следующим: Между тем, это будет равно квадратному значению коэффициента корреляции, Теперь, если я поменяю местами: - это фактические данные, а - прогноз модели. …

2
Меры переменной значимости в случайных лесах
Я играл со случайными лесами для регрессии, и мне трудно понять, что именно означают эти два показателя важности и как их следует интерпретировать. importance()Функция дает два значения для каждой переменной: %IncMSEи IncNodePurity. Есть ли простые интерпретации для этих двух значений? В IncNodePurityчастности, действительно ли это просто увеличение RSS после удаления …

3
Как интерпретировать F- и p-значение в ANOVA?
Я новичок в статистике, и в настоящее время я имею дело с ANOVA. Я провожу тест ANOVA в R, используя aov(dependendVar ~ IndependendVar) Я получаю, среди прочего, F-значение и p-значение. Моя нулевая гипотеза ( ) состоит в том, что все групповые средства равны.ЧАС0H0H_0 Существует много информации о том, как рассчитывается …

6
Обратное распространение с Softmax / Cross Entropy
Я пытаюсь понять, как работает обратное распространение для выходного слоя softmax / cross-entropy. Функция кросс-энтропийной ошибки E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j с и в качестве цели и выхода на нейроне соответственно. Сумма по каждому нейрону в выходном слое. Сам является результатом функции softmax:tttooojjjojojo_j oj=softmax(zj)=ezj∑jezjoj=softmax(zj)=ezj∑jezjo_j=softmax(z_j)=\frac{e^{z_j}}{\sum_j e^{z_j}} Опять же, сумма по каждому нейрону …

3
Эффект подавления в регрессии: определение и визуальное объяснение / изображение
Что такое переменная-супрессор в множественной регрессии и какие могут быть способы визуального отображения эффекта подавления (его механизм или свидетельство в результатах)? Я хотел бы пригласить всех, у кого есть мысли, поделиться.

2
Модель логистической регрессии не сходится
У меня есть некоторые данные о рейсах авиакомпании (в фрейме данных flights), и я хотел бы посмотреть, повлияет ли время полета на вероятность значительно задержанного прибытия (то есть 10 или более минут). Я подумал, что буду использовать логистическую регрессию с указанием времени полета и тем, будет ли каждый рейс значительно …
40 r  logistic  separation 

3
Эмпирические отношения между средним, медианой и модой
Для унимодального распределения, которое умеренно искажено, мы имеем следующие эмпирические отношения между средним, медианой и модой: Как были эти отношения получен?(Mean - Mode)∼3(Mean - Median)(Mean - Mode)∼3(Mean - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Карл Пирсон нарисовал тысячи таких отношений до того, как сформировал этот вывод, или есть логическая …

7
Нормализация и стандартизация данных в нейронных сетях
Я пытаюсь предсказать результат сложной системы, используя нейронные сети (ИНС). Исходные (зависимые) значения находятся в диапазоне от 0 до 10000. Разные входные переменные имеют разные диапазоны. Все переменные имеют примерно нормальное распределение. Я рассматриваю разные варианты масштабирования данных перед тренировкой. Один из вариантов - масштабировать входные (независимые) и выходные (зависимые) …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.