В то время как оценка сама по себе направлена на получение значений неизвестных параметров (например, коэффициентов в логистической регрессии или в разделяющей гиперплоскости в машинах опорных векторов), статистический вывод пытается присоединить меру неопределенности и / или утверждение вероятности к значения параметров (стандартные ошибки и доверительные интервалы). Если модель, которую предполагает статистик, является приблизительно правильной, то при условии, что новые входящие данные продолжают соответствовать этой модели, в заявлениях о неопределенности может содержаться некоторая доля правды, и они позволяют определить, как часто вы будете совершать ошибки при использовании модель для принятия ваших решений.
μσ2σ 2 / nμσ2/ н независимо от формы распределения исходных данных).
Самым близким к этому машинному обучению является перекрестная проверка, когда выборка разбита на обучающую и проверочную части, причем последняя фактически говорит: «Если новые данные выглядят как старые данные, но совершенно не связаны с данными, которые был использован при настройке моей модели, то реалистичный показатель частоты ошибок такой-то " Он выводится полностью эмпирически, выполняя ту же модель на данных, а не пытаясь вывести свойства модели, делая статистические предположения и привлекая любые математические результаты, такие как приведенный выше CLT. Возможно, это более честно, но так как использует меньше информации и, следовательно, требует больших размеров выборки. Кроме того, это неявно предполагает, что процесс не меняется,
Хотя фраза «вывод сзади» может иметь смысл (я не байесовец, я не могу точно сказать, какова принятая терминология), я не думаю, что в этом логическом шаге есть какие-либо предположения. Все байесовские предположения: (1) в предыдущем и (2) в предполагаемой модели, и после того, как они установлены, апостериор следует автоматически (по крайней мере, теоретически с помощью теоремы Байеса; практические шаги могут быть чрезвычайно сложными, и Сиппс Азартные игры ... извините, выборка Гиббса может быть относительно простым компонентом в этом заднем плане). Если «вывод сзади» относится к (1) + (2), то для меня это разновидность статистического вывода. Если (1) и (2) указаны отдельно, а затем «вывод задний» - это что-то еще, то я не