Более продуктивный вопрос может быть: «Почему он не использовался в классической статистике, которую я изучил?»
В зависимости от уровня (ов), на котором он преподавался, содержание курса (и доступное время), который может быть выбран, может быть обусловлен сочетанием различных факторов. Часто важные темы оставляются в стороне, потому что другие материалы должны преподаваться по той или иной причине, в надежде, что они могут быть рассмотрены в более поздних предметах.
По крайней мере, в некоторых смыслах это понятие уже давно используется разными людьми. Это было более распространено в некоторых областях, чем в других. Многие виды использования статистики не имеют прогнозирования или выбора модели в качестве основного компонента (или в некоторых случаях, даже вообще), и в этом случае использование отсроченных выборок может быть менее критичным, чем когда прогнозирование является основным пунктом. Можно утверждать, что он должен был получить более широкое использование на более ранней стадии в некоторых соответствующих приложениях, чем это было, но это не то же самое, что быть неизвестным.
Если вы посмотрите на области, в которых основное внимание уделяется прогнозированию, понятие оценки модели путем прогнозирования данных, которые вы не использовали для оценки вашей модели, наверняка было (хотя и не универсальным). Я, конечно, делал это с моделированием временных рядов, которое я делал, например, в 1980-х годах, когда прогностическая эффективность самых последних данных вне выборки была особенно важна.
Понятие об исключении хотя бы некоторых данных использовалось, например, в регрессии (удаленные остатки, ПРЕССА, Убойный убийца и т. Д.) И в анализе выбросов.
Некоторые из этих идей уже давно известны. Стоун (1974) [1] относится к работам по перекрестной проверке (со словом в названии) 1950-х и 60-х годов. Возможно, даже ближе к вашему намерению, он упоминает об использовании Саймоном (1971) терминов «выборка конструкции» и «выборка проверки» - но также указывает, что «Ларсон (1931) использовал случайное деление выборки в образовательном множестве -регрессионное исследование ".
Такие темы, как перекрестная проверка и использование статистики, основанной на прогнозировании и т. Д., Стали значительно более частыми в статистической литературе, например, в 70-х и 80-х годах, но многие из основных идей были известны довольно давно. тогда.
[1]: Стоун, М., (1974)
"Перекрестный выбор и оценка статистических прогнозов",
журнал Королевского статистического общества. Серия B (Методологическая) , вып. 36, № 2., с. 111-147