Короткий ответ на ваш вопрос: «Большую часть времени мы не знаем, что такое P (сыр), и его часто (относительно) сложно вычислить».
Более длинный ответ, почему правило / теорема Байеса обычно формулируется так, как вы написали, заключается в том, что в байесовских задачах у нас - сидя на коленях - предварительное распределение (P (B) выше) и вероятность (P (A | B), P (A | notB) выше), и это относительно простой вопрос умножения для вычисления апостериорного значения (P (B | A)). Попытка повторно выразить P (A) в его обобщенной форме - это усилие, которое можно потратить в другом месте.
Это может показаться не таким сложным в контексте электронного письма, потому что, как вы правильно заметили, это просто P (сыр), верно? Беда в том, что при более сложных байесовских задачах на поле боя знаменатель является неприглядным интегралом, который может иметь или не иметь решение в замкнутой форме. На самом деле, иногда нам нужны сложные методы Монте-Карло только для аппроксимации интеграла, и смена чисел может быть настоящей болью в тылу.
Но, что более важно, нам, как правило, даже не важно, что такое P (сыр). Имейте в виду, что мы пытаемся отточить наше убеждение относительно того, является ли электронная почта спамом , и не заботятся о предельном распределении данных (P (A), выше). В любом случае, это просто нормализация, которая не зависит от параметра; Акт суммирования стирает любую информацию, которую мы имели о параметре. Константа - это неудобство для вычисления и, в конечном счете, не имеет значения, когда нужно сосредоточиться на наших представлениях о том, является ли спам в письме. Иногда мы обязаны рассчитать его, и в этом случае самый быстрый способ сделать это с помощью информации, которая у нас уже есть: априорная и вероятностная.