Я очень сомневаюсь, что дата публикации поста или статьи основана на <lastmod>
записи в карте сайта XML (как предлагали другие) или HTTP-заголовке Last-Modified в этом отношении. XML Sitemap является только рекомендательным, а не официальным. Дата последнего изменения документа, вероятно, не совпадает с (оригинальной) датой публикации статьи. И, как я упоминал в своем комментарии вверху страницы, дата последнего изменения документа, вероятно, более важна для кэширования и, возможно, определения скорости сканирования. Заголовок Last-Modified HTTP динамически генерируемых страниц часто очень близок к фактической дате / времени (как и для блогов WordPress).
С другой стороны, лента RSS / Atom содержит этот конкретный фрагмент информации. И действительно, на сайтах Wordpress, которые не включают дату публикации в контент, дата публикации по-прежнему отображается в результатах поиска Google. И, насколько я могу судить, это соответствует дате в RSS-канале.
РЕДАКТИРОВАНИЕ № 1: Тем не менее, RSS-канал не обязательно содержит все страницы. В большинстве случаев он должен содержать только самые последние или недавно обновленные страницы. Но нет никаких причин, по которым Google должен забыть то, что он уже прочитал, и предоставление содержания этой страницы не изменилось, равно как и дата последнего изменения.
Если RSS-лента отсутствует, я думаю, что Google достаточно умен, чтобы анализировать содержимое страницы. Особенно, если даты помечены «семантически» с помощью микроформатов . Вполне возможно, что Google увидит следующее в качестве официальной даты публикации статьи, в которой она содержится:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google, безусловно, читает микроформаты - hCard, hReview и т. Д.
Просто добавлю, я не думаю, что Google будет указывать дату публикации, если не сможет найти что-то авторитетное, что могло бы предложить это. Он не будет выводить «дату публикации» на спекулятивных данных, так как неправильная «дата публикации» никому не нужна, и Google получит за нее много информации!
И просто для записи (если @Tom предлагает иное :) Я думаю, что посты / статьи должны иметь визуально отображаемую дату публикации. Многие этого не делают, и это может разочаровать читателя, особенно при изучении технологических проблем, и вы обнаружите, что прочитав половину статьи, она устарела!
РЕДАКТИРОВАТЬ # 2: С тех пор я испытал аналогичное раздражение, которое @mmdanziger подробно описывает в своем ответе. На одном из моих старых сайтов у меня есть текст формы «Сайт обновлен до 17 июня 2012 года» (не помечен каким-либо особым образом) в верхней части каждой страницы (записывается на страницу с помощью JavaScript !!). Эта же дата была выбрана Google и теперь отображается рядом с несколькими (но не всеми) страницами, которые появляются в SERPS - это, конечно, не дата публикации страницы. Казалось бы, Google просто списывает на страницу строку вида «последнее обновление ( строка даты )» (обработав JavaScript !!). Этот конкретный сайт не имеет RSS-канал. На сайте есть файл Sitemap.xml, но даты разные.
Я заметил подобное поведение и на других сайтах.