Google отправляет HTML-формы?


10

У меня есть веб-страница, скажем, http://domain/purchaseи на этой странице у меня есть веб-форма. Пользователь, отправив эту форму (которая имеет проверку как на стороне клиента, так и на стороне сервера и не будет проверяться до тех пор, пока поля не будут заполнены надлежащим образом), будет перенаправлен на другую страницу, где он может выбрать другие элементы и указать другие настройки, а затем приобрести наш продукт. Скажем, вторая страница есть http://domain/options.

Итак, пользователь заходит на наш сайт и посещает http://domain/purchase, заполняет форму, отправляет ее, а затем будет перенаправлен на вторую страницу http://doamin/options?parameter1=value1&parameter2=value2, которая содержит параметры с первой страницы. Это очень распространено при передаче параметров между веб-страницами (или технически между URL-адресами).

Теперь я просматривал свой веб-сайт и увидел, что Google проиндексировал некоторые из моих перенаправленных веб-страниц и URL-адресов, например:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

Это означает, что бот Google посетил нашу http://domain/purchaseстраницу, заполнил нашу форму, отправил ее и перенаправил на другой URL с соответствующими параметрами. Это единственный способ, который имеет смысл для меня. Google действительно заполняет формы?

PS: Все параметры имеют смысл, то есть они не заполнены произвольно. Например, параметр телефона на проиндексированных страницах имеет правильные номера телефонов. Как это возможно?

Ответы:


8

Google может сканировать HTML-формы с 2008 года .

Выбрав значения для каждого ввода, мы генерируем, а затем пытаемся сканировать URL-адреса, которые соответствуют возможному запросу, который может сделать пользователь. Если мы удостоверимся, что веб-страница, полученная в результате нашего запроса, является действительной, интересной и содержит контент, отсутствующий в нашем индексе, мы можем включить его в наш индекс так же, как и любую другую веб-страницу.

С другой стороны, поскольку маловероятно, что GoogleBot знает правильные параметры для этих полей, может быть другое объяснение. Возможно ли, что ваши пользователи ссылаются на перенаправленные страницы?


Это видео для веб-мастеров Google также охватывает оба
вопроса

Это говорит о том, что они только сканируют GET формы. Мой метод формы POST . Таким образом, не применимо. Да, почему бы и нет, URL-адреса всегда доступны для ссылок.
Саид Нямати

5
Если вы видите ?parameter1=value9&parameter2=value10в URL, они получают их; POST не встраивает переменные формы в URL.
Wooble

@ Woobie: В этом случае параметры URL, по-видимому, являются результатом перенаправления на стороне сервера после того, как форма была POST'd.
MrWhite

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.