Резюме
Если ваш сервер распределяет страницы с помощью лигатур (как это делают smartypants), поисковые системы несовместимы. Bing в настоящее время не индексирует лигатуры правильно. Я бы сказал, в общем, это напрашивается на неприятности. Поскольку поисковые системы меняются, ниже представлен метод, который вы можете использовать для проверки того, насколько поисковые системы интересуются лигатурами индексов .
Если ваш сервер распределяет страницы обычным текстом, то Javascript превращает их в лигатуры, это нормально . Поисковые системы не применяют изменения содержимого Javascript перед индексацией страниц (хотя утверждается, что есть несколько исключений, таких как загрузка комментариев Facebook ). Поскольку существует стандартный отраслевой метод предоставления поисковым системам динамического контента, и этот метод одобрен Google , было бы большим сюрпризом, если это изменится в будущем. Google советует просматривать ваш сайт с помощью обычного текстового браузера (например, они предлагают Lynx ), чтобы увидеть ваш контент так, как его видит поисковая система.
Подробнее о первом случае (страницы выделены лигатурами в коде) ...
Теоретически
... это не должно иметь никакого значения для хорошо настроенной поисковой системы.
Сначала это помогает понять разницу между глифами и символами . Лигатура fi
- это один глиф, обозначающий два символа f
i
. То, как программное обеспечение обрабатывает его, зависит от этого программного обеспечения и зависит от контекста и поставленной задачи - из примеров в этом связанном вопросе вы увидите, что при копировании и вставке глифов то, что вставляется, будет различным: иногда вставляется глиф, иногда глиф обрабатывается как связанные с ним символы и f
и i
вставляются.
Любой хорошо сделанный автоматический текстовый процессор, который интересуется семантикой текста (поисковые системы, проверка орфографии, программы чтения с экрана ...), должен рассматривать глиф как идентичный символам, которые он обозначает, и должен обрабатываться finally
как идентичный finally
, потому что это текстовое смысл fi
глифа.
На практике
Не все хорошо сделано ...
Вот простой способ проверить поисковые системы. Вот строка текста из этого другого вопроса:
Copy the ligature fi from Illustrator to this input box
Если мы возьмем не лигатурную версию этого предложения и поищем его в двойных кавычках:
(поиск "Copy the ligature fi from Illustrator to this input box"
):
- ... если поисковая система рассматривает лигатурные глифы как совпадения с символами, которые они представляют, она найдет эту страницу (и, когда она проиндексирована, эту)
- ... если поисковая система рассматривает лигатурные глифы как отличающиеся от символов, которые они представляют, она не найдет ничего, пока эта страница не будет проиндексирована, тогда она найдет только эту страницу, и поиск с версией лигатуры найдет эту страницу.
- ... если поисковая система сходит с ума при виде символов, подобных лигатурам, она ничего не найдет, даже эта страница, и поиск с версией лигатуры также ничего не найдет
Некоторые быстрые результаты для 5 лучших поисковых систем в мире (ссылки на результаты поиска):
- Google: Хорошо (тип 1) . (несмотря на комментарий ниже, он отлично справляется как с форматированием юникода, так и с HTML-форматированием)
- Bing: Fail ( тип 2 ).
- Yahoo: Fail ( тип 2 ) (оказывается, что Yahoo "Powered by Bing")
- Яндекс (русский): Хорошо (тип 1)
- Baidu (китайский): эээ, никаких страниц graphicdesign.stackexchange.com, похоже, вообще не появляется в поисках Baidu ... может, нас там забанят ...?!