Я работаю над веб-сайтом, который будет предлагать локализованный контент в соответствии с language+region
подходом, описанным на этой странице W3.org (например, fr-CA
для канадского французского контента и fr-FR
для контента "французский французский"). Поскольку мы считаем контент для каждого из language+region
них уникальным, для нас крайне важно, чтобы поисковые системы правильно идентифицировали контент и соответствующим образом обслуживали его.
Посмотрев в Интернете (например, на этот вопрос ), выяснилось, что большинство людей рекомендуют использовать код языка ISO639 в lang
атрибуте HTML для описания языка контента. Следуя этой рекомендации, мы будем использовать то, <html lang="fr">
что не позволило бы провести различие между вышеупомянутыми language+region
комбинациями.
При рассмотрении спецификации HTML4 кажется, что использование language+region
в качестве языкового кода было бы совершенно нормально, так как en-US
пример приведен в качестве одного из возможных значений. Однако я не смог найти никакого подтверждения этому в спецификации HTML5, которая, кажется, не дает никакого примера относительно возможных допустимых значений.
Оттуда я попытался получить фактический ответ, посмотрев, что делают веб-гиганты. Я посмотрел на то, что делает Facebook: они предлагают версии своих сайтов на французском и французском языках Candian с (немного) различным содержанием, в то время как lang
значение HTML остается тем же:
URL - адрес fr-CA : http://fr-ca.facebook.com
Атрибут lang HTML: <html lang="fr">
перевод слова «электронная почта»:courriel
fr-FR
URL: http://fr-fr.facebook.com/
Атрибут lang HTML: <html lang="fr">
перевод слова «электронная почта»:Adresse électronique
Каков рекомендуемый / стандартный способ описания контента, который был локализован с использованием language+region
подхода в HTML5?