Если я встраиваю изображение в страницу как img
- src
с URI данных base64, остаются ли метаданные изображения (EXIF, IPTC, XMP) доступными для Google imagebot?
Если я встраиваю изображение в страницу как img
- src
с URI данных base64, остаются ли метаданные изображения (EXIF, IPTC, XMP) доступными для Google imagebot?
Ответы:
Google не индексирует данные URI изображений для поиска изображений Google. Джон Мюллер из Google говорит об этом здесь и в комментариях ниже. Поскольку изображения URI данных не индексируются в поиске изображений Google, данные EXIF в них не имеют значения.
Вы можете убедиться, что эти изображения не проиндексированы. Я искал в Google изображения "data uri" и проверил результаты. Все изображения, которые я просматривал, были файлами изображений, а не URI в кодировке Base64. Можно подумать, что если бы Google удалось проиндексировать изображения URI данных, некоторые из них будут отображаться в результатах поиска по этому термину.
Если Google когда-либо решит проиндексировать изображения URI данных, они смогут получить данные EXIF из них. Data URI - это весь файл base64, закодированный (без пробелов и новых строк) с data:image/png;base64,
префиксом. Любые метаданные в файле все равно будут присутствовать в версии URI с закодированными данными base64.
Я использую данные URI на одном из моих сайтов. Я делаю это потому, что пользователи обычно просто просматривают одну страницу на сайте, чтобы получить всю необходимую им информацию. Включение всех строчных данных CSS, JS и изображений на странице значительно повышает производительность. Изображения все маленькие, поэтому техника работает особенно хорошо.
Мой сайт получает достаточное количество трафика из Internet Explorer 7 и более ранних версий, которые не поддерживают изображения URI данных. Поэтому я должен обслуживать их условно. У меня также есть изображения на сервере, и я выбираю обычные URL-адреса изображений или URI данных на основе User-Agent
заголовка. Я отношусь к ботам (в том числе к Googlebot) так же, как к IE 7, то есть к изображениям я отношу HTTP-URL. Я делаю это потому, что включение данных URI изображений значительно увеличивает размер страницы. Большинству ботов не нужно загружать изображения, поэтому для них это более эффективно. Я также заметил, что Инструменты Google для веб-мастеров сообщили, что робот Googlebot сканирует мой сайт гораздо медленнее с включенными изображениями URI данных. Технически это можно было бы считать маскировкой, но это был бы способ индексации ваших изображений URI данных.
Хотя Google использует изображения в качестве URI-кодов данных в кодировке Base64 на своей собственной выдаче, она не индексирует такие изображения на других веб-сайтах. Спасибо @dan, который указал мне на обсуждение групп Google, где Джон Мюллер объясняет эту проблему . Это также означает, что вопрос о существовании данных EXIF на таких изображениях не актуален.
Из этого объяснения становится ясно, к каким изображениям лучше применять эту технику оптимизации производительности: маленькие изображения, такие как значки, значки и кнопки, и те изображения, которые не несут никакой дополнительной ценности для контента сайта.
На другом сайте, если один должен категорически встраивать изображение с дополнительным значением контента в качестве URI данных в кодировке base64, единственная лучшая практика для предоставления метаданных изображения - это использовать разметку Schema.org, где возможно согласование данных EXIF, например, с этим вид разметки.
Еще один многообещающий вид разметки для согласования данных, имеющих вид «свойство: значение», например EXIF, в настоящий момент имеет статус предложения. Но эта статья из блога Google показывает структурированные фрагменты, которые могут быть сгенерированы предложением разметки, которое я связал выше.