Я увидел этот вопрос в предложении на сайте Типографии, и мне показалось, что я не знаю ответа. Я всегда считал «глиф» и «характер» взаимозаменяемыми.
После прочтения объяснения на странице модели кодировки символов Unicode мое понимание примерно следующее:
- Символы определяются по их значению в языке, глифы, по их внешнему виду . Итак, лигатура для эстетического сочетания
fi
- это один глиф, но два символа.
Итак, я верю (пожалуйста, поправьте меня, если я ошибаюсь), что практическая разница будет:
- Текстовые парсеры, которые не интересуются эстетикой текста, будут читать глифы как соответствующие им символы. Так:
- Если бы вы копировали и вставляли текст, содержащий глифы, в простой текстовый редактор, глифы были бы преобразованы в соответствующие им символы (
fi
лигатурный глиф стал быf
иi
) - Любая хорошо сделанная автоматизированная система, основанная на разборе текста (например, поисковые роботы, программы чтения с экрана, средства проверки орфографии) будет интерпретировать глифы как соответствующие им символы.
- Один символ может иметь много глифов или наборов глифов. Я хочу сказать, что один глиф может иметь только один символ, но это явно не правильно, поскольку в связанной статье есть пример 3 глифов и наборов глифов, каждый из которых, по-видимому, соответствует символу и набору символов. Я не совсем понимаю, как это могло бы работать: конечно, это означает, что будет несогласованность или неоднозначность в том, как эти глифы интерпретируются, в зависимости от интерпретатора? (или это зависит от языка или шрифта?)
- В то время как браузеры глифов (например, в Illustrator) содержат полный набор глифов шрифта, карты символов (например, карта символов Windows) содержат только символы, а не глифы, которые являются несколькими символами, такими как лигатуры (то, что я раньше не замечал)
- Если бы вы копировали и вставляли текст, содержащий глифы, в простой текстовый редактор, глифы были бы преобразованы в соответствующие им символы (
Я чувствую, что я почти на месте, но я явно что-то неправильно понял: не только «Один символ с несколькими символами», но также копирование и вставка поведения с помощью лигатур не совсем то, что я ожидал:
- Скопируйте лигатуру
fi
из Illustrator в это поле ввода: вставьте какfi
(два символа), как и ожидалось. - Вставьте в HTML-код для него (
fi
) - отображается как лигатура, когда не в блоке кода (если этот шрифт не очень похож на лигатуру, но вы увидите один, если попытаетесь выбрать только половину о нем), и код, когда в блоке кода (fi
), как и ожидалось. - Скопируйте и вставьте визуализированную лигатуру без кодового блока обратно в поле ввода: вставьте как символ лигатуры и отобразите как лигатуру независимо от того, находится ли она в блоке кода или нет (fi и
fi
). Точно так же слова, содержащие его: FIF FITS (fit misfits
) вставляет как FIT FITS (fit misfits
). Может быть, это зависит от того, понимает ли место, куда он вставляется, используемую кодировку?
Насколько неправильно мое понимание этого? Может ли кто-то исправить меня: сформулировать четкое определение различий между глифами и символами (если мой неверен или может быть улучшен) и привести более четкие / более точные примеры, чем мои, о том, что это означает на практике ?