Я увидел этот вопрос в предложении на сайте Типографии, и мне показалось, что я не знаю ответа. Я всегда считал «глиф» и «характер» взаимозаменяемыми.
После прочтения объяснения на странице модели кодировки символов Unicode мое понимание примерно следующее:
- Символы определяются по их значению в языке, глифы, по их внешнему виду . Итак, лигатура для эстетического сочетания
fi- это один глиф, но два символа.
Итак, я верю (пожалуйста, поправьте меня, если я ошибаюсь), что практическая разница будет:
- Текстовые парсеры, которые не интересуются эстетикой текста, будут читать глифы как соответствующие им символы. Так:
- Если бы вы копировали и вставляли текст, содержащий глифы, в простой текстовый редактор, глифы были бы преобразованы в соответствующие им символы (
fiлигатурный глиф стал быfиi) - Любая хорошо сделанная автоматизированная система, основанная на разборе текста (например, поисковые роботы, программы чтения с экрана, средства проверки орфографии) будет интерпретировать глифы как соответствующие им символы.
- Один символ может иметь много глифов или наборов глифов. Я хочу сказать, что один глиф может иметь только один символ, но это явно не правильно, поскольку в связанной статье есть пример 3 глифов и наборов глифов, каждый из которых, по-видимому, соответствует символу и набору символов. Я не совсем понимаю, как это могло бы работать: конечно, это означает, что будет несогласованность или неоднозначность в том, как эти глифы интерпретируются, в зависимости от интерпретатора? (или это зависит от языка или шрифта?)
- В то время как браузеры глифов (например, в Illustrator) содержат полный набор глифов шрифта, карты символов (например, карта символов Windows) содержат только символы, а не глифы, которые являются несколькими символами, такими как лигатуры (то, что я раньше не замечал)
- Если бы вы копировали и вставляли текст, содержащий глифы, в простой текстовый редактор, глифы были бы преобразованы в соответствующие им символы (
Я чувствую, что я почти на месте, но я явно что-то неправильно понял: не только «Один символ с несколькими символами», но также копирование и вставка поведения с помощью лигатур не совсем то, что я ожидал:
- Скопируйте лигатуру
fiиз Illustrator в это поле ввода: вставьте какfi(два символа), как и ожидалось. - Вставьте в HTML-код для него (
fi) - отображается как лигатура, когда не в блоке кода (если этот шрифт не очень похож на лигатуру, но вы увидите один, если попытаетесь выбрать только половину о нем), и код, когда в блоке кода (fi), как и ожидалось. - Скопируйте и вставьте визуализированную лигатуру без кодового блока обратно в поле ввода: вставьте как символ лигатуры и отобразите как лигатуру независимо от того, находится ли она в блоке кода или нет (fi и
fi). Точно так же слова, содержащие его: FIF FITS (fit misfits) вставляет как FIT FITS (fit misfits). Может быть, это зависит от того, понимает ли место, куда он вставляется, используемую кодировку?
Насколько неправильно мое понимание этого? Может ли кто-то исправить меня: сформулировать четкое определение различий между глифами и символами (если мой неверен или может быть улучшен) и привести более четкие / более точные примеры, чем мои, о том, что это означает на практике ?