Попробуйте утилиту Unicode :
$ unicode ‽
U+203D INTERROBANG
UTF-8: e2 80 bd UTF-16BE: 203d Decimal: ‽
‽
Category: Po (Punctuation, Other)
Bidi: ON (Other Neutrals)
Или uconv
утилита из пакета ICU :
$ printf %s ‽ | uconv -x any-name
\N{INTERROBANG}
Вы также можете получить информацию через recode
утилиту:
$ printf %s ‽ | recode ..dump
UCS2 Mne Description
203D point exclarrogatif
Или с Perl:
$ printf %s ‽ | perl -CLS -Mcharnames=:full -lne 'print charnames::viacode(ord) for /./g'
INTERROBANG
Обратите внимание, что они дают информацию о символах, которые составляют этот глиф, а не о глифе в целом. Например, для é
(е с сочетанием острого акцента):
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E}\N{COMBINING ACUTE ACCENT}
Отличается от автономного персонажа:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E WITH ACUTE}
Вы можете попросить uconv
рекомбинировать те (для тех, которые имеют комбинированную форму):
$ printf 'e\u0301b\u0301' | uconv -x '::nfc;::name;'
\N{LATIN SMALL LETTER E WITH ACUTE}\N{LATIN SMALL LETTER B}\N{COMBINING ACUTE ACCENT}
(é имеет комбинированную форму, но не б́).
unicode
? Похоже, я не установил это (и не могу найти его в репозиториях Arch Linux). Кроме того, что на землеexclarrogatif
? [РЕДАКТИРОВАТЬ: я получаю это здесь, хотя моя система не французская.]