3
Как работает «кодировка переменной ширины» UTF-8?
В стандарте unicode достаточно кодовых точек, поэтому вам нужно 4 байта для их хранения. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства, используя так называемое «кодирование переменной ширины». Фактически, ему удается представить первые 127 символов US-ASCII всего одним байтом, который …