Очень приятно иметь возможность вводить простой текст в строки или символы в кавычках в исходном коде и видеть реальный символ. Например, символ пи 'π' или иероглиф '𠀊' намного лучше, чем эквивалентный '\ u3c0' для пи и L '\ u2000A' для идеографа.
Можно ввести и / или скопировать и вставить эти символы непосредственно в исходный код, как если бы вы были символами ASCII, в достойном редакторе.
Я нахожу конкретные примеры, полезные для осмысления и понимания вещей, которые словесные описания иногда, кажется, не ведут домой. Концептуализация символьных констант Unicode, введенных в исходный код, например, в следующем кратком примере кода:
const unsigned char ASCII_0X7E = (unsigned char) '~';
const unsigned short UNICODE_0X3C0 = (unsigned short) 'π';
const unsigned long UNICODE_0X2000A = (unsigned long) '𠀊';
const unsigned long UNICODE_0X2893D = (unsigned long) '𨤽';
Символ тильды ASCII '~' может быть сохранен в исходном файле ASCII или UTF-8, но символы Unicode не могут быть сохранены в форме ASCII. Символ PI 'π' представляет собой кодовую точку Unicode 0x3c0 и может быть сохранен в форме UTF-8 в виде двухбайтового значения 0xcf, 0x80. Идеографы в кодовых точках Unicode 0x2000a и 0x2893d требуют 4-байтовых последовательностей UTF-8.
Чтобы эти символы сохранили свои предполагаемые значения, а компилятор интерпретировал их как предполагалось, исходный код должен быть сохранен в формате, который поддерживает набор символов Unicode, например UTF-8 или UTF-16. При сохранении в формате UTF-8 достойный компилятор поймет и интерпретирует значения, как предполагалось, а приличный редактор загрузит и отобразит символы правильно.
Как указывали другие, если в исходном коде просто нет символов, выходящих за пределы диапазона ASCII, сохранение в формате UTF-8 приведет к созданию файла, который ничем не отличается от сохранения файла ASCII, поскольку UTF- 8 предназначен для перекрытия ASCII в диапазоне символов ASCII. Как только вы введете любой символ в ваш исходный код, который находится за пределами диапазона ASCII, достойный редактор сообщит вам, что вы должны выбрать кодировку, чтобы использовать ее для сохранения файла. UTF-8 - хороший выбор, поскольку он может обрабатывать ASCII как есть и практически любой другой символ, поддерживаемый в вашей среде разработки.