Еще одна причина, по которой стоит использовать короткую, заключается в том, что она соответствует другим случаям, когда вы можете указать набор символов в разметке. Например:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
Согласованность помогает уменьшить количество ошибок и сделать код более читабельным.
Обратите внимание, что атрибут charset нечувствителен к регистру. Вы можете использовать UTF-8 или UTF-8, однако UTF-8 более четкий, более читаемый, более точный.
Кроме того, нет абсолютно никакой причины использовать любое значение, кроме UTF-8, в атрибуте meta charset или заголовке страницы. UTF-8 является кодировкой по умолчанию для веб-документов начиная с HTML4 в 1999 году и единственным практичным способом создания современных веб-страниц.
Также вы не должны использовать HTML-объекты в UTF-8. Символы, такие как символ авторского права, должны быть напечатаны напрямую. Единственные объекты, которые вы должны использовать, - это 5 зарезервированных символов разметки: меньше, больше, амперсанд, простое, двойное простое. Для сущностей необходим анализатор HTML, который вы не всегда хотите использовать в будущем, они вносят ошибки, делают ваш код менее читаемым, увеличивают размеры файлов и иногда неправильно декодируют в различных браузерах в зависимости от того, какие сущности вы использовали. Узнайте, как ввести / вставить авторское право, торговую марку, открытую цитату, закрытую цитату, апостроф, тире, тире, маркер, евро и любые другие символы, которые встречаются в вашем контенте, и использовать эти фактические символы в коде. Mac имеет Просмотрщик символов, который вы можете включить в Системных настройках клавиатуры, и вы можете найти, а затем перетащить нужные символы или использовать соответствующее средство просмотра клавиатуры, чтобы увидеть, какие клавиши вводить. Например, товарным знаком является Option + 2. UTF-8 содержит все символы и символы из каждого письменного человеческого языка. Таким образом, нет оправдания для использования - вместо тире. Неплохая идея также изучить правила пунктуации и типографики ... например, зная, что точка идет внутри закрытой цитаты, а не снаружи.
Использование тега для чего-то вроде типа контента и кодирования весьма иронично, поскольку, не зная этих вещей, вы не сможете проанализировать файл, чтобы получить значение метатега.
Нет, это не правда. Браузер начинает синтаксический анализ файла как кодировки браузера по умолчанию, либо UTF-8, либо ISO-8859-1. Поскольку US-ASCII является подмножеством как ISO-8859-1, так и UTF-8, браузер может читать просто так или иначе ... это то же самое. Когда браузер обнаруживает метатегарсетный тег, если кодировка отличается от той, которую браузер уже использует, браузер перезагружает страницу в указанной кодировке. Вот почему мы помещаем мета-тег charset сверху, сразу после тега head, перед чем-либо еще, даже заголовком. Таким образом, вы можете использовать символы UTF-8 в заголовке.
Вы должны сохранить свои файлы в кодировке UTF-8 без спецификации
Это не совсем верно. Если в вашем документе только символы US-ASCII, вы можете сохранить его как US-ASCII и использовать его как UTF-8, потому что это подмножество. Но если есть символы Unicode, вы правы, вы должны сохранить как UTF-8 без спецификации.
Если вам нужен хороший текстовый редактор, который сохранит ваши файлы в UTF-8, я рекомендую Notepad ++.
На Mac используйте Bare Bones TextWrangler (бесплатно) из Mac App Store или Bare Bones BBEdit, который находится в Mac App Store за 39,99 $ ... очень дешево для такого замечательного инструмента. В любом приложении в нижней части окна документа есть меню, в котором вы указываете кодировку документа, и вы можете легко выбрать «UTF-8 без спецификации». И, конечно, вы можете установить это в качестве настроек по умолчанию для новых документов в настройках.
Но если ваш веб-сервер обслуживает кодировку в заголовке HTTP, что рекомендуется, оба [мета-тега] не нужны.
Это неверно. Конечно, вы должны установить кодировку в заголовке HTTP, но вы также должны установить ее в атрибуте meta charset, чтобы страница могла быть сохранена пользователем из браузера в локальное хранилище, а затем открыта снова позже, в этом случае единственным указанием на кодировку, которая будет присутствовать, является атрибут meta charset. Вы также должны установить базовый тег по той же причине ... на сервере базовый тег не нужен, но при открытии из локального хранилища базовый тег позволяет странице работать так, как если бы она находилась на сервере, со всеми активы на месте и тд, нет битых ссылок.
AddDefaultCharset UTF-8
Или вы можете просто изменить кодировку определенных типов файлов следующим образом:
AddType text/html;charset=utf-8 html
Совет по обслуживанию файлов UTF-8 и Latin-1 (ISO-8859-1) - дать файлам UTF-8 «текстовое» расширение, а файлам Latin-1 «txt».
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Наконец, подумайте о сохранении ваших документов с окончаниями строк Unix, а не с устаревшими окончаниями строк DOS или (классических) строк Mac, которые не помогают и могут причинить вред, особенно в дальнейшем, когда мы все дальше и дальше удаляемся от этих устаревших систем. Документ HTML с правильной HTML5, кодировкой UTF-8 и окончаниями строк Unix - это хорошо выполненная работа. Вы можете обмениваться, редактировать, хранить, читать, восстанавливать и полагаться на этот документ во многих контекстах. Это лингва франка. Это цифровая бумага.