Я считаю, что это очень забавная вещь для размышления. Бинарный это не 1 и 0, как вы говорите об этом.
Представьте, что есть количество, я могу сказать вам, каким оно есть, разными способами:
Nine
по-английски
Neuf
На французском
9
арабскими цифрами
IX
римскими цифрами
1001
в двоичном с арабскими цифрами
on off off on
в двоичном с вкл / выкл
high low low high
в бинарном виде представлены напряжениями или рычагами или уровнями воды или электрическим зарядом ... или английскими словами 'high' и 'low'
Все они представляют собой одно и то же. Дело в том, что двоичные значения не равны 1 и 0, это только один способ представления значения.
Когда вы говорите о преобразовании H в двоичный, вы, вероятно, представляете, что на экране отображается 10101010 - но это не «двоичный код», это одна цифра для каждого двоичного бита.
Да, если вы преобразуете H
в «двоичный», как обычно говорят об этом люди, а затем представляете, что в арабских цифрах, а затем сохраняете их, это займет больше места так же, как преобразование H
в aitch
занимает больше места.
Но вы можете видеть, что двоичный файл - это один из способов представления величины, хорошо говоря, что логика гласит: «Если бы я преобразовал H в двоичный файл и представил его таким образом, high low high low high low high low
он бы занимал 35 символов! Это даже больше, чем 10101010
! Но оба эти значения являются« двоичными » .. так как один больше другого?
Другая сторона этого удивляться тому, как H
хранится на компьютере, и видеть , что H
сама лишь способ представления количество - такое же количество 72
, 01001000
или seventy two
или код ASCII символов H
. Это ответ 8bittree о том, что простой текст является двоичным, но это я пытаюсь показать, что это значит .
Таким образом, вы получаете немного шаблон в компьютере 01001000
и что это значит? Все - о чем можно говорить как о числе, как о части zip-файла, как о символе, зависит от намерений человека, который его создал. Если вы знаете, что это должен быть простой текст, то это происходит из кодировки символов H
-> 01001000
и вы смотрите его в таблице кодировки символов другим способом - ASCII, UTF-8, shift-jis и т. Д. И находите правильный шрифт характер и выход приходит H
или как угодно. Или получится неправильный символ, если вы используете другой поиск кодировки, чем тот, кто его создал. Это ссылка @Eric Lippert.
Но когда я пишу это, и, как вы думаете об этом, H
это один байт и 01001000
8 байт, да, это больше места. И да, это (представление) двоичного файла. Но он находится на более высоком уровне абстракции, чем компьютер, - двоичные файлы отображаются в виде символов ASCII, где каждый символ представлен за кулисами с помощью двоичного двоичного шаблона, каждый из которых имеет размер, равный H
одному.