27

Я читаю книгу: « Код: скрытый язык компьютерного оборудования и программного обеспечения » и в главе 2 автор говорит:

Говорят, что азбука Морзе является двоичным (буквально означающим два на два) кодом, потому что компоненты кода состоят только из двух вещей - точки и тире.

Википедия с другой стороны говорит:

Строго говоря, это не бинарный код, так как есть пять основных элементов (см. Quinary). Однако это не означает, что азбука Морзе не может быть представлена в виде двоичного кода. В абстрактном смысле это функция, которую операторы телеграфа выполняют при передаче сообщений (см. Quinary).

Но опять же, другая страница Википедии включает азбуку Морзе в «Список двоичных кодов».

Я очень смущен, потому что я думаю, что азбука Морзе на самом деле является троичной . У вас есть 3 различных типа «возможностей»: тишина, короткий сигнал или длинный сигнал.

Невозможно представить азбуку Морзе в «двоичном коде», не так ли?

Под «строгим двоичным» я подразумеваю поток двоичных данных: 1010111101010 .. Как я должен представлять тишину, короткий звуковой сигнал и / или длинный звуковой сигнал?

Единственный способ, которым я могу думать, - это «размер слова», который реализует компьютер. Если я (и процессор / интерпретатор кода) знаю, что он будет читать 8 бит каждый раз, то я могу представить азбуку Морзе. Я могу просто представить короткий звуковой сигнал с 1 или длинный звуковой сигнал с 0, и молчание будет неявно представлено длиной слова (скажем, 8 битов). Итак, еще раз, у меня есть эта 3-я переменная / 3-й актив в моя рука: размер слова.

Мое мышление таково: я могу зарезервировать первые 3 бита для количества считываемых битов и последние 5 бит для кода Морзе в 8-битном слове. Например, 00110000 будет означать «А». И я все еще нахожусь в «двоичном», НО мне нужен размер слова, который делает его троичным, не так ли? Первые 3 бита говорят: чтение только 1 бита из следующих 5 бит.

Вместо двоичного кода, если мы используем trinary, мы можем показать азбуку Морзе, например: 101021110102110222 и т. Д., Где 1 - это: dit 0 - это: dah, а 2 - тишина. Используя 222, мы можем закодировать длинное молчание, поэтому, если у вас есть сигнал типа * - * --- * - вы можете показать его как: 102100022210, но это невозможно напрямую, используя только 1 и 0, если вы не придумали что-то вроде «фиксированного» размера слова, как я уже упоминал, но это интерпретация, а не сохранение азбуки Морзе в двоичном виде. Представьте что-то вроде пианино, у вас есть только кнопки пианино. Вы хотите оставить сообщение в азбуке Морзе для кого-то, и вы можете нарисовать кнопки черным. Вы не можете оставить четкое сообщение, не так ли? Вам нужен по крайней мере еще один цвет, чтобы вы могли поместить молчание (то есть между символами и словами. Это то, что я подразумеваю под trenary.

Я не спрашиваю, можете ли вы представлять азбуку Морзе в 57-м или чем-то еще.

Я написал об этом автору (Чарльз Петцольд) по электронной почте; он говорит, что в главе 9 «Кодекса» он демонстрирует, что азбуку Морзе можно интерпретировать как двоичный код.

Где я не прав с моим мышлением? Является ли то, что я читаю в книге, фактом Морзе, являющимся двоичным кодом, фактом или нет? Является ли это как - то спорно? Почему на одном из страниц Википедии сказано, что азбуке Морзе нужно быть кинарной, а также на странице списка двоичных кодов ?

Редактировать: я написал автору по электронной почте и получил ответ:

-----Оригинал сообщения-----

От: Корай Тугай [mailto: koray@tugay.biz]

Отправлено: вторник, 3 марта 2015 г., 15:16

Кому: cp@charlespetzold.com

Тема: Азбука Морзе действительно двоичная?

Сэр, не могли бы вы взглянуть на мой вопрос здесь: азбука Морзе двоичная, троичная или кинарная? квина?

С уважением, Корай Тугай

От: "Чарльз Петцольд"

Кому: "Корай Тугай"

Тема: RE: Азбука Морзе действительно двоичная? Дата: 3

Март 2015 23:04:35 EET

В конце главы 9 «Кодекса» я демонстрирую, что азбуку Морзе можно интерпретировать как двоичный код.

-----Оригинал сообщения-----

От: Корай Тугай [mailto: koray@tugay.biz]

Отправлено: вторник, 3 марта 2015 г., 15:16

Кому: cp@charlespetzold.com

Тема: Азбука Морзе действительно двоичная?

Сэр, не могли бы вы взглянуть на мой вопрос здесь: азбука Морзе двоичная, троичная или кинарная? квина?

С уважением, Корай Тугай

Я не скрываю его электронную почту, так как его действительно легко найти в Интернете.

information-theory coding-theory encoding-scheme

— Корай Тугай
источник

Пожалуйста, перенесите

— Wandering Logic

Комментарии не для расширенного обсуждения; этот разговор был перемещен в чат .

— Рафаэль

Я исправил ссылки, которые я случайно удалил (упс); пожалуйста, воздержитесь от дальнейшего отката к худшим изменениям.

— Рафаэль

1

@WanderingLogic Правильный, самый эффективный и бесшумный подход - молча помечать вопрос для очистки комментариев и предлагать перемещать комментарии в чат во флаге, а не публично разыгрывать полицию для комментариев и пытаться создать чат-комнату для объединения всех комментариев. все ответы без контекста. Ваши ссылки также теперь просто запутывают дело, так как Рафаэль разместил правильные ссылки.

— Джейсон С.

1

@ J.-E.Pin Ну, я не дал формального определения, потому что я считал само собой разумеющимся, что люди, отвечающие на этот вопрос, будут знать это, и у меня была ссылка или две на Википедию, чтобы установить контекст. Даже если википедия может быть далека от совершенства, она должна взять на себя роль определений, как это часто делается здесь. Мне потребовалось некоторое время, чтобы понять, что это была проблема, на самом деле, очевидно, широко распространенная. Я сам был в процессе переписывания всего этого подробно, с явными определениями, цитатами, ссылками и формальными объяснениями с инъективными гомоморфизмами. Должен ли я закончить?

— Бабу

19

Азбука Морзе - это префиксный троичный код (для кодирования 58 символов) поверх префиксного двоичного кода, кодирующего три символа.

Это был гораздо более короткий ответ, когда его приняли. Однако, учитывая значительные недоразумения между пользователями и после запроса от OP, я написал этот гораздо более длинный ответ. Первый раздел «ореховая скорлупа» дает вам суть этого.

содержание

В (большой) словах

На вопрос "Является ли азбука Морзе двоичным, троичным или кинарным?" сравнивать возможные ответы невозможно, если не установить некоторые критерии приемлемого ответа. Действительно, без надлежащих критериев можно придумать объяснения почти для любого вида структуры. Критерии, которые я выбрал, следующие:

он должен отражать трехуровневое описание азбуки Морзе с представлением точки / тире во втором уровне;
он должен максимально соответствовать представлениям и математическим инструментам, разработанным для теоретического анализа кодов;
это должно быть максимально просто;
это должно ясно показать свойства азбуки Морзе.

Это предназначено для предотвращения произвольного взлома, в котором игнорируются основные концепции теории кода, изученные с научной точки зрения, и которые могут иметь некоторую привлекательность, давая иллюзию систематического анализа, хотя и рассматриваются слишком неофициально, чтобы быть убедительными. Предполагается, что этот сайт посвящен информатике , а не программированию. Мы должны использовать минимум устоявшейся науки и принятых концепций, чтобы ответить на технический вопрос.

Быстрый анализ стандарта показывает, что все символы, используемые в азбуке Морзе, в конечном итоге кодируются в двоичном виде , поскольку он передается в виде строки единиц одинаковой длины с сигналом, который может быть включен или выключен для каждой единицы. Это указывает на то, что сообщения Морзе в конечном итоге кодируются в логическом алфавите . $\Sigma_1=\{0,1\}$

Но это ничего не говорит о внутренней структуре кода. Кодируемая информация представляет собой строку в алфавите из 58 символов (в соответствии со стандартом), включающую 57 символов и пробел. Это соответствует алфавит $\Sigma_3=\{A,B,\dots,Z,0,1,\dots,9,?,=,\dots,\times,@,[\;]\}\;$ последний символ - пространство.

Тем не менее, стандарт определяет , что существует промежуточный алфавит , на основе и и , возможно , других символов. Это вполне понятно $\Sigma_2$ dotdash

что строки в должны быть закодированы как строки в , и $\Sigma_3^*$ $\Sigma_2^*$
что строки в должны быть закодированы как строки в $\Sigma_2^*$ $\Sigma_1^*$

Таким образом, учитывая, что нет выбора для и , вопрос следует понимать как: « Какое количество символов мы должны рассмотреть в промежуточном алфавите чтобы наилучшим образом объяснить структуру и свойства всего Морса? код ", который также влечет за собой указание двух кодировок между тремя уровнями. $\Sigma_1$ $\Sigma_3$ $\Sigma_2$

Учитывая тот факт , что код Морзе является префиксом гомоморфна (переменной длины) код , который исключает любую неоднозначность при декодировании сигнала, мы можем объяснить , просто это существенное свойство с троичной алфавита { , , }, и две схемы кодирования $\Sigma_2=$ dotdashsep от до и от до $C_{3\to 2}$ $\Sigma_3$ $\Sigma_2$ $C_{2\to 1}$ $\Sigma_2$ $\Sigma_1$ которые являются как гомоморфными, так и префиксными, таким образом, оба являются однозначными кодами и, таким образом, могут быть составлены так, чтобы дать однозначное префиксное кодирование 58 символов в двоичный код.

Поэтому Морзе состоит из префикса троичного кода , выраженной в алфавите , , , с этими тремя символами самих закодированных в двоичной системе со следующими кодовыми словами: $\{$ dotdashsep $\}$

dot , и $\to 10$ dash $\to 1110$ sep $\to 00$

Обратите внимание, что то, что известно как пробел между последовательными dotили dashфактически включено в представление dotи dash, поскольку это обычное математическое представление для таких типов кодов, которые обычно определяются как гомоморфизмы строк от исходных символов до кодовых слов, выраженных с помощью целевых символов, как я только что сделал.

Это немного отличается от некоторых представлений, представленных в стандарте, которые направлены скорее на интуитивное определение кода для пользователей, чем на анализ его структурных свойств. Но кодировка одинакова в обоих случаях.

Даже без точной синхронизации стандарта декодер аналогового сигнала может все же перевести его в троичный алфавит, который мы предлагаем, так что вышеупомянутое понимание троичного кода все еще будет в силе.

Коды: основные пункты

Этот ответ основан на Стандарте МСЭ-R M.1677-1 от октября 2009 года (спасибо Джейсону C за справку). Я буду использовать терминологию dotи dash, а не ditи dah, так как это терминология, используемая в этом стандарте.

Прежде чем мы начнем обсуждать азбуку Морзе, мы должны договориться о том, что такое код. Сложные дискуссии по этому вопросу, очевидно, требуют этого.

По сути, информация должна быть представлена, чтобы быть переданной или обработанной иным образом. Код - это система для перевода информации из одной системы представления в другую . Это очень общее определение. Мы должны быть осторожны, чтобы не перепутать концепцию представления и концепции кода из одного представления ( источника ) в другое ( цели ).

Представление может принимать различные формы, такие как переменное электрическое напряжение, цветные точки на бумаге, строка символов, цифры, двоичные строки из нулей и единиц и т. Д. Важно различать аналоговое и формальное (или логическое, или абстрактное) представление. ,

Аналоговое / физическое представление - это чертеж, изменяющийся уровень напряжения, форма (для буквы).

Логическое / формальное / абстрактное представление - это математическое представление с абстрактными графами, строками символов или другими математическими объектами.

Хотя некоторая информация изначально может быть аналоговой, мы обычно преобразуем ее в логическое представление, чтобы иметь возможность точно определить ее обработку математическими средствами или людьми.

И наоборот, когда мы имеем дело с логическим представлением с использованием физических устройств, таких как компьютер или передатчики, нам необходимо придать логическую форму аналоговой форме.

Для целей этого анализа единственная аналоговая форма, которую мы рассматриваем, - это форма, используемая для передачи, как описано в стандарте. Но даже тогда мы будем считать, что первым шагом является интерпретация этого аналогового представления как прямой реализации идентично структурированного логического представления, на котором мы строим наш анализ того, каким может быть код Морзе. Теория кода - это математическая совокупность знаний, основанная на анализе логических представлений.

Однако мы вернемся к аналогично-логическому переходу в конце обсуждения.

Коды: определения

$S$ $T$

Тем не менее, цель азбуки Морзе состоит в том, чтобы предоставить только способ представления строк в большом алфавите в строки на основе гораздо меньшего алфавита (фактически двоичного), используя промежуточный алфавит, почти двоичный (точки и тире), для лучшей адаптации к человеку Восприятие и манипулятивные способности. Это достигается тем, что называется кодом переменной длины :

Используя термины из теории формального языка, точное математическое определение выглядит следующим образом: Пусть и два конечных набора, называемые исходным и целевым алфавитами соответственно. Код - это полная функция, отображающая каждый символ из в последовательность символов над и расширение $S$ $T$ $C: S \to T^*$ $S$ $T$ $C$ $S^*$ $T^*$

$C(s)\in T^*$ $s\in S$

$C$ $S^*$ $T^*$ $T^*$ $S^*$

$w$

Легко показать, что уникальная декодируемость и свойство префикса закрыты по составу кодов.

Обратите внимание, что определение как гомоморфизма подразумевает, что не существует специального разделения между кодовыми словами. Именно их структура, например свойство префикса, позволяет однозначно идентифицировать их.

Действительно, если бы были такие символы разделения, они должны были бы быть частью целевого алфавита, поскольку они были бы необходимы для декодирования строки из целевого алфавита. Тогда было бы довольно просто вернуться к теоретической модели кода переменной длины, добавив разделитель к предыдущему кодовому слову. Если бы это вызвало контекстную сложность (например, из-за нескольких разделителей), это было бы только намеком на то, что код более сложный, чем очевидный. Это хорошая причина придерживаться теоретической модели, описанной выше.

Азбука Морзе

Азбука Морзе описана в стандарте на трех уровнях:

3 он предназначен для кодирования текста на естественном языке с использованием 57 символов (27 букв, 10 цифр, 20 синболов и знаков препинания) и межсловного пространства для разрезания строки символов на слова. Межсловное пространство используется как специальный символ, который можно смешивать с остальными, что я отмечу SEP.
2 все эти символы должны быть закодированы как последовательности dash и dotс использованием межбуквенного пробела, который я отмечу sep, чтобы отделить dashи dotодной буквы от таковых из следующей буквы.
1 dashИ dot, а также sepдолжны быть закодированы как сигнал или отсутствие сигнала ( так называемый интервал) с длиной точно определенной в терминах некоторого принятого блока. В частности, dashи dot кодировка буквы должна быть отделена межэлементным пространством, что я отмечу σ.

Это уже требует нескольких выводов.

Сообщение, которое должно быть передано и получено в аналоговой форме, представляет собой последовательность единиц длины (пространственной длины или продолжительности времени), так что сигнал включается в течение всей длительности каждой единицы, как указано в разделе I Приложения 1, раздел 2 стандарта :

2   Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.

Это явно аналоговое кодирование в так называемом потоке битов, который может быть логически представлен в двоичной записи строкой 0 ANS 1, стоя для аналогового выключения и на .

Таким образом, чтобы абстрагироваться от проблем, связанных с аналоговым представлением, мы можем считать, что сообщения кода Морзе передаются в виде битовых строк, что мы отметим с помощью 0и 1.

Следовательно, вышеприведенная выдержка из стандарта может быть логически выражена как:

0 dot представлен 1.
1 dash представлен 111.
2 Межэлементное пространствоσ представлено как 0.
3 Межбуквенное пространствоsep представлено как 000.
4 Межсловное пространствоSEP представлено как 0000000.

Таким образом, мы могли видеть код Морзе как использующий 5 кодовых слов в двоичном коде, чтобы закодировать эти 5 символов. За исключением того факта, что это не совсем то, как описывается система, есть еще кое-что, и это не самый удобный способ, с которым можно думать, с наивной или математической точки зрения.

Также обратите внимание, что это описание предназначено для неспециалистов, а не специалистов по теории кода. По этой причине он описывает больше видимый внешний вид, чем внутреннюю структуру, которая его оправдывает. У него нет причин исключать другие описания, совместимые с этим, хотя и математически более структурированные, чтобы подчеркнуть свойства кода.

Но сначала отметим, что полное описание кода включает в себя 3 уровня представления, которые сразу распознаются:

3 Текст, состоящий из строки символов, в том числеSEP .
2 Кодирование буквы строки в виде строки dot, dashиsep .
1 Кодирование строки этих двух уровней 2 symbolsв виде двоичной строки.

Мы можем, возможно, обсудить, какие символы закодированы в чем, но существенным аспектом азбуки Морзе является то, что он имеет эти три уровня представления, с символами вверху, символами dots и dashes в середине и битами 0и 1внизу. ,

Это подразумевает, что обязательно есть два кода, один с уровня 3 на уровень 2, а другой с уровня 2 на уровень 1.

Анализируя три уровня представления

Чтобы провести последовательный анализ этой трехуровневой системы кодирования, мы должны сначала проанализировать, какая информация актуальна на каждом уровне.

1 Битовая строка по определению и по необходимости ее аналогового представления состоит только из 0и 1.
3 На уровне текста нам нужен и алфавит из 58 символов, включая 57 символов и межсловное пространство SEP. Все 58 из них должны иметь в конечном итоге двоичное кодирование. Но, хотя стандарт кода Морзе определяет эти 57 + 1 символов, он не определяет, как они должны использоваться для кодирования информации. Это роль английского и других естественных языков. Азбука Морзе предоставляет другой системе алфавит из 58 символов, на котором они могли бы построить 58-значный код, но сам код Морзе не является 58-буквенным кодом.
2 На dotи dashуровне, нам нужны все эти два символа для того , чтобы кодировать 57 символов, т.е. обеспечивают кодовое слово для каждого в виде строки dotи dash, вместе с каким - то разделителем sepк отметке , когда одна буква закончена, и еще один старт. Нам также нужны некоторые средства кодирования межсловного пространства SEP. Мы могли бы попытаться обеспечить это непосредственно на уровне 1, но это могло бы испортить иначе организованную структуру кода.

Действительно, описание стандарта может справедливо подвергаться критике за то, что он делает именно это. Но авторы, возможно, думали, что их презентация будет проще понять для среднего пользователя. Также следует традиционное описание азбуки Морзе, предшествующее этому виду математического анализа.

Это требует нескольких замечаний:

на уровне 3, буквенный уровень, межбуквенное пространство sepбольше не имеет смысла. Это вполне нормально, поскольку во вселенной букв оно не имеет большего значения, чем пространство, разделяющее два письменных символа на бумаге. На уровне 2 необходимо распознавать кодовые слова, представляющие буквы, но это все.
аналогично на уровне 2 межэлементное пространство σбольше не имеет смысла. Это не имеет никакого значения в мире dotи dash, но необходимо только на уровне 1 , чтобы идентифицировать двоичные кодовые слова , представляющие dot, dash. Но на уровне 1 его нельзя отличить от бита 0.

Таким образом, пространство между элементами σбольше не является чем-то особенным. Это всего лишь одно использование 0.

$\Sigma_2^*\to\Sigma_1^*$

dot $\to$ 10dash $\to$ 1110

$\Sigma_2$ sep0000dotdash00sep0dotdash0

$\Sigma_2=$ dotdashsep $C_{2\to 1} : \Sigma_2\to\Sigma_1^*$

dot $\to$ 10
dash $\to$ 1110
sep $\to$ 00

И у нас есть хороший сюрприз, чтобы обнаружить, что ни одно кодовое слово не является префиксом другого. Следовательно, у нас есть префиксный код, который однозначен и легко декодируется.

$C_{3\to 2}: \Sigma_3\to\Sigma_2^*$

dotdash $\Sigma_3$ dot dot dash dot $f$

$f\to$ dot dot dash dot sep

$\Sigma_3$ SEP00000000sep0dotdashSEP0000

SEP $\Sigma_2^*$ sep00SEPsep sep

$\Sigma_3=\{A,B,\dots,Z,0,1,\dots,9,?,=,\dots,\times,@,$ SEP $\}$ $C_{3\to 2} : \Sigma_3\to\Sigma_2^*$

$A \to$ dot dash se
$B \to$ dash dodot dot sep
$Z \to$ dash dash dot dot sep
$7 \to$ dash dash dot dot dot sep
SEP $\to$ sep sep

$C_{3\to 2}$

$C_{Morse}= C_{2\to 1}\circ C_{3\to 2}$

Таким образом , мы можем сделать вывод о том , что код Морзе может быть понят и легко проанализировать, как состав префикса двоичного кодирования из алфавита 3 символов { dot, dash, sep} в двоичный алфавит, и префикс , кодирующем из 58 символов алфавита (57 символов и один пробел) в алфавит из 3 букв.

Сама композиция представляет собой префиксное кодирование 58 символов в двоичное представление.

Замечания по этому анализу.

Всегда трудно установить, что представление структуры - лучшее, что можно придумать. Однако представляется, что приведенный выше анализ соответствует критериям, установленным в начале этого ответа: близость к трехуровневому определению, формально представленная в соответствии с современной теорией кодирования, простота и свидетельство основных свойств кода.

Обратите внимание, что нет смысла искать свойства для исправления ошибок. Код Морзе может даже не обнаружить единственную битовую ошибку, поскольку он может просто изменить две dotв одну dash. Однако это вызывает только локальные ошибки.

Что касается сжатия, троичное кодирование было разработано, чтобы приблизительно уменьшить количество точек и тире в приближенном виде кодирования Хаффмана . Но два составных кода можно легко сделать более плотными.

Что касается размера алфавитов, то здесь нет выбора для двоичного и 58-символьного алфавита. Промежуточный алфавит может содержать больше символов, но какова будет цель?

Однако некоторые люди будут склонны распознавать пространство DETна уровне 2, что делает алфавит четвертичным , а затем использовать его непосредственно на уровне 3, закодированном как само на уровне 2.

DET0000 $C_{2\to 1}$ $C_{Morse}$

Действительно, такой выбор сделал бы двоичную строку 0000неоднозначной, декодируемой либо как, либо SEPкак sep sep. Неоднозначность должна быть решена с помощью контекстного правила, которое sepне может следовать самому себе, что делает формализацию более сложной.

Важность аналога к логическому переходу.

Этот анализ в значительной степени опирается на тот факт, что разложение сигнала включения / выключения на блоки равной длины четко указывает на аналоговое представление двоичной строки. Кроме того, длины в единицах точно соответствуют приведенному выше анализу, что вряд ли произошло случайно (хотя это возможно).

Однако, из (слишком поверхностного) взгляда на оригинальный патент 1647 , он, кажется, не был настолько точным с такими предложениями, как (в верхней части страницы 2):

Знак отличной цифры или составной цифры, когда он используется в предложении из слов или цифр, состоит из расстояния или пробела между символами, которые больше, чем расстояние, используемое при разделении символов, составляющих любые такие отличительные знаки. или составная цифра.

Люди, которые позже отправляли вручную или получали на слух, также вряд ли были такими точными. Действительно, их кулак , то есть их время, часто было узнаваемо. Это мнение также подтверждается тем фактом, что не всегда соблюдаются расстояния между интервалами , особенно при изучении азбуки Морзе.

Эти ситуации соответствуют аналоговому представлению кода как короткий сигнал (точка), средний сигнал (тире) и короткая, средняя и длинная пауза. Прямое преобразование в логический алфавит, естественно, даст двоичный алфавит, в который должны быть закодированы 58 символов. Это, конечно, уже не трехуровневая презентация азбуки Морзе.

Однако, чтобы иметь смысл (и, возможно, избежать двусмысленности), этот алфавит должен использоваться с ограничением, что два сигнальных символа ( dotили dash) не могут следовать друг за другом, и что символы паузы также не могут следовать друг за другом. Анализ кода и его свойств будет сделан более сложным, и естественный способ упростить его будет заключаться в том, чтобы сделать то, что было сделано: ввести правильные временные параметры, чтобы превратить его в композицию из двух кодов, что приведет к довольно простому анализу, приведенному выше ( помните, что это включает в себя показ кода префикса).

Кроме того, нет необходимости строго придерживаться точного времени в аналоговом представлении. Поскольку декодер аналогового перевода может различать короткие, средние и длинные паузы любыми средствами, он должен просто имитировать то, что было сделано в двоичном случае. Следовательно, короткий и средний сигнал (обязательно сопровождаемый паузой) распознается как логический dotили dash. Короткие паузы забываются, так как служат только для обозначения конца dotили dash. Средние паузы распознаются как sep, а длинные паузы распознаются как две sepподряд. Следовательно, аналоговый сигнал представлен в троичном алфавите, который можно использовать, как и прежде, для кодирования алфавита из 58 символов. Наш первоначальный анализ может использоваться, даже если сроки строго не соблюдаются.

В качестве альтернативы, альтернация паузы сигнала может использоваться для преобразования этого двоичного алфавита в троичный, сохраняя только три длительности в качестве символов алфавита и используя контекстный анализ, чтобы определить, является ли данная длительность сигналом или паузой. Но это опять немного сложно для анализа.

Это просто показывает, что существует множество способов взглянуть на вещи, но они не обязательно удобны и могут не все легко поддаются анализу с помощью математических инструментов, разработанных для анализа кодов.

Дополнительные ссылки на патенты можно найти в Интернете.

Вывод

Учитывая точные временные параметры стандарта, хороший ответ, по-видимому, заключается в том, чтобы рассматривать азбуку Морзе как композицию троичного префиксного кодирования (из 58 символов) в алфавит из 3 символов, составленный из двоичного префиксного кодирования этих трех символов.

Без точной синхронизации стандарта бинарный уровень больше не может рассматриваться. Тогда аналог логического декодирования естественным образом происходит на уровне промежуточного алфавита dotи dash. Тем не менее, аналогово-логический декодер может по-прежнему декодировать до 3 предыдущих символов алфавита, тем самым сохраняя применимость нашего анализа.

— Babou
источник

1

Пожалуйста, перенесите

— Wandering Logic

1

Комментарии не для расширенного обсуждения; этот разговор был перемещен в чат .

— Рафаэль

Вопрос: В троичном аргументе вы начинаете с алфавита {0,1}, из этого вы строите четыре символа {точка = 10, тире = 1110, sep1 = 00, sep2 = 000000}, из этого вы строите набор троичного кодового слова разрешив sep2 = sep1 sep1 sep1 . Набор кодовых слов был выбран, потому что он неявно связывает символы с кодировкой, что удобно, и OP запрашивает двоичное хранилище. Однако, почему вы не можете вместо этого использовать кодовое слово set {rest = 0, on = 1}, а затем сказать «точка = вкл», «тире = вкл вкл», sep0 = «выкл», sep1 = «выкл выкл» , sep2 = "выкл. выкл. выкл. выкл. выкл. выкл." (где sep0 - остаток межсигнала)?

— Джейсон С

^ В этом случае аргумент для двоичного кодового слова, установленного над троичным, но с использованием такого же и столь же сильного аргумента, как и троичный, приведенный здесь. Таким образом, выбор придания особого значения нескольким разделителям в строке, но не придания особого значения множеству чего-либо в строке, является фундаментальным для троичного аргумента, но также кажется произвольным.

— Джейсон С

1

Давайте продолжим эту дискуссию в чате .

— Бабу

28

Этот ответ не так долго, как выглядит; этот сайт просто помещает большое расстояние между элементами списка! Обновление: На самом деле это становится довольно долго ...

Азбука Морзе не является «официально» двоичным, троичным, четвертичным, кинарным или даже 57-ю (если я правильно считаю). Спорить о том, какой из них без контекста, не является продуктивным. Это до вас , чтобы определить , какой из этих пяти он основан на приложении и требованиях кодирования для вашей конкретной ситуации . В связи с этим у каждого размера набора символов есть свои плюсы и минусы, которые вы должны учитывать в своей ситуации, прежде чем принимать решение.

Для основы, M.1677 , международный стандарт азбуки Морзе, раздел 2, определяет время как:

2 Интервал и длина сигналов
2.1 . Тире равно трем точкам.
2.2 Расстояние между сигналами, образующими одну и ту же букву, равно одной точке.
2.3 Расстояние между двумя буквами равно трем точкам.
2.4 Расстояние между двумя словами равно семи точкам.

Обратите внимание, что это определяет только время, например, тире не означает то же самое, что три точки, это просто одинаковая длина. Базовая единица времени - точка.

двоичный

Мы можем выбрать двоичный файл, если захотим. Можно представить азбуку Морзе «строгим двоичным кодом», как вы его называете, - авторский подход заключался в назначении цифр «точка» и «тире». Такой подход не работает, и я не думаю, что автор хорошо понимает азбуку Морзе. Но есть другой подход, который работает. Если мы выберем двоичный код, мы по существу представим, является ли сигнал высоким или низким, когда каждый символ занимает один отрезок времени с точками. Обратите внимание, что это также подход, описанный на странице списка двоичных кодов, которую вы цитировали.

Также могут быть выбраны другие двоичные кодировки (например , ответ Боба Джарвиса ) за счет увеличения сложности декодирования обратно в слышимый код Морзе (кодирование Боба не может быть декодировано без сохранения состояния, например, компромисс заключается в том, что он обеспечивает более короткие кодированные последовательности).

Условные обозначения:

Низкий, выкл. И т. Д. (0)
Высокий, и т. Д. (1)

Примеры кодирования:

Разделитель сигналов: 0
Разделитель букв: 000
Разделитель слов: 0000000
Три точки: 10101
Три черты: 11101110111
Слово «сын»: 101010001110111011100011101
Фраза "это": 10100010101000000010111

Плюсы:

Минимальный размер набора символов
Легко управляется с помощью типичной цифровой логики
Легко декодировать в звуковой азбуке Морзе (при условии, что проверка не производится); декодирование без сохранения состояния и не требует хранения информации о синхронизации символов (каждый символ имеет одинаковую длину).

Минусы:

Длинные кодировки.
Много возможностей для неправильных кодировок.
Значения отдельных символов (0, 1) зависят от контекста.

троичный

С помощью этого выбора мы определяем интервалы между буквами и словами как остатки, а интервалы между сигналами неявны (хотя вы можете выбрать, чтобы символы остатка длины точки между сигналами были лучше, если это вам подходит).

Условные обозначения:

Точечный отдых (0)
Точка (1)
Тире (2)

Примеры кодирования:

Разделитель букв: 000
Разделитель слов: 0000000
Три точки: 111
Три черты: 222
Слово «сын»: 11100022200021
Фраза "это": 11000111000000012

Плюсы:

Маленький размер набора символов.
Разделитель сигналов больше не нужен.
Более короткая длина кодирования, чем двоичная.
Удаляет некоторые недопустимые кодировки (например, 0110 с двоичным выбором, более невозможным).

Минусы:

Все еще длинные кодировки.
Еще много возможностей для недействительных кодировок, в частности, остатков.
Невозможно декодировать без сохранения состояния ^†, если вы не захотите размещать явные точки покоя между сигналами.
Разделители сигналов являются неявными ^‡, если только вы не решите разместить явные точки покоя между сигналами.
Некоторые значения отдельных символов (0) зависят от контекста.

четвертичный

Условные обозначения:

Разделитель букв (0)
Разделитель слов (1)
Точка (2)
Тире (3)

Примеры кодирования:

Три точки: 222
Три черты: 333
Слово «сын»: 2220333032
Фраза "это": 220222123

Плюсы:

Очень короткая закодированная длина.
Возможность неправильных кодировок уменьшена.
Символы семантически точны.
Возможно, более читабельный.

Минусы:

Большой размер набора символов.
Не может быть расшифровано без сохранения состояния. ^†
Разделители сигналов неявны. ^‡

пятеричный

Прямая интерпретация списка Википедии. Обратите внимание, что это очень похоже на двоичный выбор, за исключением того, что различные допустимые комбинации двоичных нулей или единиц имеют свои собственные символы.

Условные обозначения:

Разделитель сигналов (0)
Разделитель букв (1)
Разделитель слов (2)
Точка (3)
Тире (4)

Примеры кодирования:

Три точки: 30303
Три черты: 40404
Слово «сын»: 303031404041403
Фраза "это": 3031303032304

Плюсы (по сравнению с четвертичным):

Может быть расшифрован без сохранения состояния.
Единственный размер набора символов, который однозначно, прямо и кратко представляет пять объектов, упомянутых в разделе 2 стандарта: «точка» (к которой относятся все моменты времени), «тире», «пробел между сигналами», «пробел между две буквы "," пробел между двумя словами ".

Минусы (по сравнению с четвертичным):

Более высокая вероятность неправильных кодировок.
Увеличенная длина кодирования без добавления дополнительной информации (компромисс - простота декодирования).
Не так легко декодировать, как двоичный выбор, поскольку каждый символ имеет разную длину во времени, и эта связь должна где-то сохраняться.

57-ичной:

Включено для полноты.

Условные обозначения:

26 букв
10 номеров
20 знаков препинания и разных знаков
Разделитель слов (пробел)

Примеры кодирования:

Слово "сын": son
Фраза "это": is a

Плюсы:

Кратчайшая кодировка
Человек читаемый
Неверные кодировки невозможны.

Минусы:

Самый большой набор символов
Трудно декодировать в азбуке Морзе; необходимо поддерживать таблицы выходных последовательностей азбуки Морзе для каждого символа и необходимо определять границы слов и соседние буквы, чтобы определить, куда вставлять различные остатки.
Невозможно выйти за пределы спецификации азбуки Морзе без добавления новых символов (компромисс за невосприимчивость к недопустимым кодировкам).
Разделители сигналов и букв неявны. ^‡

прекращение

Для хранения в виде потока символов на устройстве, если вам нужно это сделать, стоит отметить, что M.1677 определяет последовательность завершения сообщения и завершения передачи. Из части II:

5 Каждая телеграмма должна заканчиваться перекрестным сигналом (. -. -.)
6 Конец передачи должен указываться перекрестным сигналом (. -. -.) С последующим приглашением к передаче сигнала K (-. -)
7 Окончание работы указывается станцией, которая передала последнюю телеграмму. Правильная индикация - сигнал окончания работы (... -. -)

К сожалению, в стандарте ничего не говорится о способности различать, например, строку «+ K» от последовательности ( конец телеграммы , приглашение к передаче ). Однако окончание работы уникально. Если вы храните азбуку Морзе, то вам нужно будет сделать выбор, как указать конец сохраненной последовательности.

Если вы храните, например, весь диалог и используете двоичный набор символов, вы могли бы разумно считать окончание работы индикатором конца последовательности, представленным как уникальная битовая последовательность 101010111010111. Вам необходимо учитывать тип данных, которые вы храните (например, фрагменты сообщений, целые сообщения, целые разговоры), а также средств, предлагаемых вам вашим носителем данных (например, возможность префикса с длиной сообщения), прежде чем принять решение. Я полагаю, вы могли бы пойти так далеко, чтобы определить свой собственный индикатор конца последовательности. В любом случае это все вопросы базового хранилища, и у них слишком много возможностей для перечисления здесь. Выбор действительно зависит от вас, исходя из того, что подходит для вашей ситуации.

^† Не может быть расшифровано без сохранения состояния: эти кодировки требуют сохранения некоторого состояния для декодирования в слышимый азбуку Морзе. Все они требуют «Если предыдущий символ был точкой / тире, а текущий символ - точкой / тире, вставьте разделитель сигналов». Хотя вы можете попытаться «обмануть» и автоматически добавить разделитель сигналов ко всем символам, уменьшив при этом разделитель слов до 5 остатков и разделитель букв до 1, M.1677 afaict явно не запрещает последовательные разделители слов, что нарушает этот ключ.

^‡ Разделители сигналов неявны: это напрямую связано с приведенным выше примечанием, но более семантически ориентировано. Эти кодировки имеют неявные разделители сигналов в своих обозначениях. То есть «zzz» - это интуитивно три отдельных z, границы которых «привязаны» к тому, что разделяет символы в самой кодировке. Рассмотрим описание «три точки подряд»; Интуитивно мы понимаем, что это означает три отдельных точки, но если разделители не подразумеваются, это можно считать неотличимым от тире. Только двоичные и двоичные представления в стиле Википедии (или троичные с явной опцией разделения сигналов) удаляют здесь всю неоднозначность и «горячие клавиши», что может иметь большое значение в зависимости от ситуации.

TL; DR:

Как вы можете видеть, у каждого есть свои преимущества и недостатки, и вам решать, как вы хотите относиться к этому, исходя из ваших требований . Там нет правильного ответа. Вы можете попытаться доказать, что один из них более уместен, чем другой в целом, но эти аргументы сводятся к педантичным предпочтениям, поскольку без контекста нет правильного ответа.

Теперь, все, что сказало, по моему собственному мнению, двойной выбор - представление, которое кажется мне наиболее "правильным" для самого азбуки Морзе (первоначально я предпочел четвертичный). Это единственный выбор, который обеспечивает все следующее:

Символы без контекста (сам по себе символ содержит всю информацию о его значении без проверки смежных символов).
Представление всех примитивов, определенных в M.1667.
Разделители (сигнал, буква, слово) не подразумеваются нотацией или базовой кодировкой (это важно, если я написал { dot, dot, dash }, ,они значимы и их легко не заметить).

Однако есть веские аргументы для всех. Аргументы, связанные с кодированием, также применимы к трактовке самого Морса. Нет 100% конкретного ответа, но он, безусловно, может стать хорошей темой для обсуждения с друзьями в баре.

, , , -. -

— Джейсон С
источник

1

Пожалуйста, перенесите

— Wandering Logic

1

Комментарии не для расширенного обсуждения; этот разговор был перемещен в чат .

— Рафаэль

Вы продолжаете ссылаться на декодирование без сохранения состояния в своих аргументах. В теории кодирования состояния, кажется, используются очень редко, в сверточных кодах, которые являются семейством кодов с исправлением ошибок. Это совершенно не по теме, так как азбука Морзе совсем не исправляет ошибки. Действительно, он даже не может обнаружить некоторые однобитовые ошибки, не говоря уже о том, чтобы их исправить. Вы придумываете различные виды произвольных кодов как версию азбуки Морзе, но они не приносят понимания. Зачем представлять их? Не требующие состояний, то есть гомоморфное кодирование, кажется минимальным требованием. И вы пропустите интересные кодировки. cc @KorayTugay

— бабу

@babou Statless аргументы декодирования?

— Корай Тугай

@babou Я не против иметь пару не по теме вопросов. Конечно, наборы символов произвольны; это именно то, что я делаю с этим ответом. Тернарное слово, установленное поверх двоичного аргумента префиксного кода, одинаково произвольно. На первый взгляд, нет, но, по сути, вы сделали произвольный выбор, чтобы аргумент основывался на кодовом слове, состоящем из двухбуквенного алфавита (0 и 1). Это произвольный выбор, потому что выбор придавать «sep sep sep» особый смысл, но не делать это «единице 1», является произвольным. С таким же успехом можно сказать, что «тире» - это «точка-точка-точка», и отстаивать двоичный код над троичным.

— Джейсон С

5

Несмотря на мои первоначальные мысли по этому поводу, оказалось, что этот вопрос может быть формализован таким образом, который допускает довольно точный ответ (по модулю пара вопросов определения). Ответ оказывается 3 или 4, то есть тройной или четвертичный. Ответ толпы «все идет от 2 до 57» верен только в том смысле, что если кто-то спрашивает вас о характеристике абелевых групп, вы говорите ему, что они являются сетами.

Давайте начнем с рассмотрения физического кодирования для азбуки Морзе. Это на самом деле B ASK , то есть двоичная манипуляция со сдвигом амплитуды, которая является просто сложным способом сказать, что есть два физических (электрических / оптических и т. Д.) Уровня амплитуды для нас, чтобы кодировать наше сообщение. Итак, ближайший вопрос: не значит ли это, что ответом является то, что азбука Морзе является бинарной? Ну, это бинарное только в довольно не-информативным способом, в том смысле , что двоичный сигнал включения / выключения , пересылаемых через провод не соответствует непосредственно к или линий или точек. На этом расплывчатом уровне соответствия мы могли бы даже отправить код ASCII (с прямым, очевидным кодированием битов) и назвать его «азбукой Морзе» и / или «двоичным»; То же самое относится к любому коду Хаффмана (вместо ASCII).

Итак, как мы можем сделать переписку более точной и в то же время формализовать наш вопрос? Теория кодирования приходит на помощь. Позволять $M$ быть набором "morsable" символов, примерно 66 символов, если я правильно понимаю вселенную азбуки Морзе; это включает в себя 26 латинских букв, 0-9 цифр и кучу вспомогательных слов, таких как знаки препинания, "просынки" и т. д. На самом деле это не очень важно, что это такое. Код является инъективным отображением $c:M\to T^*$ где $T$ (не $T^*$ ) представляет собой набор кодовых слов. Чтобы быть физически представимым в нашем базовом оборудовании BASK, мы требуем, чтобы $T\subset \{0,1\}^*$ т.е. наши кодовые слова должны быть цепочками битов; обратите внимание, что это влечет за собой $c$ Значения представляют собой строки кодовых слов, то есть строки строк битов, но в конечном итоге линеаризуются как просто строки битов.

Чтобы быть точной характеристикой азбуки Морзе, нам нужно $T$ содержать некоторые прямые эквиваленты линий и точек в том смысле, что между этими кодовыми словами и точками и линиями, представляющими код Морзе на бумаге, должна быть биекция. $T$ также должен быть [почти] уникально дешифруемым кодом, а это означает, что любой факторинг элемента $T^*$ с точки зрения элементов / кодовых слов $T$ [в идеале] должно быть уникальным. (Обратите внимание, что некоторые авторы, например, Berstel , даже не называют $T$ код, если только он однозначно не дешифруется, но другие, например, Стив Роман, имеют другую терминологию, где любое отображение является кодом, но те, которые являются уникально дешифруемыми, просто называются так и сокращенными кодами UD. Здесь я буду только последняя терминология. Вы также увидите чуть позже, почему я сказал «в идеале».)

поскольку $c$ требуется только инъекция, а не сюрприз, мы можем заполнить $T$ с произвольным «мусором», превышающим то, что необходимо для получения кода UD, при условии, что строки, сгенерированные этим мусором, не являются прообразом чего-либо, что можно убить. Например, строка, состоящая ровно из 42 точек, не соответствует ни одному из вариантов кода Морзе, который я видел. Поэтому, когда мы спрашиваем, является ли азбука Морзе двоичным, троичным, четвертичным, кинарным и т. Д., Возникает вопрос о минимальной мощности множества $T$ с двумя вышеупомянутыми свойствами, а именно: это [почти] код UD, и мы имеем очевидную биекцию между бумажной «линией» и «точкой» к некоторым элементам $T$ ,

Есть два способа приступить к построению $T$ либо сверху вниз, наблюдая, что вам нужен разделитель между бумажными, строчными точками для азбуки Морзе, чтобы получить код UD, либо снизу вверх, поскольку в международном коде Морзе МСЭ нам дается время длины линий, точек и различных пауз. Я буду использовать последний подход здесь, потому что есть множество способов получить некоторые $T$ в противном случае, т. е. вы можете выбрать довольно произвольные отрезки времени, например, в несуществующем американском коде Морзе используются более короткие строки, чем в версии МСЭ.

Начнем с представления, основанного на длине сигнала МСЭ, которое имеет пять основных кодовых слов, сгенерированных из сигнала «вкл» (1) и «выкл» (0): just-dot(1), just-line(111), unit-space(0) , letter-space(000) и word-space[предположили семь 0 в International Morse, но могут отличаться на практике]. Сразу отметим, что unit-spaceможет появиться только баночка, за которой следует только 1 сразу после just-dotи just-line; и это $0$ -терминация just-dotи just-line(которая является кодом запятой; подробнее об этом позже) на самом деле требуется, в противном случае вы даже не сможете отличить строки от точек. Это дает очевидное сокращение до четырех кодовых слов:

dit= just-dot unit-space= 10 и
dah= just-line unit-space= 1110

Так что это четвертичный код Морзе: dit, dah, letter-space, word-space. Следующее наблюдение состоит в том, что word-spaceаппроксимация может быть приближена (или даже предположена) к двум letter-spaceс, то есть к шести нулям. Так вот как вы получаете набор троичного кодового слова; В качестве ссылок для этой линии рассуждений см., Например, [1] [2] .

Существует также техническая причина, чтобы предпочесть троичные кодовые слова: $T = \{10 , 1110, 000\}$ является уникально дешифруемым кодом, на самом деле это код префикса. тем не мение $\{10 , 1110, 000, 0^7\}$ (или версия только с шестью нулями) больше не может быть однозначно расшифрована, потому что $0^{10}=0^30^7=0^70^3$ так что есть неуникальная факторизация. Хотя это теоретически является проблемой, это не представляет никакой практической проблемы, поскольку человеческому «метроному» все равно трудно измерять очень длинные молчания, поэтому в принципе любое молчание, превышающее определенную длину, считается человеком (своего word-spaceрода ) своего рода.

Также обратите внимание, что если вы придерживаетесь $0$ и в этом наборе (то есть в «кинарном» виде) он становится «еще более неправильным», в том смысле, что даже $000$ больше не имеет уникальной факторизации (так как само по себе является кодовым словом). Более того, $0$ не в прообразе любого символа Морзе, так что это мусор в $T$ так же, как вы можете добавить $1^{42}0$ в $T$ ; на самом деле добавление последнего менее хлопотно, в отличие от добавления $0$ это не заставит код потерять свойство UD.

Уменьшение / абстракция dit, dah, в letter-spaceвиде двоичных кодовых слов до трех абстрактных символов (trits) полезно для быстрого , показывающих , что (тройной) Морзе код УД; это сразу очевидно, потому что letter-spaceдействует как запятая, т. е. троичный код Морзе является кодом запятой. (Обратите внимание, что другие авторы определяют «код запятой» в более ограничительном смысле, когда все символы, кроме запятой, одинаковы; я использую его здесь в более широком смысле, приведенном в «Постмодернистской алгебре» Д.Х. Смита , которая просто означает использование уникального завершающего символа для любого кодового слова.) Также обратите внимание, что техника кода comma0 используется на двух уровнях в коде Морзе; just-lineи just-dotзаканчиваются на «короткой» запятой unit-space= $0$ сделать их отличимыми друг от друга. Как только вы абстрагируете эту конструкцию от двух разных ( ditи dah) тритов, все буквы азбуки Морзе также будут запятыми, заканчивая их $000$ который третий трит.

Вы можете также использовать Трит подход CALCulate энтропию Если предположить , dahи ditи letter-spaceявляются «эквивалент» , как trits [3] , в том смысле , что, например-'e»занимает 2 trits и„у“занимает всего лишь 5 тритов. Подход абстрактного трита не так полезен, если вы заботитесь о том, как дорого каждый символ фактически передавать в реальном кодировании Морзе BASK в строке. Для последнего вам нужно перейти к действительной длине в битах 3 (или 4) символов, которые рассматриваются как переходы в автомате. Например, буква «е» занимает 5 бит для кодирования (как dit letter-space), а буква « у» занимает 17 бит (три dahс, один ditи а letter-space). Эта линия мышления восходит к Шеннону (см. Стр. 3-4). Более подробную информацию можно найтив «Теории и кодировании информации» Блахута , например, он вычисляет «в среднем 9,296 единиц времени сигнализации на исходную букву вывода» для кода Морзе, используя (безусловные) вероятности появления букв на английском языке. Для немного другой экспозиции (от зоолога!) Вы можете взглянуть на JP Hailman ; он получает другое среднее значение (10,2), потому что он предполагает слегка отличающиеся вероятности для английских букв, но в остальном его анализ концептуально одинаков.

Подводя итог: вы можете взглянуть на азбуку Морзе несколькими взглядами, но некоторые более плодотворны, чем другие, говоря что-нибудь интересное об этом. Мне не известны какие-либо анализы с использованием «кинарного» представления, и для того, чтобы эта модель не была сводимой к четырем символам, вам нужно будет сделать некоторые предположения о появлении единичного пространства, которое не содержится в реальном Морзе. Например, у вас может быть два, но не обязательно три смежных единичных пространства (что недопустимо по Морзе). Тройной вид дает вам быстрый анализ уникальной декодируемости. Самый глубокий / плодотворный взгляд - это тот, который видит 3 или 4 символа, которые фактически представлены неравным количеством битов, как они есть в реальном коде Морзе (| dit| = 2, | dah| = 4, | letter-space| = 3 и |word-space| = 6 или 7); на этом низком уровне все еще полезно рассматривать троичные / четвертичные символы как переходы в автомате.

Что касается того, почему Википедия сосет на это ... ну, в некоторых темах она просто делает. Их основная статья на http://en.wikipedia.org/wiki/Coding_theory не совсем то, что я бы рекомендовал прочитать. Я не могу сказать много о книге (Петцольд), которую вы упомянули, кроме как написанной экспертом в области теории информации. Petzold верен только в том смысле, что если бы азбуки Морзе состояли только из одной буквы, вы могли бы разумно сказать, что они находятся в некотором двоичном коде; если вы хотите послать слова, вам нужен разделитель букв, иначе код будет ужасно не UD, вплоть до непрактичности.

Здесь уже немного поздно пересматривать весь пост, но @babou ниже указывает на то, что Шеннон, Блахут и другие, по-видимому, неверно истолковали (текущий) стандарт МСЭ (предполагая, что он не изменился со времени) в следующем Техническость: единичное пространство добавляется между точками и точками одной и той же буквы , но только letter-spaceбуквы добавляются между буквами. Это прочтение стандарта, кажется, подтверждается сравнительно недавней книгой практикующего . Таким образом, мы должны заимствовать один 0 из letter-spaceкаждого, ditи dahкогда они находятся в конечных позициях буквы, оставляя только два 0 для letter-space, т.е. $T=\{10, 1110, 00\}$ , Это также означает, что (например) размер 'e' составляет всего 4 бита, а не 5.

— Физз
источник

Пожалуйста, перенесите

— Wandering Logic

Комментарии не для расширенного обсуждения; этот разговор был перемещен в чат .

— Рафаэль

-1

Первоначально азбука Морзе предназначалась для написания отметок на полоске бумаги, но вскоре телеграфные операторы смогли «прочитать» щелчки оборудования. Эта версия Морзе (американская или «сухопутная» Морзе) имела три элемента «метки»: точку, тире и длинную черту.

Использование International Morse в течение прошлого столетия посредством радиопередачи обычно кодировалось вручную (на телеграфном ключе) и расшифровывалось на слух, прислушиваясь к звуковому сигналу, производимому приемником. Опытные операторы могут получать лучше, чем неквалифицированные, и некоторые люди могут создавать код, который легче понять, чем код других. Говорят, что хороший передающий оператор имеет «хороший кулак». Неумелый оператор был назван LID. (Происхождение «lid» - которое, я считаю, происходит из-за распространенной в American Morse ошибки отправки LID для DD, даа, dit dit, dah dit dit вместо dah dit dit, dah dit dit - см. Эту ссылку: https://english.stackexchange.com/questions/31818/how-did-the-word-lid-come-to-mean-poor-operator-in-the-context-of-telegraph .)

Таким образом, из этого следует, что «кодирование» Морса в двоичном формате зависит от цели и, следовательно, следует ли сохранить качество «хороший кулак» по сравнению с «плохой кулак». Должна ли цепочка включений и выключений быть согласована с тактовыми импульсами и «исправлена» для трудностей в фазе или длительности каждой части сигнала? Или же вместо этого следует отбирать образцы со скоростью, достаточной для сохранения случайных или запутанных изменений, предположительно для последующей проверки или восхищения?

— экс-хам
источник

1

Извините, как это отвечает на вопрос?

— Корай Тугай