Машинный код 80186 + DOS, 91 байт
Текстовая версия:
hm j j PPjzjzjgaAAA JSJJ RU Sq ReAA JdJJJ RfiJElK JEiS GtI And she said But that s his
Текстовая версия с заменой вкладок (код 9) 9
и пробелов (код 32) *
:
hm9j9j9PPjzjzjgaAAA9JSJJ9RU9Sq9ReAA9JdJJJ9RfiJElK9JEiS*GtI*And*she*said***But*that*s*his***
HexDump:
68 6D 09 6A 09 6A 09 50 50 6A 7A 6A 7A 6A 67 61
41 41 41 09 4A 53 4A 4A 09 52 55 09 53 71 09 52
65 41 41 09 4A 64 4A 4A 4A 09 52 66 69 4A 45 6C
4B 09 4A 45 69 53 20 47 74 49 20 41 6E 64 20 73
68 65 20 73 61 69 64 20 20 20 42 75 74 20 74 68
61 74 20 73 20 68 69 73 20 20 20
Машинный код появляется в файле с расширением .com
. Когда я запускаю его, он печатает требуемое сообщение и затем зависает (выполнение случайных данных).
Высокоуровневое объяснение того, что он делает:
- Инициализирует регистры с постоянными значениями
- Заменяет пробелы в сообщении требуемыми специальными символами (
,'.$
)
- Исправляет код для генерации
int 21
инструкции, которая печатает сообщение
- Calls DOS
Код сборки (может быть скомпилирован tasm
):
my_bp equ 7ah
my_si equ 7ah
my_di equ 67h
my_msg equ 13bh
.model tiny
.code
.startup
.186
org 100h
push 96dh ; ax (ah = 0; al = don't care, but see below)
push 9 ; cx
push 9 ; dx
push ax ; bx = don't care
push ax ; don't care
push my_bp
push my_si
push my_di
popa
inc cx
inc cx
inc cx
or [bp+si+my_msg-my_bp-my_si+12], cx ; ,
dec dx
dec dx
or [bp+si+my_msg-my_bp-my_si+14], dx ; '
or [bp+di+my_msg-my_bp-my_di+23], dx ; '
or [bp+si+my_msg-my_bp-my_si+30], dx ; '
inc cx
inc cx
or [bp+si+my_msg-my_bp-my_si+29], cx ; .
dec dx
dec dx
dec dx
or [bp+si+my_msg-my_bp-my_si+31], dx ; $
; 0x2049 * 0x4b6c = 0x98301cc
; So this sets cx to 1cc (a temporary constant used to patch code)
imul cx, [bp+si+my_msg-my_bp-my_si-2], 4b6ch
; 0x1cc | 0x2049 = 0x21cd (the instruction which calls DOS int 21)
; Here ah = 9 ("print" mode)
or [bp+si+my_msg-my_bp-my_si-2], cx
; At address 101, there is the constant 96d, which was loaded into ax
; 0x96d * 0x7447 = 0x448013b
; So the following sets dx to 13b (adddress of the message)
imul dx, [bp+di+101h-my_bp-my_di], 7447h
int21:
dw 2049h
db 'And she said But that s his '
end
Он использует popa
инструкцию для извлечения всех регистров, потому что обычный pop
не может заполнить все необходимые регистры (например pop di
, это запрещенный код операции).
Адреса байтов для исправления находятся в диапазоне 0x100 ... 0x160. К счастью, они могут быть представлены как сумма 3 байтов с допустимыми значениями:
- 0x7a в
bp
- 0x7a или 0x67 в
si
илиdi
- Непосредственная ценность
Исправление байтов в сообщении работает путем логического OR
0x20 (пробел) и небольшой константы (4, 7, 12 или 14). Маленькая константа получается путем инициализации cx
и dx
до 9 (символ табуляции) и выполнения INC
или по DEC
мере необходимости.
Исправление кода использует IMUL
инструкцию. Я нашел необходимые 16-битные константы для умножения с помощью перебора.
Наконец, адрес сообщения (0x13b) получается умножением. Чтобы сэкономить место, я взял одну из констант из одной инструкции, которая содержит непосредственное значение 0x96d
. Здесь 9
часть выбирает функцию печати DOS, а 6d
часть является свободным параметром. Оказывается, что6d
единственная возможность, которая может дать 0x13b после умножения.
Разборка кодовой части:
06BA:0100 686D09 PUSH 096D
06BA:0103 6A09 PUSH +09
06BA:0105 6A09 PUSH +09
06BA:0107 50 PUSH AX
06BA:0108 50 PUSH AX
06BA:0109 6A7A PUSH +7A
06BA:010B 6A7A PUSH +7A
06BA:010D 6A67 PUSH +67
06BA:010F 61 POPA
06BA:0110 41 INC CX
06BA:0111 41 INC CX
06BA:0112 41 INC CX
06BA:0113 094A53 OR [BP+SI+53],CX
06BA:0116 4A DEC DX
06BA:0117 4A DEC DX
06BA:0118 095255 OR [BP+SI+55],DX
06BA:011B 095371 OR [BP+DI+71],DX
06BA:011E 095265 OR [BP+SI+65],DX
06BA:0121 41 INC CX
06BA:0122 41 INC CX
06BA:0123 094A64 OR [BP+SI+64],CX
06BA:0126 4A DEC DX
06BA:0127 4A DEC DX
06BA:0128 4A DEC DX
06BA:0129 095266 OR [BP+SI+66],DX
06BA:012C 694A456C4B IMUL CX,[BP+SI+45],4B6C
06BA:0131 094A45 OR [BP+SI+45],CX
06BA:0134 6953204774 IMUL DX,[BP+DI+20],7447
06BA:0139 CD21 INT 21 (after the code patches itself)
Интересный факт: Обычно я бы использовал offset message
вместо жестко запрограммированного 13bh
, но в этом случае, поскольку во время синтаксического анализа его адрес неизвестен, tasm генерирует 16-битное немедленное смещение, тратя впустую 1 кодовый байт:
06BA:0131 098A4600 OR [BP+SI+0046],CX