У меня есть длинная шестнадцатеричная строка, представляющая ряд значений разных типов. Я хочу преобразовать эту шестнадцатеричную строку в байтовый массив, чтобы я мог сдвинуть каждое значение и преобразовать его в соответствующий тип данных.
У меня есть длинная шестнадцатеричная строка, представляющая ряд значений разных типов. Я хочу преобразовать эту шестнадцатеричную строку в байтовый массив, чтобы я мог сдвинуть каждое значение и преобразовать его в соответствующий тип данных.
Ответы:
Предположим, что ваша шестнадцатеричная строка похожа на
>>> hex_string = "deadbeef"
>>> hex_data = hex_string.decode("hex")
>>> hex_data
"\xde\xad\xbe\xef"
>>> bytes.fromhex(hex_string) # Python ≥ 3
b'\xde\xad\xbe\xef'
>>> bytearray.fromhex(hex_string)
bytearray(b'\xde\xad\xbe\xef')
Обратите внимание, что bytes
это неизменяемая версия bytearray
.
string
-> bytes
объект, то это `bytes.fromhex (" 000102030405060708090A0B0C0D0E0F ")`, который дает b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f'
. Не публикация в качестве ответа, так как вопрос запрашивает байтовый массив, но публикация здесь, поскольку это первый хит, который я получил при поиске шестнадцатеричных байтов.
hex_string.decode("hex")
работает на Python 2.7. Я только что проверил на своем Python 2.7.10 (default, May 23 2015, 09:44:00) [MSC v.1500 64 bit (AMD64)] on win32
.
bytes.fromhex
выдает ошибку, когда входная строка имеет нечетное количество символов: bytes.fromhex("aab")
→ ValueError: non-hexadecimal number found in fromhex() arg at position 3
.
В bytearray есть встроенная функция, которая делает то, что вы собираетесь.
bytearray.fromhex("de ad be ef 00")
Он возвращает байтовый массив и читает шестнадцатеричные строки с разделителем пробелов или без него.
hex_string.decode("hex")
нет.
при условии, что я правильно понял, вы должны искать binascii.unhexlify
import binascii
a='45222e'
s=binascii.unhexlify(a)
b=[ord(x) for x in s]
unhexlify
это самый эффективный способ, но я бы сказал, что b = bytearray(s)
это будет лучше, чем использовать ord
. Поскольку у Python есть встроенный тип только для массивов байтов, я удивлен, что никто не использует его
Предполагая, что у вас есть строка байтов, как это
"\ X12 \ x45 \ x00 \ XAB"
и вы знаете количество байтов и их тип, вы также можете использовать этот подход
import struct
bytes = '\x12\x45\x00\xAB'
val = struct.unpack('<BBH', bytes)
#val = (18, 69, 43776)
Как я указал в начале строки формата little endian (используя символ '<'), функция вернула десятичный эквивалент.
0x12 = 18
0x45 = 69
0xAB00 = 43776
B равен одному байту (8 бит) без знака
H равен двум байтам (16 бит) без знака
Более доступные символы и размеры байтов можно найти здесь
Преимущества ..
Вы можете указать более одного байта и порядковый номер значений
Недостатки ..
Вам действительно нужно знать тип и длину данных, с которыми вы имеете дело
Вы должны быть в состоянии построить строку, содержащую двоичные данные, используя что-то вроде:
data = "fef0babe"
bits = ""
for x in xrange(0, len(data), 2)
bits += chr(int(data[x:x+2], 16))
Это, вероятно, не самый быстрый способ (многие строки добавляются), но довольно простой, используя только основной Python.
Вы можете использовать модуль кодеков в стандартной библиотеке Python, т.е.
import codecs
codecs.decode(hexstring, 'hex_codec')
def hex2bin(s):
hex_table = ['0000', '0001', '0010', '0011',
'0100', '0101', '0110', '0111',
'1000', '1001', '1010', '1011',
'1100', '1101', '1110', '1111']
bits = ''
for i in range(len(s)):
bits += hex_table[int(s[i], base=16)]
return bits
Хороший лайнер это:
byte_list = map(ord, hex_string)
Это будет перебирать каждый символ в строке и запускать его через функцию ord (). Только проверено на Python 2.6, не слишком уверен насчет 3.0+.
-Josh
byte_list = bytearray(hex_string)