Я знаю, что с Boto 2 можно открыть объект S3 в виде строки с: get_contents_as_string()
Есть ли эквивалентная функция в boto3?
Я знаю, что с Boto 2 можно открыть объект S3 в виде строки с: get_contents_as_string()
Есть ли эквивалентная функция в boto3?
Ответы:
read
вернет байты. По крайней мере, для Python 3, если вы хотите вернуть строку, вы должны декодировать, используя правильную кодировку:
import boto3
s3 = boto3.resource('s3')
obj = s3.Object(bucket, key)
obj.get()['Body'].read().decode('utf-8')
У меня была проблема с чтением / анализом объекта из S3 из-за .get()
использования Python 2.7 внутри AWS Lambda.
Я добавил json в пример, чтобы показать, что он стал доступным для анализа :)
import boto3
import json
s3 = boto3.client('s3')
obj = s3.get_object(Bucket=bucket, Key=key)
j = json.loads(obj['Body'].read())
ПРИМЕЧАНИЕ (для python 2.7): все мои объекты ascii, поэтому мне не нужно .decode('utf-8')
ПРИМЕЧАНИЕ (для python 3.6+): мы перешли на python 3.6 и обнаружили, что read()
теперь он возвращается, bytes
поэтому, если вы хотите извлечь из него строку, вы должны использовать:
j = json.loads(obj['Body'].read().decode('utf-8'))
Этого нет в документации по boto3. Это сработало для меня:
object.get()["Body"].read()
объект, являющийся объектом s3: http://boto3.readthedocs.org/en/latest/reference/services/s3.html#object
get expected at least 1 arguments, got 0
. Удалите get()
и получите доступ к свойству объекта «Тело» напрямую
Python3 + Использование подхода boto3 API.
Используя API S3.Client.download_fileobj и файлоподобный объект Python , содержимое объекта S3 можно извлечь в память.
Поскольку извлекаемое содержимое является байтами, для преобразования в str его необходимо декодировать.
import io
import boto3
client = boto3.client('s3')
bytes_buffer = io.BytesIO()
client.download_fileobj(Bucket=bucket_name, Key=object_key, Fileobj=bytes_buffer)
byte_value = bytes_buffer.getvalue()
str_value = byte_value.decode() #python3, default decoding is utf-8
Если тело содержит io.StringIO, вы должны сделать, как показано ниже:
object.get()['Body'].getvalue()
import botocore
как-тоobj.get()['Body']
типа<class 'botocore.response.StreamingBody'>