Конвертировать UTF-8 в кодировке NSData в NSString


567

У меня есть UTF-8, закодированный NSDataс сервера Windows, и я хочу преобразовать его NSStringдля iPhone. Поскольку данные содержат символы (например, символы степени), которые имеют разные значения на обеих платформах, как преобразовать данные в строку?


16
UTF-8 - это UTF-8 везде. Как только это UTF-8, для разных платформ нет разных значений. В этом весь смысл.
gnasher729

Ответы:


1155

Если данные не заканчиваются нулем, вы должны использовать -initWithData:encoding:

NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];

Если данные заканчиваются нулем, вы должны вместо этого использовать, -stringWithUTF8String:чтобы избежать лишних \0в конце.

NSString* newStr = [NSString stringWithUTF8String:[theData bytes]];

(Обратите внимание, что если вход неправильно закодирован в UTF-8, вы получите nil.)


Свифт вариант:

let newStr = String(data: data, encoding: .utf8)
// note that `newStr` is a `String?`, not a `String`.

Если данные заканчиваются нулем, вы можете пойти безопасным путем - удалить этот нулевой символ или небезопасным способом, аналогичным версии Objective C выше.

// safe way, provided data is \0-terminated
let newStr1 = String(data: data.subdata(in: 0 ..< data.count - 1), encoding: .utf8)
// unsafe way, provided data is \0-terminated
let newStr2 = data.withUnsafeBytes(String.init(utf8String:))

5
осторожно!! если используется stringWithUTF8String, не передавайте ему аргумент NULL, иначе он выдаст исключение
JasonZ

31
ОБРАТИТЕ ВНИМАНИЕ: при использовании «stringWithUTF8String:» для строки, которая не заканчивается нулем, результат непредсказуем!
Берик,

2
Оба решения вернули мне ноль.
Гусин

1
Как вы узнаете, заканчивается ли ваш NSData нулем или нет? См. Ответ Тома Харрингтона по адресу: stackoverflow.com/questions/27935054/… . По моему опыту, никогда не следует предполагать, что NSData либо завершен нулем, либо нет: он может отличаться от одной передачи к другой, даже от известного сервера.
Элиз ван Лоидж,

1
@ElisevanLooij Спасибо за ссылку. Я бы сказал, что если передаваемые данные могут быть случайно завершены нулем или нет, то протокол не определен.
Kennytm

28

Вы можете вызвать этот метод

+(id)stringWithUTF8String:(const char *)bytes.

27
Только если данные заканчиваются нулем. Которого может и не быть (а на самом деле, вероятно, нет).
Иван Вучица

я не знаю, почему на земле это сломалось бы на ненулевых концах строк, видя, как оно NSDataзнает, сколько у него байтов ...
Claudiu

5
@Claudiu, вы не передаете объект NSData, вы передаете ему (const char *), полученный с помощью [data bytes], который является просто указателем, без информации о размере. Следовательно, блок данных, на который он указывает, должен быть нулевым. Ознакомьтесь с документацией, так прямо сказано.
jbat100

1
@ jbat100: конечно. Мне было не ясно. Я имел в виду, учитывая, что можно перейти от ненулевого завершения NSDataк NSString(см. Ответ KennyTM), я удивлен, что нет, +(id)stringWithUTF8Data:(NSData *)dataкоторый просто работает.
Клавдиу

stringWithUTF8Data, поэтому большинство из нас создает категорию NSString + Foo и создает метод.
Уильям Чернюк

19

Я смиренно отправляю категорию, чтобы сделать это менее раздражающим:

@interface NSData (EasyUTF8)

// Safely decode the bytes into a UTF8 string
- (NSString *)asUTF8String;

@end

а также

@implementation NSData (EasyUTF8)

- (NSString *)asUTF8String {
    return [[NSString alloc] initWithData:self encoding:NSUTF8StringEncoding];    
}

@end

(Обратите внимание, что если вы не используете ARC, вам понадобится autorelease там.)

Теперь вместо ужасающе многословного:

NSData *data = ...
[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];

Ты можешь сделать:

NSData *data = ...
[data asUTF8String];

18

Версия Swift от String до Data и обратно до String:

Xcode 10.1 • Swift 4.2.1

extension Data {
    var string: String? {
        return String(data: self, encoding: .utf8)
    }
}

extension StringProtocol {
    var data: Data {
        return Data(utf8)
    }
}

extension String {
    var base64Decoded: Data? {
        return Data(base64Encoded: self)
    }
}

Игровая площадка

let string = "Hello World"                                  // "Hello World"
let stringData = string.data                                // 11 bytes
let base64EncodedString = stringData.base64EncodedString()  // "SGVsbG8gV29ybGQ="
let stringFromData = stringData.string                      // "Hello World"

let base64String = "SGVsbG8gV29ybGQ="
if let data = base64String.base64Decoded {
    print(data)                                    //  11 bytes
    print(data.base64EncodedString())              // "SGVsbG8gV29ybGQ="
    print(data.string ?? "nil")                    // "Hello World"
}

let stringWithAccent = "Olá Mundo"                          // "Olá Mundo"
print(stringWithAccent.count)                               // "9"
let stringWithAccentData = stringWithAccent.data            // "10 bytes" note: an extra byte for the acute accent
let stringWithAccentFromData = stringWithAccentData.string  // "Olá Mundo\n"

16

Иногда методы в других ответах не работают. В моем случае я генерирую подпись с моим закрытым ключом RSA, и в результате получается NSData. Я обнаружил, что это похоже на работу:

Objective-C

NSData *signature;
NSString *signatureString = [signature base64EncodedStringWithOptions:0];

стриж

let signatureString = signature.base64EncodedStringWithOptions(nil)

как получить эту строку в nsdata?
Даршан Кунджадия

1
@DarshanKunjadiya: Objective-C : [[NSData alloc] initWithBase64EncodedString:signatureString options:0]; Свифт : NSData(base64EncodedString: str options: nil)
Mikeho

1

Чтобы подвести итог, вот полный ответ, который работал для меня.

Моя проблема была в том, что когда я использовал

[NSString stringWithUTF8String:(char *)data.bytes];

Строка, которую я получил, была непредсказуемой: около 70% она содержала ожидаемое значение, но слишком часто это приводило к чему-то Nullили даже хуже: искаженное в конце строки.

После некоторых копаний я переключился на

[[NSString alloc] initWithBytes:(char *)data.bytes length:data.length encoding:NSUTF8StringEncoding];

И каждый раз получал ожидаемый результат.


Важно, чтобы вы понимали, <i> почему </ i> вы получили результаты «мусора».
Эдгар Арутюнян

1

С Swift 5, вы можете использовать String«s init(data:encoding:)инициализатор для того , чтобы преобразовать Dataэкземпляр в Stringслучае с использованием UTF-8. init(data:encoding:)имеет следующую декларацию:

init?(data: Data, encoding: String.Encoding)

Возвращает Stringинициализированный путем преобразования данных в символы Юникода с использованием заданной кодировки.

Следующий код Playground показывает, как его использовать:

import Foundation

let json = """
{
"firstName" : "John",
"lastName" : "Doe"
}
"""

let data = json.data(using: String.Encoding.utf8)!

let optionalString = String(data: data, encoding: String.Encoding.utf8)
print(String(describing: optionalString))

/*
 prints:
 Optional("{\n\"firstName\" : \"John\",\n\"lastName\" : \"Doe\"\n}")
*/
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.