Почему функция PHP json_encode преобразует строки UTF-8 в шестнадцатеричные объекты?


148

У меня есть PHP-скрипт, который работает с различными языками. К сожалению, всякий раз, когда я пытаюсь использовать json_encode, любой вывод Unicode преобразуется в шестнадцатеричные объекты. Это ожидаемое поведение? Есть ли способ преобразовать вывод в символы UTF-8?

Вот пример того, что я вижу:

ВХОД

echo $text;

ВЫВОД

База данни грешка.

ВХОД

json_encode($text);

ВЫВОД

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

Ответы:


355

Начиная с PHP / 5.4.0, существует опция с именем "JSON_UNESCAPED_UNICODE". Проверьте это:

http://se2.php.net/json_encode

Поэтому вы должны попробовать:

json_encode( $text, JSON_UNESCAPED_UNICODE );

3
Ага. Спасибо! Я должен был прочитать документацию более внимательно. Спасибо.
Дэвид Джонс

3
JSON_UNESCAPED_UNICODE была введена в PHP 5.4.0 и недоступна в более ранних версиях. При использовании его в более ранних версиях вы получите эту ошибку: «Предупреждение: json_encode () ожидает, что параметр 2 будет длинным, строка задана в ...». См. Ответ CertaiN ниже для решения 5.3.
Октавиан Найку

Это также работает с датскими буквами Æ, æ, Ø, ø, Å, å Спасибо!
ymerdrengene

Фантастически, это был ответ, который я искал!
рандомизатор

2
Вы только что спасли мою жизнь. СПАСИБО.
Джон Зангиту

57

JSON_UNESCAPED_UNICODE доступен в PHP версии 5.4 или новее.
Следующий код для версии 5.3.

ОБНОВЛЕНО

  • html_entity_decodeнемного эффективнее, чем pack+ mb_convert_encoding.
  • (*SKIP)(*FAIL)пропускает обратную косую черту и указанные символы с помощью JSON_HEX_*флагов.

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

1
Не должно ли \ u быть \ U, то есть заглавными буквами?
Малхал

4
Хорошее решение для PHP <5.4;)
qdev

Я искал это решение для Версии 5.3 в течение 3 дней, так как мой хост не обновился до 5.4. Для меня вы спасатель жизни, и, будучи настолько полным, я бы предпочел отметить это как принятый ответ!
Laci

Исправлена ​​ошибка, когда строка содержит \\ . Более новая версия захватывает \\ с более высоким приоритетом, чем \u.
mpyw

Это должно быть добавлено в библиотеку php. Хорошая работа.
Бераки

7

Вам нравится устанавливать кодировку и unesceded Unicode

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);

4

Одним из решений является сначала кодировать данные, а затем декодировать их в том же файле:

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );

1

Вот мое комбинированное решение для различных версий PHP.

В моей компании мы работаем с разными серверами с разными версиями PHP, поэтому мне пришлось искать решение, подходящее для всех.

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

Кредиты должны идти к Марко Гаси и Абу . Решение для PHP> = 5.4 представлено в документации по json_encode.


0

Функция raw_json_encode () выше не решить мне проблему (по какой - то причине, функция обратного вызова подняла ошибку на моем сервере PHP 5.2.5).

Но это другое решение действительно сработало.

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

Кредиты должны идти к Марко Гаси . Я просто вызываю его функцию вместо вызова json_encode ():

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}


-2

Так как вы спросили:

Есть ли способ преобразовать вывод в символы UTF-8?

Другое решение - использовать utf8_encode .

Это закодирует вашу строку в UTF-8.

например

foreach ($rows as $key => $row) {
  $rows[$key]["keyword"] = utf8_encode($row["keyword"]);
}

echo json_encode($rows);

2
Не используйте это. Как указано на странице документации PHP, utf8_encode подходит только в том случае, если ваша исходная строка имеет кодировку ISO-8859-1 (Latin1). Это не универсальная функция «убедитесь, что эта строка закодирована в utf-8».
теломера

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.