Я экспериментировал с различными фрагментами кода Java, пытаясь придумать что-то, что будет кодировать строку, содержащую кавычки, пробелы и «экзотические» символы Unicode, и производить вывод, идентичный функции JavaScript encodeURIComponent .
Моя тестовая строка на пытки: "А" Б ± "
Если я введу следующий оператор JavaScript в Firebug:
encodeURIComponent('"A" B ± "');
—Тогда я получаю:
"%22A%22%20B%20%C2%B1%20%22"
Вот моя небольшая тестовая программа на Java:
import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
public class EncodingTest
{
public static void main(String[] args) throws UnsupportedEncodingException
{
String s = "\"A\" B ± \"";
System.out.println("URLEncoder.encode returns "
+ URLEncoder.encode(s, "UTF-8"));
System.out.println("getBytes returns "
+ new String(s.getBytes("UTF-8"), "ISO-8859-1"));
}
}
—Эта программа выводит:
URLEncoder.encode возвращает% 22A% 22 + B +% C2% B1 +% 22 getBytes возвращает "A" B ± "
Близко, но не сигара! Как лучше всего кодировать строку UTF-8 с использованием Java, чтобы она давала тот же результат, что и JavaScript encodeURIComponent
?
РЕДАКТИРОВАТЬ: я использую Java 1.4, скоро перейдя на Java 5.