В Java у меня есть такая строка:
" content ".
Удалит ли String.trim()
все пробелы с этих сторон или только по одному пробелу с каждой?
В Java у меня есть такая строка:
" content ".
Удалит ли String.trim()
все пробелы с этих сторон или только по одному пробелу с каждой?
Ответы:
Все они .
Возвращает : копию этой строки с удаленными начальными и конечными пробелами или эту строку, если в ней нет начальных или конечных пробелов.
~ Цитируется из документации Java 1.5.0.
(Но почему вы просто не попробовали и не убедились?)
Chararacter.isWhitespace
правда, но это не то, что подразумевается под "пробелом" ..
trim
и isWhiteSpace
т. д. или обсуждения двусмысленностей в документации Java; это прямой ответ на конкретный вопрос, заданный выше, т. е. trim
удаляет ли метод одно или несколько пробелов?
Из исходного кода (декомпилированного):
public String trim()
{
int i = this.count;
int j = 0;
int k = this.offset;
char[] arrayOfChar = this.value;
while ((j < i) && (arrayOfChar[(k + j)] <= ' '))
++j;
while ((j < i) && (arrayOfChar[(k + i - 1)] <= ' '))
--i;
return (((j > 0) || (i < this.count)) ? substring(j, i) : this);
}
Два, while
которые вы видите, означают, что все символы, юникод которых находится ниже пробела, в начале и в конце, удаляются.
Если есть сомнения, напишите модульный тест:
@Test
public void trimRemoveAllBlanks(){
assertThat(" content ".trim(), is("content"));
}
NB : конечно, тест (для JUnit + Hamcrest) не терпит неудач
Однако следует отметить, что String.trim имеет своеобразное определение «пробелов». Он не удаляет пробелы Unicode, но также удаляет управляющие символы ASCII, которые вы не можете рассматривать как пробелы.
Этот метод может использоваться для обрезки пробелов в начале и в конце строки; фактически, он также обрезает все управляющие символы ASCII.
Если возможно, вы можете использовать функцию StringUtils.strip () Commons Lang, которая также обрабатывает пробелы Unicode (и также является нулевой).
См. API для класса String:
Возвращает копию строки без начальных и конечных пробелов.
Удаляются пробелы с обеих сторон:
Обратите внимание, что trim()
не меняет экземпляр String, он вернет новый объект:
String original = " content ";
String withoutWhitespace = original.trim();
// original still refers to " content "
// and withoutWhitespace refers to "content"
Основываясь на документах Java здесь ,.trim()
заменяет '\ u0020', который обычно известен как пробел.
Но обратите внимание, что '\ u00A0' ( Unicode NO-BREAK SPACE
) также рассматривается как пробел, и.trim()
НЕ удаляет его. Это особенно часто встречается в HTML.
Для его удаления использую:
tmpTrimStr = tmpTrimStr.replaceAll("\\u00A0", "");
Пример этой проблемы обсуждались здесь .
Пример trim()
удаления пробелов Java :
public class Test
{
public static void main(String[] args)
{
String str = "\n\t This is be trimmed.\n\n";
String newStr = str.trim(); //removes newlines, tabs and spaces.
System.out.println("old = " + str);
System.out.println("new = " + newStr);
}
}
ВЫВОД
old =
This is a String.
new = This is a String.
Из java docs (источник класса String),
/**
* Returns a copy of the string, with leading and trailing whitespace
* omitted.
* <p>
* If this <code>String</code> object represents an empty character
* sequence, or the first and last characters of character sequence
* represented by this <code>String</code> object both have codes
* greater than <code>'\u0020'</code> (the space character), then a
* reference to this <code>String</code> object is returned.
* <p>
* Otherwise, if there is no character with a code greater than
* <code>'\u0020'</code> in the string, then a new
* <code>String</code> object representing an empty string is created
* and returned.
* <p>
* Otherwise, let <i>k</i> be the index of the first character in the
* string whose code is greater than <code>'\u0020'</code>, and let
* <i>m</i> be the index of the last character in the string whose code
* is greater than <code>'\u0020'</code>. A new <code>String</code>
* object is created, representing the substring of this string that
* begins with the character at index <i>k</i> and ends with the
* character at index <i>m</i>-that is, the result of
* <code>this.substring(<i>k</i>, <i>m</i>+1)</code>.
* <p>
* This method may be used to trim whitespace (as defined above) from
* the beginning and end of a string.
*
* @return A copy of this string with leading and trailing white
* space removed, or this string if it has no leading or
* trailing white space.
*/
public String trim() {
int len = count;
int st = 0;
int off = offset; /* avoid getfield opcode */
char[] val = value; /* avoid getfield opcode */
while ((st < len) && (val[off + st] <= ' ')) {
st++;
}
while ((st < len) && (val[off + len - 1] <= ' ')) {
len--;
}
return ((st > 0) || (len < count)) ? substring(st, len) : this;
}
Обратите внимание, что после начала и длины он вызывает метод подстроки класса String.
trim()
удалит все начальные и конечные пробелы. Но имейте в виду: ваша строка не изменилась. trim()
вместо этого вернет новый экземпляр строки.
Если ваш строковый ввод:
String a = " abc ";
System.out.println(a);
Да, вывод будет «abc»; Но если ваш ввод String:
String b = " This is a test "
System.out.println(b);
Вывод будет This is a test
таким: «Обрезка» удаляет только пробелы перед первым символом и после последнего символа в строке и игнорирует внутренние пробелы. Это часть моего кода, которая немного оптимизирует встроенный String
метод обрезки, удаляя внутренние пробелы и удаляя пробелы до и после вашего первого и последнего символа в строке. Надеюсь, поможет.
public static String trim(char [] input){
char [] output = new char [input.length];
int j=0;
int jj=0;
if(input[0] == ' ' ) {
while(input[jj] == ' ')
jj++;
}
for(int i=jj; i<input.length; i++){
if(input[i] !=' ' || ( i==(input.length-1) && input[input.length-1] == ' ')){
output[j]=input[i];
j++;
}
else if (input[i+1]!=' '){
output[j]=' ';
j++;
}
}
char [] m = new char [j];
int a=0;
for(int i=0; i<m.length; i++){
m[i]=output[a];
a++;
}
return new String (m);
}
.trim()
в System.out.println(a);
?
Одна очень важная вещь заключается в том, что строка, состоящая полностью из «пробелов», вернет пустую строку.
если string sSomething = "xxxxx"
, где x
стоит белых пространств, sSomething.trim()
возвращает пустую строку.
если a string sSomething = "xxAxx"
, где x
означает пробелы, sSomething.trim()
вернется A
.
если sSomething ="xxSomethingxxxxAndSomethingxElsexxx"
, sSomething.trim()
вернется SomethingxxxxAndSomethingxElse
, обратите внимание, что количество x
промежутков между словами не изменилось.
Если вы хотите, чтобы аккуратная упакованная строка сочеталась trim()
с регулярным выражением, как показано в этом сообщении: Как удалить повторяющиеся пробелы в строке с помощью Java? ,
Порядок не имеет значения для результата, но trim()
сначала будет более эффективным. Надеюсь, поможет.
Чтобы сохранить только один экземпляр для String, вы можете использовать следующее.
str = " Hello ";
или
str = str.trim();
Тогда значение str
String будетstr = "Hello"
В Javadoc for String есть все подробности. Удаляет пробелы (пробелы, табуляции и т. Д.) С обоих концов и возвращает новую строку.
Если вы хотите проверить, что будет делать какой-то метод, вы можете использовать BeanShell . Это язык сценариев, максимально приближенный к Java. Вообще говоря, интерпретируется Java с некоторыми смягчениями. Другой вариант такого рода - язык Groovy . Оба этих языка сценариев предоставляют удобный цикл чтения-оценки-печати, знакомый с интерпретируемых языков. Итак, вы можете запустить консоль и просто ввести:
" content ".trim();
Вы увидите "content"
результат после нажатия Enter
(или Ctrl+R
в консоли Groovy).
String formattedStr=unformattedStr;
formattedStr=formattedStr.trim().replaceAll("\\s+", " ");
trim()
уже делает то, repkaceAll()
что делал бы, если бы ему было что делать.