Я пытался использовать это, но не сработало
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Я пытался использовать это, но не сработало
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
Ответы:
Использование [^A-Za-z0-9]
.
Примечание: убрал пробел, поскольку он обычно не считается буквенно-цифровым.
Пытаться
return value.replaceAll("[^A-Za-z0-9]", "");
или
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
Вы должны знать, что [^a-zA-Z]
заменит символы, не являющиеся самими собой в диапазоне символов AZ / az. Это означает, что специальные символы, такие как é
и ß
т. Д., Или символы кириллицы, и такие будут удалены.
Если замена этих символов нежелательна, используйте вместо этого заранее определенные классы символов:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS: \p{Alnum}
не достигает этого эффекта, он действует так же, как [A-Za-z0-9]
.
[^\\p{IsAlphabetic}\\p{IsDigit}]
работает хорошо.
{IsDigit}
не работает для меня и {Digit}
делает то, что я пробую это на Android. И Android UNICODE_CHARACTER_CLASS
включен по умолчанию. Спасибо за оформление.
Вы также можете попробовать это более простое регулярное выражение:
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
.
Я сделал этот метод для создания имен файлов:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
Когда каретка^
появляется в качестве первого символа в квадратных скобках, она отменяет шаблон. Этот шаблон соответствует любому символу, кроме a или b или c.
Глядя на ключевое слово как две функции:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
Более того, в отношении шаблона:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
Поэтому он заменит все символы, НЕ включенные в шаблон
Если вы хотите также разрешить алфавитно-цифровые символы, которые не относятся к набору символов ascii, как, например, немецкие умлауты, вы можете использовать следующее решение:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
Обратите внимание, что использование флага UNICODE_CHARACTER_CLASS может привести к снижению производительности (см. Javadoc этого флага)
Простой метод:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
вывод: ChlamydiasppIgGIgMIgAAbs8006
Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
Используя Guava, вы можете легко комбинировать различные типы критериев. Для вашего конкретного решения вы можете использовать:
value = CharMatcher.inRange('0', '9')
.or(CharMatcher.inRange('a', 'z')
.or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)
CharMatcher от Guava предлагает краткое решение:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);