( Обновление : август 2011 г. )
Как упоминает Джеффлан в своем ответе , Java 7 теперь поддерживает именованные группы .
В комментарии Трист указывает, что поддержка ограничена.
Он подробно описывает ограничения в своем великолепном ответе « Java Regex Helper »
Поддержка именованных групп Java 7 regex была представлена еще в сентябре 2010 года в блоге Oracle .
В официальном выпуске Java 7 конструкции для поддержки именованной группы захвата:
(?<name>capturing text)
определить именованную группу "имя"
\k<name>
обратная ссылка на именованную группу "имя"
${name}
ссылаться на захваченную группу в строке замены Matcher
Matcher.group(String name)
вернуть захваченную входную подпоследовательность заданной «именованной группой».
Другие альтернативы для pre-Java 7 были:
( Оригинальный ответ : январь 2009 г. , следующие две ссылки теперь не работают)
Вы не можете ссылаться на именованную группу, если вы не написали свою собственную версию Regex ...
Именно это и сделал Gorbush2 в этой теме .
Regex2
(Ограниченная реализация, как снова указал tchrist , поскольку он ищет только идентификаторы ASCII. tchrist детализирует ограничение как:
только иметь возможность иметь одну именованную группу для одного и того же имени (которое вы не всегда можете контролировать!) и не иметь возможности использовать их для рекурсии в регулярном выражении.
Примечание: Вы можете найти истинные примеры рекурсии в регулярных выражениях Perl и PCRE, как упомянуто в Regexp Power , спецификациях PCRE и Сопоставлении строк со сбалансированными скобками ( слайд)
Пример:
Строка:
"TEST 123"
RegExp:
"(?<login>\\w+) (?<id>\\d+)"
доступ
matcher.group(1) ==> TEST
matcher.group("login") ==> TEST
matcher.name(1) ==> login
замещать
matcher.replaceAll("aaaaa_$1_sssss_$2____") ==> aaaaa_TEST_sssss_123____
matcher.replaceAll("aaaaa_${login}_sssss_${id}____") ==> aaaaa_TEST_sssss_123____
(выписка из реализации)
public final class Pattern
implements java.io.Serializable
{
[...]
/**
* Parses a group and returns the head node of a set of nodes that process
* the group. Sometimes a double return system is used where the tail is
* returned in root.
*/
private Node group0() {
boolean capturingGroup = false;
Node head = null;
Node tail = null;
int save = flags;
root = null;
int ch = next();
if (ch == '?') {
ch = skip();
switch (ch) {
case '<': // (?<xxx) look behind or group name
ch = read();
int start = cursor;
[...]
// test forGroupName
int startChar = ch;
while(ASCII.isWord(ch) && ch != '>') ch=read();
if(ch == '>'){
// valid group name
int len = cursor-start;
int[] newtemp = new int[2*(len) + 2];
//System.arraycopy(temp, start, newtemp, 0, len);
StringBuilder name = new StringBuilder();
for(int i = start; i< cursor; i++){
name.append((char)temp[i-1]);
}
// create Named group
head = createGroup(false);
((GroupTail)root).name = name.toString();
capturingGroup = true;
tail = root;
head.next = expr(tail);
break;
}