Замените только некоторые группы на регулярные выражения


191

Предположим, у меня есть следующее регулярное выражение:

-(\d+)-

и я хочу заменить, используя C #, группу 1 (\d+)на AA, чтобы получить:

-AA-

Теперь я заменяю его, используя:

var text = "example-123-example";
var pattern = @"-(\d+)-";
var replaced = Regex.Replace(text, pattern, "-AA-"); 

Но мне это не очень нравится, потому что если я _(\d+)_вместо этого изменю шаблон , мне придется изменить строку замены _AA_тоже, и это противоречит принципу СУХОЙ.

Я ищу что-то вроде:

Сохраняйте сопоставленный текст в точности таким, какой он есть, но измените Группу 1 на this textи Группу 2 на another text...

Редактировать:
это был просто пример. Я просто ищу общий способ сделать то, что я сказал выше.

Это должно работать для:

anything(\d+)more_text и любой шаблон, который вы можете себе представить.

Все, что я хочу сделать, это заменить только группы и сохранить остаток матча.

Ответы:


307

Хорошей идеей может быть инкапсуляция всего внутри групп, независимо от того, нужно ли их идентифицировать или нет. Таким образом, вы можете использовать их в строке замены. Например:

var pattern = @"(-)(\d+)(-)";
var replaced = Regex.Replace(text, pattern, "$1AA$3"); 

или используя MatchEvaluator:

var replaced = Regex.Replace(text, pattern, m => m.Groups[1].Value + "AA" + m.Groups[3].Value);

Другим способом, немного грязным, может быть использование lookbehind / lookahead:

(?<=-)(\d+)(?=-)


17
Я отредактировал ваш ответ, чтобы предоставить больше информации, но то, что вы сказали, совершенно правильно. Не знаю, как мне не хватало того, что я могу поместить все в группы, независимо от того, буду их использовать или нет :) . На мой взгляд, это решение намного лучше и чище, чем использование lookahead и lookbehinds.
Оскар Медерос

маленькая опечатка, ваш шаблон замены должен быть $ 1AA $ 3
Myster

1
Для того, чтобы это работало, я должен был добавить .Valueи m.Groups[1]т. Д.
jbeldock

11
Также стоит отметить - если ваш текст замены начинается с цифры, первое решение («$ 1AA $ 3») не будет работать как задумано!
Берти

2
@OscarMederos вы также можете использовать группы без захвата - хорошо для групп, которые вы не используете. В (?:foo)(bar), $1заменит bar. подробнее
Патрик


19

Я также нуждался в этом, и я создал следующий метод расширения для этого:

public static class RegexExtensions
{
    public static string ReplaceGroup(
        this Regex regex, string input, string groupName, string replacement)
    {
        return regex.Replace(
            input,
            m =>
            {
                var group = m.Groups[groupName];
                var sb = new StringBuilder();
                var previousCaptureEnd = 0;
                foreach (var capture in group.Captures.Cast<Capture>())
                {
                    var currentCaptureEnd =
                        capture.Index + capture.Length - m.Index;
                    var currentCaptureLength =
                        capture.Index - m.Index - previousCaptureEnd;
                    sb.Append(
                        m.Value.Substring(
                            previousCaptureEnd, currentCaptureLength));
                    sb.Append(replacement);
                    previousCaptureEnd = currentCaptureEnd;
                }
                sb.Append(m.Value.Substring(previousCaptureEnd));

                return sb.ToString();
            });
    }
}

Использование:

var input = @"[assembly: AssemblyFileVersion(""2.0.3.0"")][assembly: AssemblyFileVersion(""2.0.3.0"")]";
var regex = new Regex(@"AssemblyFileVersion\(""(?<version>(\d+\.?){4})""\)");


var result = regex.ReplaceGroup(input , "version", "1.2.3");

Результат:

[assembly: AssemblyFileVersion("1.2.3")][assembly: AssemblyFileVersion("1.2.3")]

Мне нравится эта реализация, но она не заменяет несколько совпадений. Я выложил версию, которая делает
Владимир

13

Если вы не хотите изменять свой шаблон, вы можете использовать свойства Group Index и Length соответствующей группы.

var text = "example-123-example";
var pattern = @"-(\d+)-";
var regex = new RegEx(pattern);
var match = regex.Match(text);

var firstPart = text.Substring(0,match.Groups[1].Index);    
var secondPart = text.Substring(match.Groups[1].Index + match.Groups[1].Length);
var fullReplace = firstPart + "AA" + secondPart;

Обратите внимание, что это предполагает и будет работать только в первый раз матча.
Бартош

5

Вот еще один хороший чистый вариант, который не требует изменения вашего шаблона.

        var text = "example-123-example";
        var pattern = @"-(\d+)-";

        var replaced = Regex.Replace(text, pattern, (_match) =>
        {
            Group group = _match.Groups[1];
            string replace = "AA";
            return String.Format("{0}{1}{2}", _match.Value.Substring(0, group.Index - _match.Index), replace, _match.Value.Substring(group.Index - _match.Index + group.Length));
        });

0

пройдите приведенную ниже кодировку, чтобы получить замену отдельной группы.

new_bib = Regex.Replace(new_bib, @"(?s)(\\bibitem\[[^\]]+\]\{" + pat4 + @"\})[\s\n\v]*([\\\{\}a-zA-Z\.\s\,\;\\\#\\\$\\\%\\\&\*\@\\\!\\\^+\-\\\=\\\~\\\:\\\" + dblqt + @"\\\;\\\`\\\']{20,70})", delegate(Match mts)
                    {
                           var fg = mts.Groups[0].Value.ToString(); 
                           var fs = mts.Groups[1].Value.ToString();
                           var fss = mts.Groups[2].Value.ToString();
                               fss = Regex.Replace(fss, @"[\\\{\}\\\#\\\$\\\%\\\&\*\@\\\!\\\^+\-\\\=\\\~\\\:\\\" + dblqt + @"\\\;\\\`\\\']+", "");
                           return "<augroup>" + fss + "</augroup>" + fs;
                    }, RegexOptions.IgnoreCase);

0

Вот версия, похожая на версию Дэниела, но заменяющая несколько совпадений:

public static string ReplaceGroup(string input, string pattern, RegexOptions options, string groupName, string replacement)
{
    Match match;
    while ((match = Regex.Match(input, pattern, options)).Success)
    {
        var group = match.Groups[groupName];

        var sb = new StringBuilder();

        // Anything before the match
        if (match.Index > 0)
            sb.Append(input.Substring(0, match.Index));

        // The match itself
        var startIndex = group.Index - match.Index;
        var length = group.Length;
        var original = match.Value;
        var prior = original.Substring(0, startIndex);
        var trailing = original.Substring(startIndex + length);
        sb.Append(prior);
        sb.Append(replacement);
        sb.Append(trailing);

        // Anything after the match
        if (match.Index + match.Length < input.Length)
            sb.Append(input.Substring(match.Index + match.Length));

        input = sb.ToString();
    }

    return input;
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.