Как найти n-е вхождение символа в строке?


95

Подобно опубликованному вопросу здесь , я ищу решение на Java.

То есть, как найти индекс n-го вхождения символа / строки из строки?

Пример: « / folder1 / folder2 / folder3 / ». В этом случае, если я прошу 3-е появление косой черты (/), она появится перед папкой 3, и я ожидаю вернуть эту позицию индекса. Мое фактическое намерение состоит в том, чтобы подставить его из n-го вхождения символа.

Есть ли какой-либо удобный / готовый к использованию метод, доступный в Java API, или нам нужно написать небольшую логику самостоятельно, чтобы решить эту проблему?

Также,

  1. Я быстро поискал, поддерживается ли какой-либо метод для этой цели в StringUtils Apache Commons Lang , но не нашел.
  2. Могут ли в этом помочь регулярные выражения?

2
В вашем конкретном примере, в зависимости от того, что вы хотите сделать с результатом, может быть проще разделить строку на /, что вполне может дать вам то, что вам нужно напрямую?
Архетип Павел

@ Пол: Это тоже хорошая идея.
Gnanam

Ответы:


128

Если ваш проект уже зависит от Apache Commons, вы можете использовать его StringUtils.ordinalIndexOf, в противном случае вот реализация:

public static int ordinalIndexOf(String str, String substr, int n) {
    int pos = str.indexOf(substr);
    while (--n > 0 && pos != -1)
        pos = str.indexOf(substr, pos + 1);
    return pos;
}

Это сообщение было переписано как статья здесь .


Помимо ошибки «по одному», в решении @Jon Skeet есть еще один большой плюс - с небольшой настройкой (обращением цикла) вы также можете получить «n-е вхождение из последнего».
Каран Чадха,

@KaranChadha, то же самое относится и к этому решению. Просто смени на lastIndexOf.
aioobe


27

Возможны два простых варианта:

  • Используйте charAt()повторно
  • Используйте indexOf()повторно

Например:

public static int nthIndexOf(String text, char needle, int n)
{
    for (int i = 0; i < text.length(); i++)
    {
        if (text.charAt(i) == needle)
        {
            n--;
            if (n == 0)
            {
                return i;
            }
        }
    }
    return -1;
}

Это может не работать так хорошо, как indexOfмногократное использование , но, возможно, проще сделать правильно.


15

Вы можете попробовать что-то вроде этого:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Main {
    public static void main(String[] args) {
      System.out.println(from3rd("/folder1/folder2/folder3/"));
    }

    private static Pattern p = Pattern.compile("(/[^/]*){2}/([^/]*)");

    public static String from3rd(String in) {
        Matcher m = p.matcher(in);

        if (m.matches())
            return m.group(2);
        else
            return null;
    }
}

Обратите внимание, что я сделал некоторые предположения в регулярном выражении:

  • входной путь является абсолютным (т.е. начинается с "/");
  • вам не нужен третий "/" в результате.

В соответствии с просьбой в комментарии, я попытаюсь объяснить регулярное выражение: (/[^/]*){2}/([^/]*)

Визуализация регулярных выражений

  • /[^/]*за /которым следует [^/]*(любое количество символов, кроме a /),
  • (/[^/]*)группирует предыдущее выражение в единый объект. Это 1первая группа выражения,
  • (/[^/]*){2}означает, что группа должна точно совпадать по {2}времени,
  • [^/]*снова любое количество символов, которые не являются /,
  • ([^/]*)группирует предыдущее выражение в единый объект. Это 2ая группа выражения.

Таким образом, вам нужно только получить подстроку, соответствующую 2-й группе: return m.group(2);

Изображение предоставлено Debuggex


1
не могли бы вы объяснить регулярное выражение на простом английском? Например: обратная косая черта, за которой следует все, что не является обратной косой чертой, неопределенное количество раз ... Тогда я не уверен.
Ced

1
@Ced, я добавил объяснение и небольшое исправление для регулярного выражения. Надеюсь, теперь стало понятнее.
andcoz

Спасибо за объяснение регулярного выражения.
Вишва Ратна

8

Я внес несколько изменений в ответ aioobe, получил n-ю версию lastIndexOf и исправил некоторые проблемы с NPE. Смотрите код ниже:

public int nthLastIndexOf(String str, char c, int n) {
        if (str == null || n < 1)
            return -1;
        int pos = str.length();
        while (n-- > 0 && pos != -1)
            pos = str.lastIndexOf(c, pos - 1);
        return pos;
}

3
Я считаю разумным, что метод генерирует NPE, если указан в nullкачестве аргумента. Это наиболее распространенное поведение в стандартной библиотеке.
aioobe

5
 ([.^/]*/){2}[^/]*(/)

Сопоставьте все, за чем следует / два раза, а затем еще раз. Третий - тот, который тебе нужен

Состояние Matcher можно использовать, чтобы определить, где находится последний /


Я уверен, что это очень крутой ответ, но как мне использовать его в своем коде?
ARK

Посмотрите на ответ @andcoz (другое регулярное выражение, но идея та же)
Архетип Павел

3
public static int nth(String source, String pattern, int n) {

   int i = 0, pos = 0, tpos = 0;

   while (i < n) {

      pos = source.indexOf(pattern);
      if (pos > -1) {
         source = source.substring(pos+1);
         tpos += pos+1;
         i++;
      } else {
         return -1;
      }
   }

   return tpos - 1;
}

3

В настоящее время ЕСТЬ поддержка StringUtils Apache Commons Lang ,

Это примитив:

int org.apache.commons.lang.StringUtils.ordinalIndexOf(CharSequence str, CharSequence searchStr, int ordinal)

для вашей проблемы вы можете закодировать следующее: StringUtils.ordinalIndexOf(uri, "/", 3)

Вы также можете найти последнее n-е вхождение символа в строке с помощью метода lastOrdinalIndexOf .


3

Возможно, вы могли бы добиться этого и с помощью метода String.split (..).

String str = "";
String[] tokens = str.split("/")
return tokens[nthIndex] == null 

2

Другой подход:

public static void main(String[] args) {
    String str = "/folder1/folder2/folder3/"; 
    int index = nthOccurrence(str, '/', 3);
    System.out.println(index);
}

public static int nthOccurrence(String s, char c, int occurrence) {
    return nthOccurrence(s, 0, c, 0, occurrence);
}

public static int nthOccurrence(String s, int from, char c, int curr, int expected) {
    final int index = s.indexOf(c, from);
    if(index == -1) return -1;
    return (curr + 1 == expected) ? index : 
        nthOccurrence(s, index + 1, c, curr + 1, expected);
}

2

Этот ответ улучшает ответ @aioobe. В этом ответе исправлены две ошибки.
1. n = 0 должен вернуть -1.
2. n-е вхождение вернуло -1, но оно работало в n-1-м вхождениях.

Попробуй это !

    public int nthOccurrence(String str, char c, int n) {
    if(n <= 0){
        return -1;
    }
    int pos = str.indexOf(c, 0);
    while (n-- > 1 && pos != -1)
        pos = str.indexOf(c, pos+1);
    return pos;
}

1
public class Sam_Stringnth {

    public static void main(String[] args) {
        String str="abcabcabc";
        int n = nthsearch(str, 'c', 3);
        if(n<=0)
            System.out.println("Character not found");
        else
            System.out.println("Position is:"+n);
    }
    public static int nthsearch(String str, char ch, int n){
        int pos=0;
        if(n!=0){
            for(int i=1; i<=n;i++){
                pos = str.indexOf(ch, pos)+1;
            }
            return pos;
        }
        else{
            return 0;
        }
    }
}

0
/* program to find nth occurence of a character */

import java.util.Scanner;

public class CharOccur1
{

    public static void main(String arg[])
    {
        Scanner scr=new Scanner(System.in);
        int position=-1,count=0;
        System.out.println("enter the string");
        String str=scr.nextLine();
        System.out.println("enter the nth occurence of the character");
        int n=Integer.parseInt(scr.next());
        int leng=str.length();
        char c[]=new char[leng];
        System.out.println("Enter the character to find");
        char key=scr.next().charAt(0);
        c=str.toCharArray();
        for(int i=0;i<c.length;i++)
        {
            if(c[i]==key)
            {
                count++;
                position=i;
                if(count==n)
                {
                    System.out.println("Character found");
                    System.out.println("the position at which the " + count + " ocurrence occurs is " + position);
                    return;
                }
            }
        }
        if(n>count)
        { 
            System.out.println("Character occurs  "+ count + " times");
            return;
        }
    }
}

0

Мое решение:

/**
 * Like String.indexOf, but find the n:th occurance of c
 * @param s string to search
 * @param c character to search for
 * @param n n:th character to seach for, starting with 1
 * @return the position (0-based) of the found char, or -1 if failed
 */

public static int nthIndexOf(String s, char c, int n) {
    int i = -1;
    while (n-- > 0) {
        i = s.indexOf(c, i + 1);
        if (i == -1)
            break;
    }
    return i;
}

0

Код возвращает подстроку n-го вхождения позиций, также известную как ширина поля. Пример. Если строка «Stack overflow in low melow» - это строка для поиска 2-го появления токена «low», вы согласитесь со мной, что это 2-е появление находится в подстроке «18 и 21» . indexOfOccurance («Переполнение стека при низком уровне», low, 2) возвращает 18 и 21 в строке.

class Example{
    public Example(){
    }
            public String indexOfOccurance(String string, String token, int nthOccurance) {
                    int lengthOfToken = token.length();
                    int nthCount = 0;
                    for (int shift = 0,count = 0; count < string.length() - token.length() + 2; count++, shift++, lengthOfToken++)
                        if (string.substring(shift, lengthOfToken).equalsIgnoreCase(token)) { 
                    // keeps count of nthOccurance
                            nthCount++; 
                        if (nthCount == nthOccurance){
                    //checks if nthCount  == nthOccurance. If true, then breaks 
                             return String.valueOf(shift)+ " " +String.valueOf(lengthOfToken);   
                        }  
                    }
                    return "-1";
                }
    public static void main(String args[]){
    Example example = new Example();
    String string = "the man, the woman and the child";
    int nthPositionOfThe = 3;
   System.out.println("3rd Occurance of the is at " + example.indexOfOccurance(string, "the", nthPositionOfThe));
    }
    }

0
public static int findNthOccurrence(String phrase, String str, int n)
{
    int val = 0, loc = -1;
    for(int i = 0; i <= phrase.length()-str.length() && val < n; i++)
    {
        if(str.equals(phrase.substring(i,i+str.length())))
        {
            val++;
            loc = i;
        }
    }

    if(val == n)
        return loc;
    else
        return -1;
}

2
Хотя этот код может решить вопрос, в том числе объяснение того, как и почему это решает проблему, действительно поможет улучшить качество вашего сообщения и, вероятно, приведет к большему количеству голосов за. Помните, что вы отвечаете на вопрос для будущих читателей, а не только для человека, который задает его сейчас. Измените свой ответ, чтобы добавить пояснения и указать, какие ограничения и предположения применяются.
Пика Волшебник китов

0

// scala

// выбрасываем -1, если значение отсутствует в n-й раз, даже если оно присутствует до n-1-го раза. // бросаем индекс, если значение присутствует в n-й раз

def indexOfWithNumber(tempString:String,valueString:String,numberOfOccurance:Int):Int={
var stabilizeIndex=0 
var tempSubString=tempString 
var tempIndex=tempString.indexOf(valueString) 
breakable
{
for ( i <- 1 to numberOfOccurance)
if ((tempSubString.indexOf(valueString) != -1) && (tempIndex != -1))
{
tempIndex=tempSubString.indexOf(valueString)
tempSubString=tempSubString.substring(tempIndex+1,tempSubString.size) // ADJUSTING FOR 0
stabilizeIndex=stabilizeIndex+tempIndex+1 // ADJUSTING FOR 0
}
else
{ 
stabilizeIndex= -1
tempIndex= 0
break
}
}
stabilizeIndex match { case value if value <= -1 => -1 case _ => stabilizeIndex-1 } // reverting for adjusting 0 previously
}


indexOfWithNumber("bbcfgtbgft","b",3) // 6
indexOfWithNumber("bbcfgtbgft","b",2) //1
indexOfWithNumber("bbcfgtbgft","b",4) //-1

indexOfWithNumber("bbcfgtbcgft","bc",1)  //1
indexOfWithNumber("bbcfgtbcgft","bc",4) //-1
indexOfWithNumber("bbcfgtbcgft","bc",2) //6
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.