Найдите расположение символа в строке


87

Я хочу найти расположение символа в строке.

Сказать: string = "the2quickbrownfoxeswere2tired"

Я хочу, чтобы функция возвращала 4и 24- расположение символа 2s в string.


Зачем использовать регулярное выражение? Неужели у r есть .indexOf()что-то вроде?
fge

1
Я в этом сомневаюсь. Разработчики были Nixers и предполагали, что все знают регулярное выражение. Обработка строк в R довольно запутанна.
IRTFM

Ответы:


115

Ты можешь использовать gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

или, возможно, str_locate_allиз пакета, stringrкоторый является оболочкой ( начиная с версии 1.0)gregexpr stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

обратите внимание, что вы можете просто использовать stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

Другой вариант в базе Rбыл бы что-то вроде

lapply(strsplit(x, ''), function(x) which(x == '2'))

должен работать (учитывая вектор символов x)


как мы можем извлечь целые числа из списков / объектов, возвращаемых вашими первыми тремя решениями?
3pitt,

Используйте regexprвместо, gregexprчтобы легко получить целые числа. Или используйте unlistна выходе, как указано в другом ответе ниже.
Арани

42

Вот еще одна простая альтернатива.

> which(strsplit(string, "")[[1]]=="2")
[1]  4 24

Вы можете объяснить, что [[1]]делает?
francoiskroll

@francoiskroll, [[1]] представляет первый элемент списка.
Prafulla

20

Вы можете сделать вывод только 4 и 24, используя unlist:

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

2

найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

2

Чтобы найти только первые местоположения, используйте lapply()с min():

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

Чтобы найти только последние местоположения, используйте lapply()с max():

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

1

Вы также можете использовать grep:

grep('2', strsplit(string, '')[[1]])
#4 24
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.