Я хочу найти расположение символа в строке.
Сказать: string = "the2quickbrownfoxeswere2tired"
Я хочу, чтобы функция возвращала 4
и 24
- расположение символа 2
s в string
.
Я хочу найти расположение символа в строке.
Сказать: string = "the2quickbrownfoxeswere2tired"
Я хочу, чтобы функция возвращала 4
и 24
- расположение символа 2
s в string
.
Ответы:
Ты можешь использовать gregexpr
gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")
[[1]]
[1] 4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE
или, возможно, str_locate_all
из пакета, stringr
который является оболочкой ( начиная с версии 1.0)gregexpr
stringi::stri_locate_all
stringr
library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")
[[1]]
start end
[1,] 4 4
[2,] 24 24
обратите внимание, что вы можете просто использовать stringi
library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)
Другой вариант в базе R
был бы что-то вроде
lapply(strsplit(x, ''), function(x) which(x == '2'))
должен работать (учитывая вектор символов x
)
regexpr
вместо, gregexpr
чтобы легко получить целые числа. Или используйте unlist
на выходе, как указано в другом ответе ниже.
Вот еще одна простая альтернатива.
> which(strsplit(string, "")[[1]]=="2")
[1] 4 24
[[1]]
делает?
Вы можете сделать вывод только 4 и 24, используя unlist:
unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1] 4 24
найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден
instr <- function(str1,str2,startpos=1,n=1){
aa=unlist(strsplit(substring(str1,startpos),str2))
if(length(aa) < n+1 ) return(0);
return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}
instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0
Чтобы найти только первые местоположения, используйте lapply()
с min()
:
my_string <- c("test1", "test1test1", "test1test1test1")
unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5
# or the readable tidyverse form
my_string %>%
gregexpr(pattern = '1') %>%
lapply(min) %>%
unlist()
#> [1] 5 5 5
Чтобы найти только последние местоположения, используйте lapply()
с max()
:
unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1] 5 10 15
# or the readable tidyverse form
my_string %>%
gregexpr(pattern = '1') %>%
lapply(max) %>%
unlist()
#> [1] 5 10 15
.indexOf()
что-то вроде?