Вопросы с тегом «dplyr»

Используйте этот тег для вопросов, связанных с функциями из пакета dplyr, такими как group_by, summarize, filter и select.

3
data.table vs dplyr: один может делать что-то хорошо, другой - плохо или плохо?
обзор Я относительно знаком с data.table, не так много с dplyr. Я прочитал несколько dplyrвиньеток и примеров, которые всплыли на SO, и до сих пор мои выводы таковы: data.tableи dplyrсопоставимы по скорости, за исключением случаев, когда существует много (то есть> 10-100 КБ) групп, и при некоторых других обстоятельствах (см. контрольные …
760 r  data.table  dplyr 

5
Отобразить / напечатать все строки таблицы (tbl_df)
tibble(ранее tbl_df) является версией фрейма данных, созданного dplyrпакетом манипулирования фреймами данных в R. Он предотвращает вывод длинных таблиц при случайном вызове фрейма данных. После того, как фрейм данных был обернут в tibble/ tbl_df, есть ли команда для просмотра всего фрейма данных (все строки и столбцы фрейма данных)? Если я использую …
192 r  dplyr  options  display 

4
Фильтровать строки, содержащие определенную строку
Я должен фильтровать фрейм данных, используя в качестве критерия те строки, в которых содержится строка RTB. Я использую dplyr. d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>% arrange(desc(MonthDelivery)) Я знаю , что могу использовать функцию filterв dplyrно я не точно , как сказать ему , чтобы проверить содержимое …
188 r  filter  dplyr 

5
Можно ли использовать пакет dplyr для условного мутации?
Можно ли использовать мутацию, если она является условной (в зависимости от значений определенных значений столбца)? Этот пример помогает показать, что я имею в виду. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, …

7
Извлечь столбец dplyr tbl как вектор
Есть ли более краткий способ получить один столбец таблицы dplyr в качестве вектора из таблицы с базой данных (т. Е. Фрейм / таблица данных не может быть поднабором напрямую)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL Это было бы слишком легко, так collect(select(iris2, …

8
Исправление множественного предупреждения «неизвестный столбец»
У меня есть постоянное многократное предупреждение о «неизвестном столбце» для всех типов команд (например, str (x) для установки обновлений в пакеты), и я не уверен, как это отладить или исправить. Предупреждение «неизвестный столбец» явно связано с переменной в tbl_df, которую я переименовал, но предупреждение появляется во всех видах команд, которые, …
172 r  dplyr 

9
Используйте имена динамических переменных в `dplyr`
Я хочу использовать dplyr::mutate()для создания нескольких новых столбцов в кадре данных. Имена столбцов и их содержимое должны генерироваться динамически. Пример данных из радужки: library(dplyr) iris <- tbl_df(iris) Я создал функцию для изменения моих новых столбцов из Petal.Widthпеременной: multipetal <- function(df, n) { varname <- paste("petal", n , sep=".") df <- …
168 r  dplyr  r-faq 

9
Группировать по нескольким столбцам в dplyr, используя строковый вектор
Я пытаюсь перенести свое понимание plyr в dplyr, но не могу понять, как группировать по нескольким столбцам. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns …
157 r  dplyr  r-faq 

7
Относительные частоты / пропорции с dplyr
Предположим, я хочу рассчитать долю различных значений в каждой группе. Например, используя mtcarsданные, как рассчитать относительную частоту числа передач с помощью am (автоматически / вручную) за один раз dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am gear n # …
153 r  group-by  dplyr  frequency 

9
Выберите первую и последнюю строку из сгруппированных данных
Вопрос Используя dplyr, как выбрать верхние и нижние наблюдения / строки сгруппированных данных в одном утверждении? Данные и пример Учитывая фрейм данных df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Я могу получить верхние и нижние наблюдения от каждой группы, используя slice, но используя две отдельные оценки: firstStop <- df %>% group_by(id) %>% …
137 r  dplyr 


6
Применять функцию к каждой строке таблицы с помощью dplyr?
При работе с ним plyrя часто находил полезным использовать adplyскалярные функции, которые мне приходилось применять к каждой строке. например data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 …
121 r  plyr  dplyr 

4
Что означает функция%>% в R?
Я видел использование функции %>%(процент больше, чем процент) в некоторых пакетах, таких как dplyr и rvest . Что это означает? Это способ писать закрывающие блоки в R?
120 r  syntax  dplyr  magrittr  r-faq 

6
Замена на «переименовать» в dplyr
Мне нравится функция переименования в plyr rename. Я недавно начал использовать dplyr, и мне было интересно, есть ли простой способ переименовать переменные с помощью функции из dplyr, которая так же проста в использовании, как и plyr rename?
118 r  rename  dplyr 

1
Может ли dplyr объединяться по нескольким столбцам или составному ключу?
Я понимаю, что dplyrv3.0 позволяет объединять разные переменные: left_join(x, y, by = c("a" = "b")будет соответствовать x.aкy.b Однако можно ли присоединиться к комбинации переменных или мне нужно заранее добавить составной ключ? Что-то вроде этого: left_join(x, y, by = c("a c" = "b d")для соответствия конкатенации [ x.aи x.c] с [ …
111 r  dplyr 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.