Вопросы с тегом «r-faq»

Тег r-faq создан для группировки ограниченного числа вопросов, обсуждающих проблемы, которые регулярно появляются в теге R. Это не официальный FAQ по R для SO, но он должен служить интересным источником информации по распространенным проблемам.

11
Быстрое чтение очень больших таблиц как данных
У меня есть очень большие таблицы (30 миллионов строк), которые я хотел бы загрузить в виде фреймов данных в R. read.table()Имеет много удобных функций, но, похоже, в реализации много логики, которая может замедлить работу. В моем случае, я предполагаю, что знаю типы столбцов заранее, таблица не содержит заголовков столбцов или …
504 r  import  dataframe  r-faq 

16
Создать пустой data.frame
Я пытаюсь инициализировать data.frame без каких-либо строк. По сути, я хочу указать типы данных для каждого столбца и дать им имена, но в результате не нужно создавать никаких строк. Лучшее, что я смог сделать, это что-то вроде: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] Который создает data.frame …
480 r  dataframe  r-faq 

2
Почему `[` лучше чем `subset`?
Когда мне нужно отфильтровать data.frame, т.е. извлечь строки, которые удовлетворяют определенным условиям, я предпочитаю использовать subsetфункцию: subset(airquality, Month == 8 & Temp > 90) Вместо [функции: airquality[airquality$Month == 8 & airquality$Temp > 90, ] Есть две основные причины моего предпочтения: Я считаю, что код читается лучше, слева направо. Даже люди, …
400 r  filter  subset  r-faq 


6
Как установить пакет R из исходного кода?
Друг прислал мне это великолепное руководство по веб-сёрфингу NYtimes с R . Я бы очень хотел попробовать это. Тем не менее, первым шагом является установка пакета с именем RJSONIO из исходного кода. Я достаточно хорошо знаю R, но понятия не имею, как установить пакет из исходного кода. Я использую Mac …
392 r  package  install  r-faq 

30
Есть ли встроенная функция для нахождения режима?
В R mean()и median()есть стандартные функции, которые делают то, что вы ожидаете. mode()сообщает вам режим внутренней памяти объекта, а не значение, которое встречается чаще всего в его аргументе. Но есть ли стандартная библиотечная функция, которая реализует статистический режим для вектора (или списка)?
392 r  statistics  r-faq 

12
Как можно объединить две строки?
Как я могу объединить (объединить, объединить) два значения? Например у меня есть: tmp = cbind("GAD", "AB") tmp # [,1] [,2] # [1,] "GAD" "AB" Моя цель - объединить два значения в «tmp» в одну строку: tmp_new = "GAD,AB" Какая функция может сделать это для меня?

10
Извлечение определенных столбцов из фрейма данных
У меня есть фрейм данных R с 6 столбцами, и я хочу создать новый фрейм данных, который имеет только три столбца. Предполагая , что мой кадр данных df, и я хочу , чтобы извлечь колонны A, Bи Eэто единственная команда , которую я могу понять: data.frame(df$A,df$B,df$E) Есть ли более компактный …
366 r  dataframe  r-faq 

13
Как обрезать начальные и конечные пробелы?
У меня проблемы с ведущими и конечными пробелами в data.frame. Например, я хотел бы взглянуть на конкретные rowв data.frameзависимости от определенного условия: > myDummy[myDummy$country == c("Austria"),c(1,2,3:7,19)] [1] codeHelper country dummyLI dummyLMI dummyUMI [6] dummyHInonOECD dummyHIOECD dummyOECD <0 rows> (or 0-length row.names) Мне было интересно, почему я не получил ожидаемый результат, …

15
Как суммировать переменную по группе
У меня есть фрейм данных с двумя столбцами. Первый столбец содержит категории, такие как «Первый», «Второй», «Третий», а второй столбец содержит числа, которые представляют количество раз, когда я видел определенные группы из «Категории». Например: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 …
357 r  dataframe  aggregate  r-faq 

8
Как добавить ведущие нули?
У меня есть набор данных, который выглядит примерно так: anim <- c(25499,25500,25501,25502,25503,25504) sex <- c(1,2,2,1,2,1) wt <- c(0.8,1.2,1.0,2.0,1.8,1.4) data <- data.frame(anim,sex,wt) data anim sex wt anim2 1 25499 1 0.8 2 2 25500 2 1.2 2 3 25501 2 1.0 2 4 25502 1 2.0 2 5 25503 2 1.8 …

5
Как написать trycatch в R
Я хочу написать trycatchкод для устранения ошибки при загрузке из Интернета. url <- c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz") y <- mapply(readLines, con=url) Эти два утверждения выполняются успешно. Ниже я создаю несуществующий веб-адрес: url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz") url[1]не существует. Как написать trycatchцикл (функцию), чтобы: Если URL неверный, вывод будет: «Веб-адрес неверный, не могу …

28
Элегантный способ проверить отсутствующие пакеты и установить их?
Кажется, я делюсь большим количеством кода с соавторами в эти дни. Многие из них являются новичками / пользователями среднего уровня и не понимают, что им нужно устанавливать пакеты, которых у них еще нет. Есть ли элегантный способ вызова installed.packages(), сравните его с теми, которые я загружаю и устанавливаю, если отсутствует?
337 r  packages  r-faq 


11
Как изменить порядок столбцов в кадре данных?
Как изменить этот вход (с последовательностью: время, вход, выход, файлы): Time In Out Files 1 2 3 4 2 3 4 5 К этому выводу (с последовательностью: время, out, in, файлы)? Time Out In Files 1 3 2 4 2 4 3 5 Вот фиктивные данные R: table <- data.frame(Time=c(1,2), …
311 r  sorting  dataframe  r-faq 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.