Вопросы с тегом «r-faq»

Тег r-faq создан для группировки ограниченного числа вопросов, обсуждающих проблемы, которые регулярно появляются в теге R. Это не официальный FAQ по R для SO, но он должен служить интересным источником информации по распространенным проблемам.

8
Агрегировать / суммировать несколько переменных на группу (например, сумма, среднее)
Из кадра данных, есть простой способ агрегации ( sum, mean, maxодновременно с) и др несколько переменных? Ниже приведены некоторые примеры данных: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = …


6
Должен ли я использовать data.frame или матрицу?
Когда следует использовать data.frame, а когда лучше использовать matrix? Оба хранят данные в прямоугольном формате, поэтому иногда это неясно. Существуют ли общие правила, когда следует использовать какой тип данных?
152 r  matrix  dataframe  r-faq 

11
Удалить дублирующиеся строки
Я прочитал CSV файл в R data.frame. Некоторые строки имеют одинаковый элемент в одном из столбцов. Я хотел бы удалить строки, которые являются дубликатами в этом столбце. Например: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202 16 localhost 1 platform_external_dbus 202 16 users.sourceforge 8 platform_external_dbus 202 …
152 r  duplicates  r-faq 


8
Заменить все 0 значений на NA
У меня есть фреймворк с несколькими числовыми столбцами. Некоторая строка имеет значение 0, которое при статистическом анализе следует рассматривать как нулевое. Каков самый быстрый способ заменить все значения 0 на NULL в R?
152 r  r-faq 

18
Замена NA на последнее значение, отличное от NA
В data.frame (или data.table) я хотел бы «заполнить вперед» NA ближайшим предыдущим значением, отличным от NA. Вот простой пример использования векторов (вместо a data.frame): > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Мне нужна функция, fill.NAs()которая позволяет мне создавать yyтакие, что: > yy [1] NA …
150 r  data.table  zoo  r-faq 

8
R управление памятью / невозможно выделить вектор размером n Мб
Я сталкиваюсь с проблемами, пытаясь использовать большие объекты в R. Например: > memory.limit(4000) > a = matrix(NA, 1500000, 60) > a = matrix(NA, 2500000, 60) > a = matrix(NA, 3500000, 60) Error: cannot allocate vector of size 801.1 Mb > a = matrix(NA, 2500000, 60) Error: cannot allocate vector of …

3
Добавить легенду к линейному графику ggplot2
У меня вопрос по легендам в ggplot2. Мне удалось построить три линии на одном графике, и я хочу добавить легенду с использованием трех цветов. Это используемый код library(ggplot2) require(RCurl) link<-getURL("https://dl.dropbox.com/s/ds5zp9jonznpuwb/dat.txt") datos<- read.csv(textConnection(link),header=TRUE,sep=";") datos$fecha <- as.POSIXct(datos[,1], format="%d/%m/%Y") temp = ggplot(data=datos,aes(x=fecha, y=TempMax,colour="1")) + geom_line(colour="red") + opts(title="TITULO") + ylab("Temperatura (C)") + xlab(" ") …
147 r  ggplot2  legend  r-faq 

6
Как вы используете «<< -» (задание области видимости) в R?
Я только что закончил читать об области видимости во введении R , и мне очень интересно узнать о &lt;&lt;-назначении. В руководстве приведен один (очень интересный) пример &lt;&lt;-, который, как мне кажется, я понял. Мне все еще не хватает контекста, когда это может быть полезно. Так что я бы хотел прочитать …

5
Упорядочить дискретную шкалу х по частоте / значению
Я делаю точечную гистограмму, используя ggplot с дискретной шкалой x, ось x теперь расположена в алфавитном порядке, но мне нужно изменить ее так, чтобы она упорядочивалась по значению оси y (т. Е. Самая высокая полоса будет располагаться слева). Я попытался упорядочить или отсортировать, но в результате отсортировать ось X, но …
137 r  ggplot2  r-faq 

5
Предупреждающее сообщение: В `…`: недопустимый уровень фактора, сгенерировано NA
Я не понимаю, почему я получил это предупреждение. &gt; fixed &lt;- data.frame("Type" = character(3), "Amount" = numeric(3)) &gt; fixed[1, ] &lt;- c("lunch", 100) Warning message: In `[&lt;-.factor`(`*tmp*`, iseq, value = "lunch") : invalid factor level, NA generated &gt; fixed Type Amount 1 &lt;NA&gt; 100 2 0 3 0
135 r  warnings  r-faq 

7
Установка более старой версии пакета R
Я пытаюсь использовать Rpy2 и ggplot2, но получаю сообщение об ошибке. После некоторого поиска ошибки в Интернете я обнаружил, что ошибка возникает из-за изменений в пакете ggplot2, которые еще не отражены в Rpy2 (например, см. Этот пост (Изменить: ссылка теперь мертва)). Итак, теперь мне нужно установить старую версию ggplot2. Вот …
134 r  installation  version  r-faq 

4
Только читать выбранные столбцы
Может ли кто-нибудь сказать мне, как читать только первые 6 месяцев (7 столбцов) для каждого года данных ниже, например, используя read.table()? Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 …
134 r  import  r-faq 

21
Как искать материалы категории «R»? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто 7 лет назад . Улучшить этот вопрос "Google" очень полезен ... если только ваш язык не называется "R", и в этом случае он …
131 r  search  r-faq 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.