Я ищу информацию о том, как другие организуют свой код R и вывод.
Моя текущая практика заключается в написании кода в блоках в текстовом файле как таковой:
#=================================================
# 19 May 2011
date()
# Correlation analysis of variables in sed summary
load("/media/working/working_files/R_working/sed_OM_survey.RData")
# correlation between estimated surface and mean perc.OM in epi samples
cor.test(survey$mean.perc.OM[survey$Depth == "epi"],
survey$est.surf.OM[survey$Depth == "epi"]))
#==================================================
Затем я вставляю вывод в другой текстовый файл, обычно с некоторой аннотацией.
Проблемы с этим методом:
- Код и выходные данные явно не связаны, кроме как по дате.
- Код и выходные данные организованы в хронологическом порядке и, следовательно, может быть трудно найти.
Я подумал о том, чтобы сделать один документ Sweave со всем, так как тогда я мог составить оглавление, но, похоже, это может доставить больше хлопот, чем пользы, которую он обеспечит.
Дайте мне знать о любых ваших эффективных процедурах организации вашего R-кода и вывода, которые позволили бы осуществлять эффективный поиск и редактирование анализа.
sink()
и capture.output()
. Замечательно.
sink()
или,capture.output()
возможно, ваши друзья. Утилиты для создания отчетов, такие как Hmisc , Sweave или brew , заслуживают рассмотрения (ваша точка 1). Системы контроля версий ( rcs , svn или git ) могут помочь с пунктом 2.