Как написать trycatch в R


342

Я хочу написать trycatchкод для устранения ошибки при загрузке из Интернета.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Эти два утверждения выполняются успешно. Ниже я создаю несуществующий веб-адрес:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1]не существует. Как написать trycatchцикл (функцию), чтобы:

  1. Если URL неверный, вывод будет: «Веб-адрес неверный, не могу получить».
  2. Когда URL-адрес неправильный, код не останавливается, а продолжает загружаться до конца списка URL-адресов?

Ответы:


626

Ну тогда: добро пожаловать в мир R ;-)

Ну вот

Настройка кода

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

Применение кода

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

Исследуя выход

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

Дополнительные замечания

попробуй поймать

tryCatchвозвращает значение, связанное с выполнением, exprесли нет ошибки или предупреждения. В этом случае конкретные возвращаемые значения (см. return(NA)Выше) могут быть указаны путем предоставления соответствующей функции-обработчика (см. Аргументы errorи warningв ?tryCatch). Это могут быть функции, которые уже существуют, но вы также можете определить их внутри tryCatch()(как я делал выше).

Последствия выбора конкретных возвращаемых значений функций-обработчиков

Как мы указали, что NAдолжно быть возвращено в случае ошибки, третий элемент в yявляется NA. Если бы мы выбрали , NULLчтобы быть возвращаемое значение, длина yбы просто был 2вместо , 3как lapply()просто «игнорировать» возвращаемые значения, которые NULL. Также обратите внимание, что если вы не укажете явное возвращаемое значение через return(), функции-обработчики вернутся NULL(т.е. в случае ошибки или условия предупреждения).

«Нежелательное» предупреждение

Как warn=FALSEкажется, не имеет никакого эффекта, альтернативный способ подавления предупреждения (который в данном случае не представляет особого интереса) заключается в использовании

suppressWarnings(readLines(con=url))

вместо того

readLines(con=url, warn=FALSE)

Несколько выражений

Обратите внимание , что вы можете также поместить несколько выражений в «фактических выражениях части» (аргумент exprо tryCatch()) , если завернуть их в фигурных скобках (так же , как я иллюстрировал в finallyчасти).


Учитывая, что первая строка в ваших pasteфункциях заканчивается пробелом, почему бы не опустить пробел и символ sep=""?
seancarmody

2
@seancarmody: true ;-) Я просто привык собирать более длинные / более сложные строки, где мне приходилось управлять пробелами, фактически записывая их.
Раппстер

3
Вы должны использовать paste0для этого!
seancarmody

6
paste0() находится в базе. Внутренне оба paste()и paste0()позвоните do_pasteв paste.c . Разница лишь в том paste0(), что sepаргумент не передается .
Jthetzel

1
@JulienNavarre: помните, что "try part" всегда возвращает последний объект (на данный момент readLines(con=url, warn=FALSE)это фактическая вещь, которая может пойти не так). Поэтому, если вы хотите добавить сообщение, вам нужно будет сохранить фактическое значение повторения в переменной: out <- readLines(con=url, warn=FALSE)затем message("Everything worked")следует out, чтобы сделать это последним фактически возвращаемым
объектом

69

R использует функции для реализации блока try-catch:

Синтаксис выглядит примерно так:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})

В tryCatch () есть два «условия», которые могут быть обработаны: «предупреждения» и «ошибки». При написании каждого блока кода важно понимать состояние выполнения и область действия. @источник


5
Заменить error-handler-codeнаcat("web url is wrong, can't get")
seancarmody

2
вы пропустили
перехват

52

tryCatchимеет немного сложную синтаксическую структуру. Однако, как только мы поймем 4 части, которые составляют полный вызов tryCatch, как показано ниже, становится легко запомнить:

expr : [ Обязательно ] R код (ы) для оценки

error : [ Необязательно ] Что должно работать, если при вычислении кодов в expr произошла ошибка

warning : [ Необязательно ] Что должно работать, если при вычислении кодов в expr возникло предупреждение

finally : [ Необязательно ] Что должно быть выполнено непосредственно перед завершением вызова tryCatch, независимо от того, успешно ли был выполнен expr, с ошибкой или с предупреждением

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if an warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)

Таким образом, игрушечный пример для вычисления лога значения может выглядеть так:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}

Сейчас работает три дела:

Действительный случай

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.

«Предупреждающий» случай

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.

Случай "ошибки"

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.

Я написал о некоторых полезных случаях использования, которые я использую регулярно. Узнайте больше здесь: https://rsangole.netlify.com/post/try-catch/

Надеюсь, это полезно.


34

Вот простой пример :

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do...
        {
        y = x * 2
        return(y)
        },
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("This is my custom message.")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}

Если вы также хотите записать «предупреждение», просто добавьте warning=похожие к error=части.


1
Должны ли быть фигурные скобки вокруг exprдетали, поскольку вместо одной есть две строки?
Пол

Спасибо! После двойной проверки я не вижу необходимости в фигурных скобках
Пол

Спасибо за двойную проверку. Когда я запускаю твой код, я получаю Error: unexpected ')' in " )"и Error: unexpected ')' in " )". Добавление пары фигурных скобок решает проблему.
Пол

В большинстве случаев вы правы, спасибо! Это было исправлено.
Пол

23

Так как я потерял два дня своей жизни, пытаясь найти для tryCatch функцию irr, я решил поделиться своей мудростью (а чего не хватает). FYI - irr - актуальная функция от FinCal, в этом случае в некоторых случаях возникли ошибки на большом наборе данных.

  1. Настройте tryCatch как часть функции. Например:

    irr2 <- function (x) {
      out <- tryCatch(irr(x), error = function(e) NULL)
      return(out)
    }
    
  2. Чтобы ошибка (или предупреждение) сработала, вам нужно создать функцию. Я изначально для части ошибки только что написал error = return(NULL)и ВСЕ значения возвратились нуль.

  3. Не забудьте создать вспомогательный вывод (например, мой "out") и to return(out).


3
Почему номер 3 необходим?
январь-GLX
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.