@Ondrej и @Michelle предоставили здесь хорошую информацию. Интересно, могу ли я внести свой вклад, обращаясь к некоторым пунктам, не упомянутым в других местах Я бы не стал себя расстраивать из-за того, что я не могу много почерпнуть из данных в табличной форме, таблицы, как правило, не очень хороший способ представления информации (ср., Гельман и др., Превращение таблиц в графики ). С другой стороны, запросить инструмент, который будет автоматически генерировать все правильные графики, чтобы помочь вам исследовать новый набор данных, почти то же самое, что запросить инструмент, который будет думать за вас. (Не поймите это неправильно, я признаю, что ваш вопрос ясно показывает, что вы не заходите так далеко; я просто имею в виду, что такого инструмента никогда не будет). Хорошая дискуссия, связанная с этим, может быть найдена сюда .
После всего сказанного я хотел немного рассказать о типах графиков, которые вы, возможно, захотите использовать для изучения своих данных. Графики, перечисленные в вопросе, были бы хорошим началом, но мы могли бы немного их оптимизировать. Начнем с того, что создание «большого количества графиков», коррелирующих пары переменных, может быть не идеальным. Диаграмма рассеяния отображает только предельные отношения между двумя переменными. Важные отношения часто могут быть скрыты в некоторой комбинации нескольких переменных. Итак, первый способ усилить этот подход - создать матрицу рассеяниякоторый отображает все попарные диаграммы рассеяния одновременно. Матрицы графика рассеяния могут быть улучшены различными способами: например, они могут быть объединены с одномерными графиками плотности ядра распределения каждой переменной, различные маркеры / цвета могут использоваться для построения различных групп, и возможные нелинейные отношения могут быть оценены путем наложения фитинга Лесса. scatterplot.matrix
Функция в пакете автомобиля в R может делать все эти вещи красиво (пример можно увидеть на полпути вниз страницы связаны выше).
Однако, хотя матрицы графиков рассеяния являются хорошим началом, они все еще отображают только маргинальные проекции. Есть несколько способов попытаться выйти за рамки этого. Одним из них является исследование трехмерных графиков с использованием пакета rgl в R. Другой подход заключается в использовании условных графиков; Коплоты могут помочь с отношениями между 3 или 4 переменными одновременно. Особенно полезным является интерактивное использование матрицы рассеяния.(хотя, это потребует больше усилий для обучения), например, путем «чистки». Чистка позволяет выделить точку или точки в одном кадре матрицы, и эти точки будут одновременно выделены во всех других кадрах. Перемещая кисть, вы можете видеть, как все переменные изменяются вместе. ОБНОВЛЕНИЕ: Другая возможность, которую я забыл упомянуть, состоит в использовании параллельного графика координат . Это имеет недостаток в том, что не делает вашу переменную ответа отличной, но может быть полезно, например, при изучении взаимных корреляций между вашими X-переменными.
Я также хочу поблагодарить вас за проверку ваших данных, отсортированных по дате сбора. Хотя данные всегда собираются со временем, люди не всегда делают это. Построение линейного графика - это хорошо, но я бы посоветовал вам дополнить его графиками автокорреляций и частичных автокорреляций . В R функции для них есть acf
и pacf
соответственно.
Я признаю, что все это не совсем отвечает на ваш вопрос в том смысле, что дает вам инструмент, который автоматически создаст все графики для вас, но один из выводов заключается в том, что вам на самом деле не нужно было бы создавать столько графиков, сколько вы боитесь Например, матрица диаграммы рассеяния - это всего лишь одна строка кода. Кроме того, в R должна быть возможность написать функцию / некоторый код многократного использования для себя, который частично автоматизирует некоторые из них (например, я могу представить себе функцию, которая принимает список переменных и упорядочивает даты, сортирует их , для каждого из них появляется новое окно с графиками line, acf и pacf).