API данных / каналы доступны как пакеты в R


53

РЕДАКТИРОВАТЬ: Представление задачи « Веб-технологии и службы CRAN» содержит гораздо более полный список источников данных и API-интерфейсов, доступных в R. Вы можете отправить запрос на извлечение на github, если вы хотите добавить пакет в представление задач.


Я делаю список различных каналов данных, которые уже подключены к R или которые легко настроить. Вот мой начальный список пакетов, и мне было интересно, что еще мне не хватает.

Я пытаюсь ограничить этот список «данными в реальном времени» или «близкими к реальному времени» фидами данных / API, где базовые данные могут меняться между загрузками. Существует множество списков статических наборов данных, для которых требуется только одна загрузка.

Этот список в настоящее время смещен в сторону данных финансовых / временных рядов, и я мог бы использовать некоторую помощь для его расширения в другие области.

Free Data:
Источник данных - Пакет
Google Финансы исторические данные - quantmod
Google Финансы Балансы - quantmod
Yahoo Finance исторические данные - quantmod
Yahoo Finance исторические данные - tseries
Yahoo Finance текущие параметры цепи - quantmod
Yahoo Finance оценки исторического аналитика - fImport
Yahoo Финансы Статистика текущий ключ - fImport - кажется, сломана
Oanda исторических обменных курсов / цен на металлы - quantmod
FRED исторические макроэкономические показатели - quantmod
Всемирного банка исторические макроэкономические показатели - ИМР
Данные об объемах исторический поиск Google Trends - RGoogleTrends
Google Docs - RGoogleDocs
Google Storage - RGoogleStorage
Twitter - Twitter
Zillow - Zillow
New York Times - RNYTimes
переписи населения США 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - требует бесплатной учетной записи
Factual.com - factualR
геокодирования адресов - RDSTK
Карта координат к политическим границам - RDSTK
Weather Underground - Сверните свои собственные
Google News - Ролл собственные
Науки о Земле NetCDF данных - Ролл свой собственный
климатических данных - Ролл ваши собственные
данные здравохранение - Ролл свой собственный
OAI комбайн - Open Archives Initiative комбайн
RAmazonS3 - сервер хранения данных S3 Amazon
Rflikr - Flikr апи

Требуется подписка:
Bloomberg - RBloomberg
LIM - LIM
Сделки и котировки от NYSE - RTAQ
Interactive Brokers - IBrokers


1
зависит от того, что вы подразумеваете под «простотой настройки» ... У меня есть несколько нестандартных сценариев, которые «просты в настройке»
David LeBauer

2
Прямо сейчас я определяю «легко настроить» как «пакет существует» или «кто-то опубликовал / опубликовал функцию для загрузки данных»
Зак

Далее я бы определил «пакеты существуют» как «пакет находится в CRAN» или «пакет находится в R Forge», «пакет находится в каком-то CRAN-подобном общедоступном хранилище».
Зак

Дополнение: Федеральный регистр API (в разработке).
о.

Этот поток может также представлять интерес: импорт цена акций с Yahoo Finance в R .
gung - Восстановить Монику

Ответы:


8
  1. Инструкции по использованию R для загрузки данных netCDF можно найти здесь , общий формат, используемый для хранения данных наук о Земле, например, как в морских геопространственных данных из OpenEarth или драйвера климатической модели и прогнозов из UCAR

  2. Программа rnpn (в стадии разработки) позволяет получать данные из Национальной сети фенологов - научного проекта для граждан, который отслеживает сроки озеленения, цветения и старения растений. Смотрите сообщение в блоге разработчика .

  3. -obsolete- RClimate предоставляет инструменты для загрузки и обработки данных о климате плоских файлов (с учебными пособиями, в том числе здесь -

  4. Скачать исторические финансовые данные с tseries::get.hist.quote

  5. Документы Майкла Самуэля, загружающие данные общественного здравоохранения

  6. raster::getData обеспечивает доступ к климатическим переменным через worldclim


Что такое "данные netCDF?"
Зак

@Zach NetCDF - это своего рода универсальный структурированный способ хранения больших наборов данных. Альтернативный подход основан на формате HDF5 .
chl

@ Дэвид (+1) Большое спасибо за четвертый пункт!
chl

Что случилось с RClimate? Я нигде не могу найти посылку
Даниэль Райбек,

Теперь на R есть библиотека ncdf4 для обработки netcdf4. Его сложнее установить, чем ncdf, но, как мне кажется, он устарел. Несколько лет назад мне даже удалось установить netcdf4 с Min GW64, чтобы этот пакет работал на Windows :), если я сделал это, это означает, что это возможно ... и кажется, что Д. Пирс (автор пакета) предоставляет источники на своем веб-сайте cirrus.ucsd.edu/~pierce/ncdf
Робин Джирард

8

Существует проект, нацеленный на создание R-пакетов с этой целью (R-интерфейс для API-интерфейсов реального времени) под названием rOpenSci , в котором имеется 18 пакетов, доступных в настоящее время или находящихся в разработке. Некоторые из них (rnpn, rfishbase) уже есть в вашем списке.

Отличный список! и полное раскрытие - я часть проекта rOpenSci.


1
  1. ONETr - эффективное взаимодействие с O * NET ™ API, предоставляющее данные о профессиональных дескрипторах Министерства труда США.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.