Пару слов об API социальных сетей. Около года назад я написал обзор API популярных социальных сетей для исследователей. К сожалению, это на русском языке. Вот резюме:
Twitter ( https://dev.twitter.com/docs/api/1.1 )
- почти все данные о твитах / текстах и пользователях доступны;
- отсутствие социально-демографических данных;
- отличный потоковый API: полезен для обработки текста в реальном времени;
- много обёрток для языков программирования;
- Получение структуры сети (соединений) возможно, но затратно по времени (1 запрос в 1 минуту).
Facebook ( https://developers.facebook.com/docs/reference/api/ )
- ограничения скорости: около 1 запроса в секунду;
- хорошо документировано, песочница присутствует;
- FQL (SQL-подобный) и API Graph «обычный отдых»;
- данные о дружбе и социально-демографические особенности присутствуют;
- много данных находится за горизонтом событий : только данные друзей и друзей друзей более или менее полны, почти ничего нельзя исследовать в отношении случайного пользователя;
- некоторые странные ошибки API, и похоже, что это никого не волнует (например, некоторые функции доступны через FQL, но не через синоним Graph API).
Instagram ( http://instagram.com/developer/ )
- ограничения скорости: 5000 запросов в час;
- API реального времени (например, Streaming API для Twitter, но с фотографиями) - подключение к нему немного сложнее: используются обратные вызовы;
- отсутствие социально-демографических данных;
- фотографии, фильтры данных доступны;
- неожиданные недостатки (например, возможно собрать только 150 комментариев к записи / фотографии).
Foursquare ( https://developer.foursquare.com/overview/ )
- ограничения скорости: 5000 запросов в час;
- королевство геосоциальных данных :)
- совершенно закрыт от исследований из-за проблем с конфиденциальностью. Для сбора данных о проверках необходимо создать составной парсер, работающий сразу с 4sq, bit.ly и twitter API;
- еще раз: отсутствие социально-демографических данных.
Google+ ( https://developers.google.com/+/api/latest/ )
- около 5 запросов в секунду (попробуйте проверить);
- основные методы: деятельность и люди;
- как и в Facebook, много персональных данных для случайного пользователя скрыто;
- отсутствие данных о пользовательских подключениях.
И вне конкуренции: я просмотрел социальные сети для русских читателей, а сеть №1 здесь - vk.com . Он переведен на многие языки, но популярен только в России и других странах СНГ. Ссылка на документацию API: http://vk.com/dev/ . И, с моей точки зрения, это лучший выбор для домашних исследований социальных сетей. По крайней мере, в России. Поэтому:
- ограничения скорости: 3 запроса в секунду;
- доступны общедоступные текстовые и медиаданные;
- Доступны социодемографические данные: для случайного пользователя уровень доступности составляет около 60-70%;
- также доступны связи между пользователями: доступны почти все данные о дружбе для случайного пользователя;
- некоторые специальные методы: например, есть метод получения статуса онлайн / офлайн для конкретного пользователя в режиме реального времени, и можно построить график для его аудитории.