Какие методы используются сервисами GeoIP, кроме информации WHOIS? [закрыто]


11

Мне было просто интересно, как службы GeoIP собирают данные о географическом местоположении IP-адресов, помимо проверки информации WHOIS IP-адреса. Например, я наткнулся на этот веб-сайт, который говорит, что IP 74.207.244.221 находится во Фримонте, Калифорния: https://ipinfo.io/74.207.244.221.

Но я не могу найти эту информацию на этом IP Whois информации. ipinfo.io заявляет, что:

Первоначально наш API использовал данные MaxMind, но мы были очень заняты созданием наших собственных данных геолокации. Мы добились большого прогресса, и теперь мы используем наши собственные данные для обслуживания примерно половины всех запросов. Мы все еще откат к данным MaxMind, хотя

И это меня заинтересовало, как сервисы, такие как ipinfo.io и MaxMind, собирают данные GeoIP?

Ответы:


11

Такие сервисы обычно используют 3 способа определения местоположения IP-адреса:

  1. Переход через WhoIs базы данных для поиска адреса;
  2. Отслеживание обратных DNS-запросов, чтобы попытаться найти улики на основе записей доменных имен, или отслеживание пути пакета, отправленного в пункт назначения, что также может дать подсказки (например, с помощью traceroute).
  3. И, наконец, они используют триангуляцию RTT.

Triangulation Round-Trip Time (RTT) - это метод, используемый для получения приблизительной геолокации IP-адреса путем измерения задержки пинга в трех разных местах.

Например, если у вас есть три сервера, распределенных по всему миру в форме треугольника, и если вы пропингуете IP-адрес от всех трех и получаете одинаковые результаты для задержки, то это будет означать, что IP-адрес расположен прямо в центр этого треугольника. Именно так работает триангуляция, однако в этом случае она используется с эхо-запросами ICMP.

Ресурсы, которые вы можете прочитать:
Что такое пинг? @ Википедия
SIGCOMM статья о RTT триангуляции


5
Вау, я бы никогда не подумал, что существует триангуляция на основе RTT. Интересный. Таким образом, если какой-либо сервер хочет избежать геолокации, это может привести к случайной задержке в ответах ICMP.
ученик

Я хотел бы добавить, что было бы полезно взглянуть на tracert / traceroute, как написано на iplocation.net: «Вы можете использовать команду« traceroute », чтобы найти ключи к расположению IP-адреса. Имена маршрутизаторов, через которые поток пакетов от вашего хоста к хосту назначения может указывать на географический путь к конечному местоположению. "
ученик

1
@Learner, однако, это хорошее дополнение, которое уже есть в моем ответе в виде «отслеживания обратных DNS-запросов». Хотя traceroute на самом деле этого не делает, он показывает все домены / адреса, через которые проходит запрос. Я добавлю примечание, чтобы сделать его более ясным, тем не менее :)
Fanatique

5

Я основатель IPinfo , поэтому могу определенно рассказать об этом подробнее! Нет единственного метода, который мы используем, или единого источника данных, чтобы создать нашу собственную базу данных геолокации (или любой из наших других наборов данных, таких как IP для компании или IP для оператора). Это смесь различных наборов данных, методов обработки данных и уроков, полученных в течение нескольких лет!

Некоторые источники данных и методы, которые не часто упоминаются, включают:

  • Прямые каналы от интернет-провайдеров. Наш сервис обрабатывает около 500 миллионов запросов API в день и используется на многих популярных веб-сайтах высокого уровня. Поэтому интернет-провайдеры заинтересованы в предоставлении нам точных и актуальных данных о геолокации, чтобы их клиенты могли получить отличный опыт работы в Интернете. Мы работаем напрямую с большим и большим количеством интернет-провайдеров.

  • Данные о местоположении GPS. С помощью GPS можно собирать точную информацию о местоположении на мобильных устройствах. Вы можете связать это с IP-адресом и некоторым логическим выводом топологии сети, чтобы определить местоположение для диапазонов IP-адресов с помощью всего лишь нескольких измерений.

  • Пользователь представил исправления. Когда мы получаем неправильное местоположение (или оно не было обновлено после изменения), мы часто быстро получаем обратную связь от пользователей и можем вручную исправить местоположение или настроить наш алгоритм, чтобы убедиться, что оно правильно расположено при следующем запуске наш конвейер обработки данных.

Что касается набора данных IP-адресов компании, мы фактически очищаем каждое доменное имя каждый месяц и сопоставляем извлекаемые там данные с информацией о владельце IP-адреса, записями rwhois и многим другим. Затем мы также используем данные о доменных именах, чтобы показать, какие домены размещены на каких IP-адресах, а также в нашем классификаторе типов IP, наряду со многими другими источниками данных, чтобы определить вероятность того, что IP-адрес будет в основном использоваться в качестве домашнего провайдера, бизнес или хостинг провайдер. Мы также анализируем структуру ссылок этих страниц и показать некоторые из этих данных на host.io .


Благодарность! Я не ожидал, что основатель этого сайта ответит на мой вопрос :) Это было очень интересно.
ученик
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.