Имя: имя, отчество, фамилия.
Мне интересно, сколько информации вы можете извлечь из имени, используя общедоступные наборы данных. Я знаю, что вы можете получить следующее с любой низкой вероятностью (в зависимости от входных данных), используя данные переписи США: 1) Пол. 2) Гонка.
Например, Facebook использовал именно это, чтобы с достаточной степенью точности определить расовое распределение пользователей своего сайта (https://www.facebook.com/note.php?note_id=205925658858).
Что еще можно добыть? Я не ищу ничего конкретного, это очень открытый вопрос, чтобы успокоить мое любопытство.
Мои примеры относятся только к США, поэтому мы предполагаем, что имя - это имя человека, находящегося в США; но, если кто-то знает об общедоступных наборах данных для других стран, я более чем открыт для них.
Я не совсем уверен, если это правильное место для этого, если нет, я был бы признателен, если бы кто-то мог указать мне на более подходящее место.
Я надеюсь, что это интересный вопрос, и это подходящее место!