У меня есть файл CSV с 4 миллионами ребер направленной сети, представляющих людей, общающихся друг с другом (например, Джон отправляет сообщение Мэри, Мэри отправляет сообщение Энн, Джон отправляет другое сообщение Мэри и т. Д.). Я хотел бы сделать две вещи:
Найти степень, между и (возможно) центральность собственных векторов для каждого человека.
Получите визуализацию сети.
Я хотел бы сделать это в командной строке на сервере Linux, так как мой ноутбук не обладает большой мощностью. На этом сервере установлен R и библиотека statnet. Я нашел этот пост 2009 года, когда кто-то более компетентный, чем я, пытался сделать то же самое и столкнулся с проблемами. Так что мне было интересно, есть ли у кого-нибудь еще советы о том, как это сделать, желательно, чтобы шаг за шагом, потому что я знаю только, как загрузить файл CSV и ничего больше.
Просто чтобы дать вам представление, вот как выглядит мой CSV-файл:
$ head comments.csv
"src","dest"
"6493","139"
"406705","369798"
$ wc -l comments.csv
4210369 comments.csv