Я работаю над проблемой Kaggle, где некоторые переменные представлены строками, а не столбцами (разрушение сети Telstra). В настоящее время я ищу эквивалент функции collect (), separa (() и spread (), который можно найти в инструменте R tidyr.
Я работаю над проблемой Kaggle, где некоторые переменные представлены строками, а не столбцами (разрушение сети Telstra). В настоящее время я ищу эквивалент функции collect (), separa (() и spread (), который можно найти в инструменте R tidyr.
Ответы:
Я бы начал с функции melt () в пандах. Я написал статью об этом:
https://www.ibm.com/developerworks/community/blogs/jfp/entry/Tidy_Data_In_Python?lang=en
R по gather()
существу идет от широкой к длинной. Так,
pandas.wide_to_long()
,gather
функции в Python.Я попытался синтаксически имитировать пакет tidyr в python в пакете под названием tidypython. Я сделал его совместимым с пакетом dplython, который включает использование оператора >> для цепочек команд.
Он не был полностью протестирован, но должен работать довольно хорошо:
https://github.com/durrantmm/tidypython
Дайте мне знать, если это работает для вас.