есть ли инструмент для очистки данных для python / pandas, похожий на инструмент R tidyr?


18

Я работаю над проблемой Kaggle, где некоторые переменные представлены строками, а не столбцами (разрушение сети Telstra). В настоящее время я ищу эквивалент функции collect (), separa (() и spread (), который можно найти в инструменте R tidyr.


Ответы:



3

R по gather()существу идет от широкой к длинной. Так,

  1. проверьте страницу панд о том, как использовать pandas.wide_to_long(),
  2. проверьте этот блог для обсуждения получения элегантной gatherфункции в Python.

0

Я попытался синтаксически имитировать пакет tidyr в python в пакете под названием tidypython. Я сделал его совместимым с пакетом dplython, который включает использование оператора >> для цепочек команд.

Он не был полностью протестирован, но должен работать довольно хорошо:

https://github.com/durrantmm/tidypython

Дайте мне знать, если это работает для вас.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.