Я использую библиотеку pandas для чтения некоторых данных CSV. В моих данных некоторые столбцы содержат строки. Строка "nan"
является возможным значением, как и пустая строка. Мне удалось заставить pandas читать «nan» как строку, но я не могу понять, как заставить его не читать пустое значение как NaN. Вот пример данных и вывод
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
Он правильно читает «нан» , как строка «нан», но по- прежнему читает пустые ячейки как NaN. Я попытался переходящим в str
в converters
аргументе read_csv (с converters={'One': str})
), но он все еще читает пустые ячейки как NaN.
Я понимаю, что могу заполнить значения после прочтения с помощью fillna, но действительно ли нет способа сказать пандам, что пустая ячейка в конкретном столбце CSV должна читаться как пустая строка вместо NaN?
keep_default_na
ниже.