У меня есть pandas
фрейм данных, и я хотел бы предсказать значения столбца A по значениям в столбцах B и C. Вот игрушечный пример:
import pandas as pd
df = pd.DataFrame({"A": [10,20,30,40,50],
"B": [20, 30, 10, 40, 50],
"C": [32, 234, 23, 23, 42523]})
В идеале у меня было бы что-то подобное, ols(A ~ B + C, data = df)
но когда я смотрю на примеры из библиотек алгоритмов, scikit-learn
кажется, что данные передаются в модель со списком строк вместо столбцов. Это потребовало бы от меня переформатирования данных в списки внутри списков, что, похоже, в первую очередь противоречит цели использования панд. Каков наиболее питонический способ запустить регрессию OLS (или любой алгоритм машинного обучения в целом) для данных в кадре данных pandas?
formula
я случайно набралformulas
вместо него и получил странную ошибку:TypeError: from_formula() takes at least 3 arguments (2 given)