Я ищу информацию о том, как организовать проект машинного обучения Python. Для обычных проектов Python есть Cookiecutter, а для R ProjectTemplate .
Это моя текущая структура папок, но я смешиваю ноутбуки Jupyter с реальным кодом Python, и это не очень понятно.
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
Я работаю в папке scripts и в настоящее время добавляю все функции в файлы в my_module, но это приводит к ошибкам при загрузке данных (относительные / абсолютные пути) и другим проблемам.
Я не смог найти надлежащих лучших практик или хороших примеров по этой теме, кроме некоторых решений для конкуренции kaggle и некоторых Записных книжек, в которых все функции были сжаты в начале такой Записной книжки.