Наука о данных

Вопросы и ответы для специалистов по науке о данных, специалистов по машинному обучению и тех, кто хочет больше узнать об этой области

3
Как заставить веса быть неотрицательными в линейной регрессии
Я использую стандартную линейную регрессию, используя scikit-learn в python. Тем не менее, я хотел бы, чтобы веса были положительными для каждой функции (не отрицательной), есть ли способ, которым я могу это сделать? Я искал в документации, но не мог найти способ сделать это. Я понимаю, что я не могу найти …

7
Существуют ли бесплатные облачные сервисы для обучения моделям машинного обучения?
Я хочу тренировать глубокую модель с большим количеством обучающих данных, но мой рабочий стол не имеет такой силы, чтобы тренировать такую ​​глубокую модель с этими обильными данными. Я хотел бы знать, существуют ли какие-либо бесплатные облачные сервисы, которые можно использовать для обучения машинному обучению и моделям глубокого обучения? Я также …


7
Как клонировать рабочую среду Python на другой машине?
Я разработал модель машинного обучения с Python (Anaconda + Flask) на моей рабочей станции, и все идет хорошо. Позже я попытался отправить эту программу на другую машину, где, конечно, я пытался настроить ту же среду, но программа не запускалась. Я скопировал программу на другие машины, где она также работает без …
26 python  anaconda 

1
Как Keras рассчитывает точность?
Как Keras рассчитывает точность по классовым вероятностям? Например, у нас есть 100 образцов в тестовом наборе, которые могут принадлежать одному из двух классов. У нас также есть список классовых вероятностей. Какой порог использует Keras, чтобы назначить выборку любому из двух классов?

1
PyTorch против Tensorflow Fold
Как PyTorch, так и Tensorflow Fold являются средами глубокого обучения, предназначенными для работы в ситуациях, когда входные данные имеют неодинаковую длину или измерения (то есть ситуации, когда динамические графики полезны или необходимы). Я хотел бы знать, как они сравниваются, в смысле парадигм, на которые они полагаются (например, динамическое пакетирование), и …

7
Общедоступные наборы данных / API социальных сетей
В качестве дополнения к нашему большому списку общедоступных наборов данных , я хотел бы знать, существует ли какой-либо список общедоступных наборов данных социальных сетей / API для сканирования. Было бы очень хорошо, если бы наряду со ссылкой на набор данных / API были добавлены характеристики доступных данных. Такая информация должна …

4
Книги о «науке» в науке о данных? [закрыто]
Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он фокусировался только на одной проблеме, редактируя этот пост . Закрыто 5 лет назад . Какие книги о науке и математике стоят за наукой о данных? Такое ощущение, …

7
Может ли машинное обучение выучить такую ​​функцию, как поиск максимума из списка?
У меня есть вход, который является списком, и вывод является максимумом элементов input-list. Может ли машинное обучение выучить такую ​​функцию, которая всегда выбирает максимум входных элементов, присутствующих на входе? Это может показаться довольно простым вопросом, но он может дать мне понимание того, что машинное обучение может делать в целом. Благодарность!

5
Как установить количество нейронов и слоев в нейронных сетях
Я новичок в нейронных сетях, и мне было трудно понять две концепции: Как определить количество средних слоев в данной нейронной сети? 1 против 10 или что-то еще. Как определить количество нейронов в каждом среднем слое? Рекомендуется ли иметь одинаковое количество нейронов в каждом среднем слое или это зависит от применения?

2
Слияние двух разных моделей в Керасе
Я пытаюсь объединить две модели Keras в одну модель и не могу этого сделать. Например, на прилагаемом рисунке я хотел бы получить средний слой измерения 8 и использовать его в качестве входных данных для слоя (снова размера 8) в модели а затем объединить и модель и модель как один модель.А …

2
Как установить batch_size, steps_per epoch и шаги валидации
Я начинаю изучать CNN, используя Keras. Я использую theano бэкэнд. Я не понимаю, как установить значения: размер партии, шагов за эпоху, validation_steps. Каким должно быть значение batch_size, количество шагов на эпоху и количество этапов проверки, если у меня 240 000 образцов в обучающем наборе и 80 000 в наборе испытаний?

6
Методы машинного обучения для оценки возраста пользователей на сайтах Facebook, которые им нравятся
У меня есть база данных из приложения Facebook, и я пытаюсь использовать машинное обучение для оценки возраста пользователей на основе того, какие сайты Facebook им нравятся. Есть три важных характеристики моей базы данных: распределение по возрасту в моем обучающем наборе (в сумме 12 тыс. пользователей) перекошено в сторону более молодых …

2
LightGBM против XGBoost
Я пытаюсь понять, что лучше (точнее, особенно в задачах классификации) Я искал статьи, сравнивающие LightGBM и XGBoost, но нашел только две: https://medium.com/implodinggradients/benchmarking-lightgbm-how-fast-is-lightgbm-vs-xgboost-15d224568031 - что касается только скорости, но не точности. https://github.com/Microsoft/LightGBM/wiki/Experiment - от авторов LightGBM, и неудивительно, что LightGBM выигрывает там. В моих тестах я получаю практически одинаковый AUC для …
25 xgboost 

4
Существует ли простой способ параллельного запуска pandas.DataFrame.isin?
У меня есть программа моделирования и скоринга, которая активно использует DataFrame.isinфункцию панд, просматривая списки «похожих» на Facebook записей отдельных пользователей на каждой из нескольких тысяч конкретных страниц. Это самая трудоемкая часть программы, в большей степени, чем части моделирования или оценки, просто потому, что она работает только на одном ядре, а …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.