Наука о данных

Вопросы и ответы для специалистов по науке о данных, специалистов по машинному обучению и тех, кто хочет больше узнать об этой области

4
Всегда ли градиентный спуск сходится к оптимальному?
Мне интересно, есть ли сценарий, при котором градиентный спуск не сходится к минимуму. Я осознаю, что градиентный спуск не всегда может привести к глобальному оптимуму. Я также знаю, что он может отличаться от оптимального, если, скажем, размер шага слишком велик. Тем не менее, мне кажется, что если он отклоняется от …

1
Прогнозирование временных рядов с использованием LSTM: важность обеспечения устойчивости временных рядов
В этой ссылке на Стационарность и разность было упомянуто, что модели, подобные ARIMA, требуют стационарного временного ряда для прогнозирования, поскольку его статистические свойства, такие как среднее значение, дисперсия, автокорреляция и т. Д., Постоянны во времени. Поскольку RNN обладают лучшей способностью изучать нелинейные отношения ( согласно приведенному здесь: «Обещание повторяющихся нейронных …

2
Какая польза от torch.no_grad в pytorch?
Я новичок в Pytorch и начал с этим кодом GitHub . Я не понимаю комментарий в строке 60-61 в коде "because weights have requires_grad=True, but we don't need to track this in autograd". Я понял, что мы упоминаем requires_grad=Trueпеременные, которые нам нужны для вычисления градиентов для использования автограда, но что …
21 pytorch 

4
Как получить точность, F1, точность и отзыв, для модели Keras?
Я хочу вычислить точность, отзыв и оценку F1 для моей двоичной модели KerasClassifier, но не нашел никакого решения. Вот мой фактический код: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) …

4
В чем разница между начальной загрузкой и перекрестной проверкой?
Раньше я применял K-кратную перекрестную проверку для надежной оценки моих моделей машинного обучения. Но я знаю о существовании метода начальной загрузки для этой цели. Однако я не вижу основной разницы между ними с точки зрения оценки производительности. Насколько я вижу, при начальной загрузке также производится определенное количество случайных обучающих + …

1
Что значит «делиться параметрами между объектами и классами»
При чтении этой статьи есть строка, в которой говорится, что «линейные классификаторы не разделяют параметры между функциями и классами». В чем смысл этого утверждения? Означает ли это, что линейные классификаторы, такие как логистическая регрессия, нуждаются во взаимно независимых признаках?

7
Почему большинство опубликованных работ по медицинской визуализации пытаются уменьшить количество ложных срабатываний?
При обработке медицинских изображений большинство опубликованных работ пытаются снизить частоту ложных срабатываний (FPR), тогда как в действительности ложные отрицания более опасны, чем ложные срабатывания. Что за этим стоит?

2
Предсказание слова с использованием модели Word2vec
Принимая во внимание предложение: «Когда я открываю ?? дверь он начинает нагрев автоматически» Я хотел бы получить список возможных слов в ?? с вероятностью. Основная концепция, используемая в модели word2vec, заключается в том, чтобы «предсказать» слово в заданном окружающем контексте. Как только модель построена, какова правильная операция векторов контекста, чтобы …

2
Выбор между TensorFlow или Theano в качестве бэкэнда для Keras
Keras поддерживает как TensorFlow, так и Theano в качестве бэкенда: каковы плюсы / минусы выбора одного против другого, кроме того факта, что в настоящее время не все операции реализованы с бэкэндом TensorFlow?

3
Начинаю ли я свою карьеру в качестве Data Scientist, нужен ли опыт разработки ПО? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Data Stack Exchange. Закрыто 5 лет назад . Я студент магистратуры в Университете Эдинбурга, специализируюсь на машинном обучении и обработке естественного языка. У меня было несколько практических …

14
Конференции по науке о данных?
Этот вопрос похож на вопрос Статистических конференций в CrossValidated. Каковы наиболее значимые ежегодные конференции по науке о данных? Правила: Включить ссылку на конференцию Пожалуйста, включите ссылки для выступлений (будь то YouTube, сайт конференции или какой-либо другой сайт потокового видео)
20 community 

4
Как я могу получить меру семантического сходства слов?
Каков наилучший способ выяснить семантическое сходство слов? Word2Vec хорошо, но не идеально: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # Cold is much closer to 'hot' …

3
Извлечение ключевого слова / фразы из текста с использованием библиотек Deep Learning
Возможно, это слишком широко, но я ищу ссылки на то, как использовать глубокое обучение в задаче обобщения текста. Я уже реализовал суммирование текста, используя стандартные частотно-частотные подходы и ранжирование предложений, но я хотел бы изучить возможность использования методов глубокого обучения для этой задачи. Я также рассмотрел некоторые реализации, представленные на …

3
В чем разница между классификацией текста и тематическими моделями?
Я знаю разницу между кластеризацией и классификацией в машинном обучении, но я не понимаю разницу между классификацией текста и тематическим моделированием для документов. Могу ли я использовать моделирование темы поверх документов, чтобы определить тему? Могу ли я использовать методы классификации для классификации текста внутри этих документов?

2
Керас против тф.керас
Я немного запутался в выборе между Keras (keras-team / keras) и tf.keras (tenorflow / tenorflow / python / keras /) для моего нового исследовательского проекта. Существует дискуссия о том, что Keras не принадлежит никому, поэтому люди будут рады внести свой вклад, и в будущем будет намного легче управлять проектом. С …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.