Вопросы с тегом «bioinformatics»

Дисциплина на перекрестке компьютерных наук и биологических наук, которая включает в себя организацию, хранение и анализ данных из таких областей, как молекулярная биология, генетика и геномика.

11
Ресурсы для изучения цепей Маркова и скрытых марковских моделей
Я ищу ресурсы (учебные пособия, учебники, веб-трансляции и т. Д.), Чтобы узнать о цепи Маркова и HMM. Я работаю биологом, и в настоящее время я участвую в проекте, связанном с биоинформатикой. Кроме того, каковы необходимые математические знания, необходимые для достаточного понимания моделей Маркова и HMM? Я искал с помощью Google, …

3
Интерпретация логарифмически преобразованного предиктора и / или ответа
Мне интересно, имеет ли это значение при интерпретации того, являются ли логически преобразованными только зависимые, как зависимые, так и независимые, или только независимые переменные. Рассмотрим случай log(DV) = Intercept + B1*IV + Error Я могу интерпретировать IV как процентное увеличение, но как это меняется, когда у меня есть log(DV) = …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
Непрерывное обобщение отрицательного биномиального распределения
Отрицательное биномиальное (NB) распределение определяется на неотрицательных целых числах и имеет функцию вероятности массыИмеет ли смысл рассматривать непрерывное распределение на неотрицательных вещественных числах, определенных той же формулой (заменив k \ in \ mathbb N_0 на x \ in \ mathbb R _ {\ ge 0} )? Биномиальный коэффициент может быть …

4
Что мы можем узнать о человеческом мозге из искусственных нейронных сетей?
Я знаю, что мой вопрос / название не очень конкретны, поэтому я постараюсь прояснить это: Искусственные нейронные сети имеют относительно строгий дизайн. Конечно, как правило, они находятся под влиянием биологии и пытаются построить математическую модель реальных нейронных сетей, но нашего понимания реальных нейронных сетей недостаточно для построения точных моделей. Поэтому …

3
Можно ли интуитивно объяснить алгоритм MIC для обнаружения нелинейных корреляций?
Совсем недавно я прочитал две статьи. Первый - об истории корреляции, а второй - о новом методе, названном максимальным информационным коэффициентом (MIC). Мне нужна ваша помощь, чтобы понять метод MIC для оценки нелинейных корреляций между переменными. Более того, инструкции по его использованию в R можно найти на сайте автора (в …

2
учебные подходы для сильно несбалансированного набора данных
У меня очень несбалансированный набор тестовых данных. Положительный набор состоит из 100 случаев, а отрицательный - 1500 случаев. Что касается обучения, у меня больше кандидатов: в наборе положительных тренировок 1200 случаев, а в наборе отрицательных - 12000 случаев. Для такого сценария у меня есть несколько вариантов: 1) Использование взвешенного SVM …

4
Обрамление отрицательного биномиального распределения для секвенирования ДНК
Отрицательное биномиальное распределение стало популярной моделью для подсчета данных (в частности, ожидаемое количество считываний секвенирования в пределах данной области генома из данного эксперимента) в биоинформатике. Объяснения различаются: Некоторые объясняют это как то, что работает как распределение Пуассона, но имеет дополнительный параметр, предоставляющий больше свободы для моделирования истинного распределения с дисперсией, …

8
Каковы «горячие алгоритмы» для машинного обучения?
Это наивный вопрос от того, кто начинает изучать машинное обучение. Я читаю в эти дни книгу «Машинное обучение: алгоритмическая перспектива» от Марсленда. Я считаю ее полезной в качестве вводной книги, но теперь я хотел бы перейти к продвинутым алгоритмам, которые в настоящее время дают лучшие результаты. В основном меня интересует …

7
Осмысление теории статистики и приложений
Я недавно закончил со степенью магистра по медицинскому и биологическому моделированию, сопровождаемый инженерной математикой в ​​качестве фона. Несмотря на то, что моя образовательная программа включала в себя значительное количество курсов по математической статистике (список приведен ниже), которыми я руководил с довольно высокими оценками, я часто полностью терял взгляд на теорию …

2
Вычисление вероятности совпадения списка генов между последовательностью РНК и набором данных чипа
Надеюсь, кто-то на этих форумах поможет мне с этой основной проблемой в исследованиях экспрессии генов. Я сделал глубокое секвенирование экспериментальной и контрольной ткани. Затем я получил значения кратного обогащения генов в экспериментальном образце для контроля. Эталонный геном имеет ~ 15 000 генов. 3000 из 15000 генов обогащены выше определенного порога …

2
Анализ обогащения по уровню дупликации генов
Биологический Фон Со временем некоторые виды растений имеют тенденцию дублировать свои полные геномы, получая дополнительную копию каждого гена. Из-за нестабильности этой установки многие из этих генов затем удаляются, и геном перестраивается и стабилизируется, готовый к повторному дублированию. Эти события дублирования связаны с событиями видообразования и вторжения, и теория заключается в …

3
Зачем использовать возраст в квадрате в качестве ковариации в исследовании генетической ассоциации?
Зачем использовать возраст и квадрат в качестве ковариат в исследовании генетической ассоциации? Я могу понять использование возраста, если он был определен как значимый ковариат, но я не знаю, как использовать возраст в квадрате.

1
Почему Anova () и drop1 () предоставили разные ответы для GLMM?
У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние два дают одинаковые ответы. Используя кучу сфабрикованных данных, я обнаружил, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
В чем разница между статистикой и информатикой?
Мы всегда говорим, что статистика имеет дело только с данными. Но мы также знаем, что информатика также получает знания от анализа данных. Например, биоинформатики могут полностью обходиться без биостатистики. Я хочу знать, в чем принципиальная разница между статистикой и информатикой.

1
Какая модель глубокого обучения может классифицировать категории, которые не являются взаимоисключающими
Примеры: у меня есть предложение в должностной инструкции: «Старший инженер Java в Великобритании». Я хочу использовать модель глубокого обучения, чтобы предсказать ее как 2 категории: English и IT jobs. Если я использую традиционную классификационную модель, она может предсказать только 1 метку с softmaxфункцией на последнем слое. Таким образом, я могу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.