Вопросы с тегом «genetics»

Научное изучение принципов наследственности и вариации наследственных признаков между родственными организмами.

6
Выбор функции для «окончательной» модели при выполнении перекрестной проверки в машинном обучении
Я немного запутался в выборе функций и машинном обучении, и мне было интересно, можете ли вы помочь мне. У меня есть набор данных микрочипов, который классифицируется на две группы и имеет 1000 функций. Моя цель - получить небольшое количество генов (мои особенности) (10-20) в сигнатуре, которую я теоретически смогу применить …

6
Насколько вероятно, что я произошла от определенного человека, родившегося в 1300 году?
Другими словами, исходя из следующего, что такое p? Чтобы сделать это математической проблемой, а не антропологией или общественными науками, и упростить задачу, предположим, что пары выбираются с равной вероятностью среди населения, за исключением того, что братья и сестры никогда не спариваются, а пары всегда выбираются из одного и того же …

4
Исправление значений p для нескольких тестов, где тесты коррелированы (генетика)
У меня есть p значений из многих тестов, и я хотел бы знать, есть ли на самом деле что-то существенное после исправления для множественного тестирования. Сложность: мои тесты не являются независимыми. Метод, о котором я думаю (вариант метода продукта Фишера, Зайкин и др., Genet Epidemiol , 2002), нуждается в корреляции …

4
Каковы правильные значения для точности и отзыва в крайних случаях?
Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю статистический …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
Каковы основные компоненты в исследованиях ассоциаций всего генома?
В общегеномных ассоциативных исследованиях (GWAS): Каковы основные компоненты? Почему они используются? Как они рассчитываются? Можно ли провести исследование ассоциации всего генома без использования PCA?
20 pca  genetics  gwas 

1
Как работает квантильная нормализация?
В исследованиях экспрессии генов с использованием микрочипов данные интенсивности должны быть нормализованы, чтобы можно было сравнивать интенсивности между индивидуумами, между генами. Концептуально и алгоритмически, как работает «квантильная нормализация», и как бы вы объяснили это не статистику?

2
Вычисление вероятности совпадения списка генов между последовательностью РНК и набором данных чипа
Надеюсь, кто-то на этих форумах поможет мне с этой основной проблемой в исследованиях экспрессии генов. Я сделал глубокое секвенирование экспериментальной и контрольной ткани. Затем я получил значения кратного обогащения генов в экспериментальном образце для контроля. Эталонный геном имеет ~ 15 000 генов. 3000 из 15000 генов обогащены выше определенного порога …

2
Анализ обогащения по уровню дупликации генов
Биологический Фон Со временем некоторые виды растений имеют тенденцию дублировать свои полные геномы, получая дополнительную копию каждого гена. Из-за нестабильности этой установки многие из этих генов затем удаляются, и геном перестраивается и стабилизируется, готовый к повторному дублированию. Эти события дублирования связаны с событиями видообразования и вторжения, и теория заключается в …

1
Анализ мощности для анализа выживания
Если я предполагаю, что генная сигнатура идентифицирует субъектов с более низким риском рецидива, то есть снижение на 0,5 (коэффициент риска 0,5) частоты событий у 20% населения, и я намерен использовать образцы из ретроспективного когортного исследования. размер выборки необходимо скорректировать на неравные числа в двух гипотетических группах? Например, используя Collett, D: …

3
Зачем использовать возраст в квадрате в качестве ковариации в исследовании генетической ассоциации?
Зачем использовать возраст и квадрат в качестве ковариат в исследовании генетической ассоциации? Я могу понять использование возраста, если он был определен как значимый ковариат, но я не знаю, как использовать возраст в квадрате.

2
Мягкая порога против штрафной санкции Лассо
Я пытаюсь обобщить то, что я до сих пор понимал в многомерном анализе наказаний с помощью многомерных наборов данных, и я все еще борюсь за то, чтобы получить правильное определение мягкого порогового определения по сравнению с штрафом Лассо (или ).L1L1L_1 Точнее, я использовал разреженную регрессию PLS для анализа структуры двухблочных …

3
Расстояние Махаланобиса через PCA, когда
У меня есть матрица , где - количество генов, а - количество пациентов. Любой, кто работал с такими данными, знает, что всегда больше, чем . Используя выбор функции, я получил к более разумному числу, однако все еще больше, чем .p n p n p p nn×pn×pn\times ppppnnnpppnnnppppppnnn Я хотел бы …

1
Как детям удается объединить своих родителей в прогнозе PCA набора данных GWAS?
Возьмите 20 случайных точек в 10000-мерном пространстве с каждой координатой из N( 0 , 1 )N(0,1)\mathcal N(0,1) . Разделите их на 10 пар («пары») и добавьте среднее значение каждой пары («ребенок») к набору данных. Затем проведите PCA по полученным 30 точкам и постройте график PC1 против PC2. Происходит замечательная вещь: …

1
Как рассчитать стандартную ошибку коэффициентов шансов?
У меня есть два набора данных из общих исследований генома ассоциации. Единственная доступная информация - это отношение шансов и значение p для первого набора данных. Для второго набора данных у меня есть отношение шансов, р-значение и частоты аллелей (AFD = болезнь, AFC = контроль) (например, 0,321). Я пытаюсь выполнить мета-анализ …

4
Как рассчитать доверительные интервалы для объединенных нечетных отношений в метаанализе?
У меня есть два набора данных из общих исследований генома ассоциации. Единственной доступной информацией являются нечетные отношения и их доверительные интервалы (95%) для каждого генотипированного SNP. Я хочу создать лесной участок, сравнивая эти два коэффициента, но я не могу найти способ рассчитать комбинированные доверительные интервалы для визуализации суммарных эффектов. Я …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.