Вопросы с тегом «self-study»

Обычное упражнение из учебника, курса или теста, используемое для занятий или самостоятельных занятий. Политика этого сообщества состоит в том, чтобы «предоставлять полезные советы» для таких вопросов, а не полные ответы.

1
Градиенты для скипграмм word2vec
Я изучаю проблемы письменных заданий в классе глубокого обучения Стэнфордского НЛП http://cs224d.stanford.edu/assignment1/assignment1_soln Я пытаюсь понять ответ для 3а, где они ищут производную от вектора для центрального слова. Предположим, вам дан вектор предсказанного слова соответствующий центральному слову c для скипграммы, а предсказание слова выполняется с помощью функции softmax, найденной в моделях …

2
Несмещенная оценка параметра Пуассона
Количество несчастных случаев в день - это случайная переменная Пуассона с параметром , в 10 случайно выбранных дней число несчастных случаев было отмечено как 1,0,1,1,2,0,2,0,0,1, что будет быть беспристрастным оценщиком ?e λλλ\lambdaеλeλe^{\lambda} Я попытался сделать это следующим образом: мы знаем, что , но . Тогда каков будет требуемый объективный оценщик?Е( …


2
Помощь в максимизации ожидания от бумаги: как включить предварительное распространение?
Вопрос основан на статье под названием «Восстановление изображений в диффузной оптической томографии с использованием связанной излучательной транспортно-диффузионной модели». Ссылка на скачивание Авторы применяют EM-алгоритм с разреженности неизвестного вектора \ mu для оценки пикселей изображения. Модель даетсяl1l1l_1μμ\mu y=Aμ+e(1)(1)y=Aμ+ey=A\mu + e \tag{1} Оценка дана в уравнении (8) как μ^=argmaxlnp(y|μ)+γlnp(μ)(2)(2)μ^=arg⁡maxln⁡p(y|μ)+γln⁡p(μ)\hat{\mu} = \arg max …

2
Преобразование статистики заказов
X1,...,XnX1,...,XnX_1, ... , X_nY1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) Я начал эту проблему, установив Тогда будет распределяться как а будет распределяться как Плотности можно легко найти как и{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}max(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}мин(Yn,Xn)=Z(1)1-(1-z( зa)2 н(Za)2N(\frac{z}{a})^{2n}мин ( YN, XN) = Z( 1 )мин(YN,ИксN)знак равноZ(1)\min(Y_n,X_n)= Z_{(1)}fZ 1 (z)=(2n)(1-z1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n} fZ ( 2 n …

1
инвариантность корреляции к линейному преобразованию:
Это на самом деле является одной из проблем в 4-й редакции «Базовой эконометрики» Гуджарати (Q3.11), в которой говорится, что коэффициент корреляции инвариантен относительно изменения происхождения и масштаба, то есть где , , , - произвольные постоянные.corr(aX+b,cY+d)=corr(X,Y)corr(aX+b,cY+d)=corr(X,Y)\text{corr}(aX+b, cY+d) = \text{corr}(X,Y)aaabbbcccddd Но мой главный вопрос заключается в следующем: пусть и являются парными …

3
Как доказать, что
Я пытался установить неравенство |Ti|=∣∣Xi−X¯∣∣S≤n−1n−−√|Ti|=|Xi−X¯|S≤n−1n\left| T_i \right|=\frac{\left|X_i -\bar{X} \right|}{S} \leq\frac{n-1}{\sqrt{n}} где - среднее значение выборки, а - стандартное отклонение выборки, то есть S = \ sqrt {\ frac {\ sum_ {i = 1} ^ n \ left (X_i - \ bar {X} \ right) ^ 2} {n-1}} .X¯X¯\bar{X}SSSS=∑ni=1(Xi−X¯)2n−1−−−−−−−−−√S=∑i=1n(Xi−X¯)2n−1S=\sqrt{\frac{\sum_{i=1}^n \left( X_i …

1
Как повышение градиента, как градиентный спуск?
Я читаю полезную статью в Википедии о повышении градиента ( https://en.wikipedia.org/wiki/Gradient_boosting ) и пытаюсь понять, как / почему мы можем аппроксимировать невязки с помощью шага наискорейшего спуска (также называемого псевдоградиентом). ). Кто-нибудь может дать мне интуицию о том, как самый крутой спуск связан / похож на остатки? Помощь очень ценится!

4
Ожидаемое количество бросков костей требует, чтобы сумма была больше или равна K?
6-сторонняя матрица катится итеративно. Какое ожидаемое количество бросков требуется, чтобы сумма была больше или равна K? Перед редактированием P(Sum>=1 in exactly 1 roll)=1 P(Sum>=2 in exactly 1 roll)=5/6 P(Sum>=2 in exactly 2 rolls)=1/6 P(Sum>=3 in exactly 1 roll)=5/6 P(Sum>=3 in exactly 2 rolls)=2/6 P(Sum>=3 in exactly 3 rolls)=1/36 P(Sum>=4 in …

1
Постоянно ли ЭМ-алгоритм оценивает параметры в модели гауссовой смеси?
Я изучаю модель гауссовой смеси и сам задаю этот вопрос. Предположим, что базовые данные генерируются из смеси гауссовского распределения и у каждого из них есть средний вектор \ mu_k \ in \ mathbb {R} ^ p , где 1 \ leq k \ leq K, и каждый из них имеет …

1
Если являются независимой бета-версией, тогда show также является бета-версией
Вот проблема, которая возникла на семестровом экзамене в нашем университете несколько лет назад, и я пытаюсь ее решить. Если являются независимыми случайными переменными с плотностями и соответственно, то покажите, что следует за .X1,X2X1,X2X_1,X_2ββ\betaβ(n1,n2)β(n1,n2)\beta(n_1,n_2)β(n1+12,n2)β(n1+12,n2)\beta(n_1+\dfrac{1}{2},n_2)X1X2−−−−−√X1X2\sqrt{X_1X_2}β(2n1,2n2)β(2n1,2n2)\beta(2n_1,2n_2) Я использовал метод чтобы получить плотность следующим образом: Y=X1X2−−−−−√Y=X1X2Y=\sqrt{X_1X_2}fY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫1y1x2(1−x2)n2−1(1−y2x2)n2−1dxfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫y11x2(1−x2)n2−1(1−y2x2)n2−1dxf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_y^1\dfrac{1}{x^2}(1-x^2)^{n_2-1}(1-\dfrac{y^2}{x^2})^{n_2-1}dx Я потерян в этот момент на самом деле. …

1
Решение к упражнению 2.2a.16 «Надежная статистика: подход, основанный на функциях влияния»
На странице 180 Робастной статистики: подход, основанный на функциях влияния, можно найти следующий вопрос: 16: Показать, что для инвариантных по местоположению оценок всегда . Найдите соответствующую верхнюю границу для точки развала конечной выборки , причем в случае, когда нечетно или четно.ε∗≤12ε∗≤12\varepsilon^*\leq\frac{1}{2}ε∗nεn∗\varepsilon^*_nnnnnnn Вторая часть (после периода) на самом деле тривиальна (учитывая …

1
Разве отрицательный бином не выражен, как в экспоненциальном семействе, если есть 2 неизвестных?
У меня было домашнее задание, чтобы выразить отрицательное биномиальное распределение как экспоненциальное семейство распределений, учитывая, что параметр дисперсии был известной константой. Это было довольно легко, но я удивлялся, почему они требуют, чтобы мы держали этот параметр фиксированным. Я обнаружил, что не могу придумать способ привести его в правильную форму с …

1
Получение векторов коинтеграции методом Йохансена
Я пытаюсь лучше понять метод Йохансена, поэтому разработал пример 3.1, приведенный в книге «Метод вероятностного вывода-коинтеграции-авторегрессии-эконометрики», в котором мы имеем три процесса: X1t=∑i=1tϵ1i+ϵ2tX1t=∑i=1tϵ1i+ϵ2tX_{1t} = \sum_{i=1}^t \epsilon_{1i} + \epsilon_{2t} X2t=α∑i=1tϵ1i+ϵ3tX2t=α∑i=1tϵ1i+ϵ3t X_{2t} = \alpha \sum_{i=1}^t \epsilon_{1i} + \epsilon_{3t} X3t=ϵ4tX3t=ϵ4t X_{3t} = \epsilon_{4t} поэтому векторы коинтеграции должны быть [a, -1, 0] и [0, …

1
Что такое CDF из двух выборок из и из одностороннего теста Колмогорова-Смирнова?
Я пытаюсь понять, как получить ppp для одностороннего теста Колмогорова-Смирнова , и пытаюсь найти CDF для D+n1,n2Dn1,n2+D^{+}_{n_{1},n_{2}} и D−n1,n2Dn1,n2−D^{-}_{n_{1},n_{2}} в случае двух выборок. Ниже приводится в нескольких местах как CDF для D+nDn+D^{+}_{n} в случае с одним примером: p+n(x)=P(D+n≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jpn+(x)=P(Dn+≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jp^{+}_{n}\left(x\right) = \text{P}\left(D^{+}_{n} \ge x | \text{H}_{0}\right) = x\sum_{j=0}^{\lfloor n\left(1-x\right)\rfloor}{ \binom{n}{j} \left(\frac{j}{n}+x\right)^{j-1}\left(1 - …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.