Почему статистики определяют случайные матрицы?


18

Я изучал математику десять лет назад, поэтому у меня есть знания по математике и статистике, но этот вопрос меня убивает.

Этот вопрос все еще немного философский для меня. Почему статистики разработали все виды методов для работы со случайными матрицами? Я имею в виду, случайный вектор не решил проблему? Если нет, каково среднее значение различных столбцов случайной матрицы? Андерсон (2003, Wiley) считает случайный вектор частным случаем случайной матрицы только с одним столбцом.

Я не вижу смысла в случайных матрицах (и я уверен, что это потому, что я не знаю). Но терпите меня. Представьте, что у меня есть модель с 20 случайными величинами. Если я хочу вычислить объединенную функцию вероятности, почему я должен изображать их в виде матрицы, а не вектора?

Что мне не хватает?

ps: извините за плохо помеченный вопрос, но для случайной матрицы не было тегов, и я пока не могу создать один!

изменить: изменил матрицу на матрицы в заголовке


1
Я думаю, что вы прекрасно концептуально думаете об этом как о случайном векторе, который был преобразован в матрицу.
Мэтью Ганн

2
Возможно актуально: en.wikipedia.org/wiki/Random_projection .
dsaxton

9
Вы могли бы также спросить, почему матрицы представляют какой-либо интерес. Совершенно естественно рассматривать как случайную матрицу, используемую для представления явления, наблюдаемого или измеряемого в реальном мире. Это приводит к множеству возможных типов и моделей для случайных матриц, начиная от матриц смежности случайных графов и заканчивая выборочными ковариационными матрицами и многим другим.
whuber

2
@Aksakal Я думаю, что точка зрения ОП заключается в том, когда полезно анализировать что-либо как случайные матрицы. например, в классификации изображений вы обычно превращаете свои матрицы изображений в векторы ... нет матрицы "анализа". поэтому лучший ответ на данный момент - это лучший ответ: например, ковариационная матрица должна быть положительной полуопределенной - если вы хотите моделировать случайные ковариационные матрицы, проще работать со спецификацией матрицы, чем с вектором.
seanv507

2
Случайные матрицы - это просто частный случай случайных тензоров.
Anony-Mousse -Восстановить Монику

Ответы:


23

Это зависит от того, в какой области вы находитесь, но один из больших начальных толчков для исследования случайных матриц пришел из атомной физики и был впервые осуществлен Вигнером. Вы можете найти краткий обзор здесь . В частности, именно собственные значения (которые являются энергетическими уровнями в атомной физике) случайных матриц вызвали тонны интереса, потому что корреляции между собственными значениями дали представление о спектре излучения процессов ядерного распада.

В последнее время в этой области произошел большой всплеск, с появлением распределения Трейси-Уидома для наибольших собственных значений случайных матриц, а также с потрясающими связями с внешне несвязанными полями, такими как теория плиток , статистическая физика, интегрируемая системы , явления КПЗ , случайная комбинаторика и даже гипотеза Римана . Вы можете найти еще несколько примеров здесь .

Для более практичных примеров естественный вопрос о матрице векторов строк - как могут выглядеть его компоненты PCA. Вы можете получить эвристические оценки для этого, предполагая, что данные поступают из некоторого распределения, а затем просматривая собственные значения ковариационной матрицы, которые будут предсказаны из универсальности случайной матрицы : независимо (в пределах разумного) от распределения ваших векторов, предельного распределения Собственные значения всегда будут приближаться к набору известных классов. Вы можете думать об этом как о типе CLT для случайных матриц. Смотрите эту статью для примеров.


Спасибо за Ваш ответ. Я подозревал, что это может быть связано с некоторыми математическими подробностями. Но теперь все это имеет смысл, физика всегда была вокруг математики и наоборот.
Эдуардо

Бумага Вигнера была в середине 1950-х годов, бумага Уишарта - в конце 1920-х годов. Так что, на мой взгляд, сложно утверждать, что Вигнер дал первый большой толчок.
Аксакал

13

Вам, кажется, удобно работать с приложениями случайных векторов. Например, я имею дело с такими случайными векторами каждый день: процентные ставки разных теноров. У Федерального резервного банка есть серия H15 , посмотрите казначейские векселя на 4 недели, 3 месяца, 6 месяцев и 1 год. Вы можете представить эти 4 ставки как вектор с 4 элементами. Это также довольно случайно, посмотрите на исторические ценности на графике ниже.

введите описание изображения здесь

Как и с любыми случайными числами, мы можем спросить себя: какова ковариация между ними? Теперь вы получаете ковариационную матрицу 4х4. Если вы оцените его на основе данных за один месяц, вы получите 12 различных ковариационных матриц каждый год, если вы хотите, чтобы они не перекрывались. Примерная ковариационная матрица случайных рядов сама по себе является случайным объектом, см. Статью Вишарта «ОБОБЩЕННОЕ РАСПРЕДЕЛЕНИЕ МОМЕНТА ПРОДУКТА В ОБРАЗЦАХ НОРМАЛЬНОГО МНОГООБРАЗНОГО НАСЕЛЕНИЯ». сюда . Существует распределение называется его.

Это один из способов добраться до случайных матриц. Неудивительно, что теория случайных матриц (RMT) используется в финансах, как вы можете видеть сейчас.


1
Вы упомянули оценку «данных за один месяц», вы имеете в виду «ежедневные данные за один месяц»?
Джон

1
@ Джон, в этом конкретном примере, да, ежедневно. Однако некоторые ряды измеряются в течение дня, например, цены на акции. Если у вас есть портфель акций, вы можете получить внутрисуточные ковариационные матрицы на очень высоких частотах.
Аксакал

3
+1. Перефразируя здесь, я думаю, что одним из способов мотивации случайных матриц является то, что в этих случаях нас часто интересует связь между (не только внутри) случайными векторами. Это естественно мотивирует думать о матрицах вместо векторов.
Клифф AB

@Aksakal Упомянутые вами данные поступают как ежемесячно, так и ежедневно. До того, как вы отредактировали пост, я обнаружил, что это сбивает с толку, поскольку не имеет смысла оценивать ковариационную матрицу, используя месячные данные за месяц.
Джон

@ Джон, вы можете оценить ковариационную матрицу на ежемесячных или еженедельных данных, перекрывающихся или не перекрывающихся и т. Д. Нет единственно правильного способа сделать это.
Аксакал

8

В теоретической физике случайные матрицы играют важную роль в понимании универсальных особенностей энергетических спектров систем с определенными симметриями.

Мой опыт в теоретической физике может привести к тому, что я представлю здесь немного предвзятую точку зрения, но я бы даже зашел так далеко, чтобы предположить, что популярность теории случайных матриц (RMT) возникла благодаря ее успешному применению в физике.

Не вдаваясь в подробности, например, энергетические спектры в квантовой механике можно получить путем вычисления собственных значений гамильтониана систем, которые можно выразить в виде эрмитовой матрицы. Часто физики не интересуются конкретными системами, но хотят знать, каковы общие свойства квантовых систем, обладающих хаотическими свойствами, что приводит к тому, что значения эрмитовой гамильтоновой матрицы заполняют пространство матрицы эргодически при изменении энергии или других параметров ( например, граничные условия). Это побуждает рассматривать класс физических систем как случайные матрицы и смотреть на средние свойства этих систем. Я рекомендую литературу по гипотезе Bohigas-Gianonni-Schmidt, если вы хотите погрузиться в это глубже.

Короче говоря, можно, например, показать, что энергетические уровни систем, которые имеют симметрию обращения времени, ведут себя универсально иначе, чем энергетические уровни систем, которые не имеют симметрии обращения времени (что происходит, например, при добавлении магнитного поля). Фактически довольно короткий расчет с использованием гауссовских случайных матриц может показать, что уровни энергии имеют тенденцию быть по-разному близкими в обеих системах.

Эти результаты могут быть расширены и помогают понять также другие симметрии, которые оказали значительное влияние на различные области, такие как физика элементарных частиц или теория мезоскопического транспорта, а затем даже на финансовых рынках.


1
вот почему я бросил физику :) слишком много "повреждения головного мозга"
Аксакал

Статистикам нравится Вишарт, где раньше были атомщики.
kjetil b halvorsen

5

Линейная карта - это карта между векторными пространствами. Предположим, у вас есть линейная карта, и вы выбрали базы для ее области и пространства диапазонов. Затем вы можете написать матрицу, которая кодирует линейную карту. Если вы хотите рассмотреть случайные линейные отображения между этими двумя пространствами, вам следует придумать теорию случайных матриц. Случайная проекция - простой пример такой вещи.

Также в физике есть матричные / тензорные объекты. Тензор вязких напряжений является одним из таких (среди настоящего зоопарке). В почти однородных вязкоупругих материалах может быть полезно моделировать деформации (упругие, вязкие и т. Д.) И, следовательно, точечные напряжения как случайный тензор с малой дисперсией. Хотя в этом напряжении / деформации есть смысл «линейной карты», более честно было бы описать это применение случайных матриц как рандомизацию чего-то, что уже было матрицей.


4

Сжатие восприятия как приложение в обработке изображений опирается на случайные матрицы в качестве комбинированных измерений 2D-сигнала. Специфические свойства этих матриц, а именно когерентность , определены для этих матриц и играют роль в теории.

Грубо упрощенно получается, что минимизация нормы L1 определенного произведения гауссовой матрицы и разреженного входного сигнала позволяет восстановить гораздо больше информации, чем вы могли ожидать.

Наиболее известное раннее исследование в этой области, о котором я знаю, - это работа Университета Райса: http://dsp.rice.edu/research/compressive-sensing/random-matrices.

Теория матричных произведений как «измерений сигнала» восходит по крайней мере ко второй мировой войне. Как рассказывал мне мой бывший профессор, индивидуальное тестирование каждого военнослужащего, скажем, на сифилис, было непомерно дорогостоящим. Систематическое смешивание этих образцов (путем смешивания частей каждого образца крови и их тестирования) уменьшит количество раз, необходимое для проведения теста. Это может быть смоделировано как случайный двоичный вектор, умноженный на разреженную матрицу.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.