Исследовательский анализ пространственно-временных ошибок прогноза


13

Данные: я недавно работал над анализом стохастических свойств пространственно-временного поля ошибок прогноза производства энергии ветра. Формально можно сказать, что это процесс индексируются дважды во времени (сtиh) и один раз в пространстве (p), гдеH- это количество времени просмотра вперед (равно примерно24, регулярно выбирается),T- это число «время прогноза» (т. е. время выдачи прогноза, около 30000 в моем случае, с регулярной выборкой), аn- количество пространственных позиций (без сетки, около 300 в моем случае). Поскольку это процесс, связанный с погодой, у меня также есть много прогнозов погоды, анализа, метеорологических измерений, которые можно использовать.

(εT+час|Tп)Tзнак равно1...,T;часзнак равно1,...,ЧАС,пзнак равноп1,...,пN
TчаспH24TN

Вопрос: Можете ли вы описать мне предварительный анализ данных такого типа, чтобы понять природу структуры взаимозависимости (которая может быть не линейной) процесса, чтобы предложить его точное моделирование.


это очень интересный вопрос Можно ли играть хотя бы с подмножеством анонимных данных? И как формировались прогнозы, какая модель использовалась?
mpiktas

1
@mpiktas спасибо, вы можете предположить, что он был сгенерирован подходящим моделированием AR (по одному для каждой ветровой электростанции), это не сильно изменит проблему. Извините, с этими данными слишком много проблем с конфиденциальностью, они не могут предоставить вам ничего, даже анонимно ...
Робин Джирард

Ответы:


6

Мне кажется, что у вас достаточно данных, чтобы смоделировать зависимость от пространственно-временного и метеорологического влияний как смещения ошибок прогноза (т. Е. Тенденции систематически переоценивать / недооценивать [первый момент]), так и их дисперсию [второй момент].

Для исследования предвзятости я бы просто сделал много диаграмм рассеяния, тепловых карт или гексбинов. Для исследования изменчивости я бы просто возместил исходные ошибки, а затем снова сделал много диаграмм рассеяния, тепловых карт или гексбинов. Это, конечно, не совсем беспроблемно, если у вас много предубеждений, но все же может помочь увидеть закономерности гетероскедастичности под влиянием ковариат.

Rmboostthсплайны тензорных произведений для пространственно-временных эффектов или плавных взаимодействий метеорологических эффектов и т. д.) для различных моментов и одновременное выполнение выбора терминов для получения скупой и интерпретируемой модели. Можно надеяться, что термины в этой модели достаточны для учета пространственно-временной автокорреляционной структуры ошибок прогноза, но вам, вероятно, следует проверить остатки этих моделей на автокорреляцию (т. Е. Посмотреть на некоторые вариограммы и АКФ).


+1 Спасибо, Фабиан, Вы совершенно правы, проблема не в том, что мне не хватает данных. Обратите внимание, что мой вопрос особенно касается структуры взаимозависимости. Диаграммы рассеяния, тепловые карты и гексбиновые графики являются хорошими инструментами, если они используются для хорошей цели. Я думаю, что общая аддитивная модель также может быть очень мощной, есть замечательная статья Brillinger, дающая хорошие советы о том, как использовать GAM.
Робин Жирар

5

Мы (коллега и я) наконец-то написали статью об этом. Подводя итог, мы предложили два решения для количественной оценки и предоставления статистической сводки (пространственно-временного) распространения ошибок вдоль Дании и в будущем.

  • В первом из них мы вычисляем корреляцию между всеми парами ветряных электростанций и для всех пар времени ожидания (это функция от 4 переменных). Когда пара зафиксирована, мы показали, что у корреляционной функции есть локальные максимумы вдоль времен просмотра, мы сказали, что это распространение! Временной масштаб, связанный с данной парой ветряных электростанций, определяется временной задержкой, для которой получается этот локальный максимум. Построение для всех пар ветряных электростанций локальных максимумов корреляции, временной задержки, которая позволяет получить это значение, и пространственного вектора, соединяющего ветряные электростанции, дает правую сторону рисунка 1.

фигура 1

Это может быть использовано для вычисления глобального вектора распространения, то есть некоторого вида пространственного среднего скоростей распространения между парами. Часть этого показана в левой части рисунка 1, и угадайте, какое распространение ошибок имеет Запад-Восток в Денамрке (хорошо, это не было большим сюрпризом :)). Мы также проанализировали это условно для различных метеорологических ситуаций, чтобы показать связь между распространением и ветром (скорость, направление).

  • ttR2

фигура 2

Во втором случае мы наблюдали, что средняя временная скорость распространения имеет величину, аналогичную величине, полученной с помощью пространственного среднего в первом случае. Если вы хотите посмотреть на эту работу более серьезно, статья здесь .


+1 Спасибо, что поделились. (Извините, я пропустил вопрос, когда он первоначально появился.) Вы рассматривали возможность построения кросс-вариограмм к прогнозному времени? Наиболее эффективными из них не были бы традиционные сглаженные облака направленной вариограммы; вместо этого используйте двумерные графики плотности облаков вариограммы. Затем вы можете построить кросс-вариограммы из них, чтобы исследовать временные отношения. Ваши результаты распространения должны выскочить из такого анализа автоматически.
whuber

@whuber Спасибо за комментарий, я вряд ли верю, что вы пропустили более 2 или 3 вопроса на этом сайте :). Ваша идея с вариограммой кажется связанной (я не очень-то привык к использованию вариограммы, я часто верю, что все, что можно сформулировать с помощью вариограммы, имеет практический эквивалент с ковариациями ...), я подумаю об этом.
Робин Жирар

Вы правы, что во многих приложениях ковариации эквивалентны вариограммам. Тем не менее, облако вариограммы предоставляет как визуальное, так и концептуальное дополнение, которое, по-видимому, не предлагает работа исключительно с ковариационными функциями - это немного похоже на просмотр диаграмм рассеяния вместо просто матриц корреляции: иногда вы можете видеть шаблоны, которые числа не ясно показывают ,
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.