Ты прав. Слабость подхода Йохансена заключается в том, что он чувствителен к длине лага. Таким образом, длина лага должна определяться систематически. Ниже приводится нормальный процесс, используемый в литературе.
а. Выберите максимальную длину лага "м" для модели VAR. Обычно для годовых данных это значение равно 1, для квартальных данных - 4, а для ежемесячных данных - 12.
б. Запустите модель VAR на уровне. Например, если данные являются ежемесячными, запустите модель VAR для длин лагов 1,2, 3, .... 12.
с. Найдите AIC (информационный критерий Акайке) и SIC (информационный критерий Шварца) [есть также другие критерии, такие как HQ (информационный критерий Ханнана-Куина), FPE (окончательный критерий ошибки предсказания), но в основном используются AIC и SIC) для VAR модель для каждой длины лага. Выберите длину лага, которая минимизирует AIC и SIC для модели VAR. Обратите внимание, что SIC и AIC могут давать противоречивые результаты.
д. Наконец, вы ДОЛЖНЫ подтвердить, что для длины задержки, выбранной на шаге c, остатки модели VAR не коррелированы [используйте тесты Portmanteau для автокорреляций]. Возможно, вам придется изменить длину лага, если есть автокорреляция. Обычно новички в эконометрике временных рядов имеют тенденцию пропускать шаг d.
е. Для коинтеграции длина лага - это длина лага, выбранная из шага d минус один (поскольку мы сейчас запускаем модель с первым отличием, в отличие от уровня, когда мы использовали VAR для определения длины лага).