Я делаю диагонализацию Ланцоша большой разреженной матрицы (~ 2 миллиона элементов). Почти все шаги в алгоритме Ланцкоса выполняются параллельно на графическом процессоре, за исключением диагонализации матрицы Ланцоша для проверки сходимости. Для этого я использовал алгоритм TQLI из Numeric Recipes. Существуют ли методы нахождения собственной системы трехдиагональной матрицы, которые параллельны или легко распараллеливаемы? Существует ли параллельная версия TQLI?