Какие методы существуют для настройки гиперпараметров ядра графов SVM?

У меня есть некоторые данные, которые существуют на графе . Вершины принадлежат одному из двух классов , и я заинтересован в обучении SVM различать эти два класса. Одним подходящее ядро для этого является в диффузии ядро , где является лапласианом из и является параметром настройки. $G=(V,E)$ $y_i\in\{-1,1\}$ $K=\exp(-\beta L),$ $L$ $G$ $\beta$

Настройка SVM требует выбора гиперпараметров, поэтому я должен настроить Традиционно мы используем перекрестную проверку для этой задачи, но здесь это не представляется целесообразным, так как исключение вершины из изменяет весь граф, возможно даже увеличивая количество связанных компонентов! Если количество подключенных компонентов изменяется, некоторые вершины становятся недоступными для других, и мы сталкиваемся с набором данных, который отличается от того, с которого мы начали. То есть мы не только пропускаем удаленную вершину , но мы также пропускаем информацию обо всех других вершинах $\theta=(\beta, C).$ $i$ $G$ $i$ $j$ в графе, которые были смежными с этой вершиной.

Основное понятие перекрестной проверки состоит в том, что мы хотели бы приблизить, как будет работать модель, когда она представлена новыми данными. В стандартных задачах пропуск некоторых ваших данных для тестирования не меняет значения остальных данных обучения. Однако в случае данных графика неясно, что значит для модели видеть «новые» данные в настройке CV. Пропуск вершин или ребер может полностью изменить данные. Например, представьте граф который является звездным графом, в котором одна вершина имеет ребер к $S=(V_S,E_S)$ $k$ $k$ $k$ вершины, а все остальные вершины имеют 1 ребро. Пропуск центральной вершины для построения обучающих данных полностью разъединит граф, и матрица ядра будет диагональной! Но, конечно, будет возможно обучить модель на этих данных обучения, представленных в . Что менее ясно, так это то, что это значит для тестирования производительности вне выборки полученной модели. Можно ли пересчитать матрицу ядра для и предоставить это для предсказаний? $S^*$ $S^*$ $S$

Или, в качестве альтернативы, нужно начинать с вычисления матрицы ядра во всей ее полноте и опускать строки и столбцы по мере необходимости для получения матрицы ядра, используемой для оценки SVM? Это создает свои собственные концептуальные проблемы, поскольку включение центрального узла в означает, что каждая вершина достижима из любой другой вершины, а матрица ядра является плотной. Означает ли это включение, что есть утечка информации через сгибы, и смещает выход перекрестной проверки? С одной стороны, данные о пропущенных центральных узлах все еще присутствуют, поскольку пропущенный центральный узел связывает граф. С другой стороны, мы ничего не знаем о ярлыках $S$ $S$ $y$ из пропущенных узлов, поэтому нам может быть удобно, что мы получаем разумно непредвзятые оценки вне выборки при выполнении CV таким способом.

Как выбрать гиперпараметры для задач этого типа? Является ли резюме несовершенным, но приемлемым, или нам нужны специализированные методы? Возможна ли вообще настройка гиперпараметра в моем контексте?

— Sycorax говорит восстановить Монику
источник

Ищите расширение вне выборки для спектральных методов. Я применил некоторые методы классификации изображений в своей диссертации (оглядываясь назад, я бы сделал это иначе). Результаты были интересными, но сами модели были довольно хрупкими и их было нелегко настроить.

— Владислав Довгальец

@xeon Любые рекомендации, с чего начать смотреть на эту литературу?

— Sycorax сообщает, что восстановит Монику

Отказ от ответственности: я не очень знаком с ядрами графов, поэтому этот ответ может быть основан на неправильных предположениях. Я согласен, что пропуск вершин при вычислении матрицы ядра является неоптимальным. Тем не менее, я не уверен, что перекрестная проверка обязательно проблематична. Является ли ваш учебный контекст трансдукцией или индукцией?

$\beta$

$\beta$ $C$ $\beta$ $C$

— Марк Клазен
источник

Марк, спасибо за ваше внимание. Моя проблема индуктивная. Мой инстинкт заключается в том, что вы правы, и что мы вычисляем полную матрицу ядра для всех данных, а затем опускаем строки и столбцы, необходимые для создания ядра CV. Вы случайно не знаете каких-либо ссылок на этот эффект?

— Сикоракс говорит восстановить Монику

Не сразу, но у меня есть коллеги, работающие над сопоставимыми проблемами (спектральная кластеризация ядра), которые я могу задать. Может быть, у них есть ссылки и / или лучшие идеи. Буду обновлять, когда узнаю больше.

— Марк Клазен