Недавно я заинтересовался LSTM и с удивлением узнал, что веса распределяются по времени.
Я знаю, что если вы разделяете веса по времени, то ваши входные временные последовательности могут иметь переменную длину.
С общими весами у вас гораздо меньше параметров для тренировки.
Насколько я понимаю, причина, по которой можно обратиться к LSTM по сравнению с другим методом обучения, заключается в том, что вы считаете, что в ваших данных есть какая-то временная / последовательная структура / зависимость, которую вы хотели бы изучить. Если вы пожертвуете переменной «люкс» переменной длины и примете большое время вычислений, разве RNN / LSTM без общих весов (т. Е. Для каждого временного шага у вас разные весы) будут работать лучше или я чего-то упускаю?