RNN
Такие архитектуры, как LSTM
и BiLSTM
используются в случаях, когда проблема обучения является последовательной, например, у вас есть видео, и вы хотите знать, о чем идет речь, или вы хотите, чтобы агент прочитал для вас строку документа, которая является изображением текста и не в текстовом формате. Я настоятельно рекомендую вам взглянуть на здесь .
LSTMs
и их двунаправленные варианты популярны, потому что они пытались узнать, как и когда забывать, а когда не использовать ворота в своей архитектуре. В предыдущих RNN
архитектурах исчезновение градиентов было большой проблемой и заставляло эти сети не учиться так много.
Используя Двунаправленный LSTMs
, вы вводите в алгоритм обучения исходные данные один раз от начала до конца и один раз от конца до начала. Здесь есть дебаты, но обычно они учатся быстрее, чем однонаправленный подход, хотя это зависит от задачи.
Да, вы можете использовать их в обучении без учителя, в зависимости от вашей задачи. взгляните на здесь и здесь .