Существуют ли какие-либо практические правила (или фактические правила), касающиеся минимального, максимального и «разумного» количества ячеек LSTM, которые я должен использовать? В частности, я имею в виду BasicLSTMCell из TensorFlow и num_units
свойства.
Пожалуйста, предположите, что у меня есть проблема классификации, определяемая как:
t - number of time steps
n - length of input vector in each time step
m - length of output vector (number of classes)
i - number of training examples
Например, верно ли, что количество обучающих примеров должно быть больше, чем:
4*((n+1)*m + m*m)*c
где c
количество клеток? Я основал это на этом: Как рассчитать количество параметров сети LSTM? Как я понимаю, это должно дать общее количество параметров, которое должно быть меньше количества обучающих примеров.