Я прошел через код, и я боялся, что не пойму важный момент.Массы моделей Seq2Seq
Я не могу найти матрицу весов модели для кодировщика и декодера, ни там, где они обновляются. Я нашел target_weights, но он, кажется, повторно инициализируется при каждом вызове get_batch(), поэтому я не понимаю, для чего они стоят.
Моя фактическая цель состоит в том, чтобы объединить два скрытых состояния двух исходных кодеров для одного декодера, применяя линейное преобразование с весовой матрицей, которое мне нужно будет обучать вместе с моделью (im, построив многотоновую модель), но i не знаю, с чего начать, из-за моей проблемы, упомянутой выше.
Я благодарю вас за любую помощь, которую вы могли бы предоставить.
BG
Спасибо за ваш ответ. Это именно то, что я делаю сейчас :-) Но мои вопросы касались управления весами, которое все еще немного сбивает меня с толку. Наверное, мне просто нужно будет проверить и посмотреть. Хорошего дня. –