В настоящее время я экспериментирую с различными алгоритмами RL в таких средах, как те, что находятся в OpenAI gym. В настоящее время я просто использую среду и код, которые я реализовал сам, потому что он помогает мне понять, как все работает.Хорошие способы регистрации/хранения результатов/показателей усиления обучения в экспериментах на питоне?
Теперь я ищу хороший способ регистрации и хранения всех данных, созданных во время нескольких эпизодов.
Несколько примеров:
- государства посетил
- потери моей нейронной сети
- число шагов/эпизод
- награду за episide
Я думал об использовании питона хотя он, вероятно, предназначен для другого использования. Также я подумал об использовании шаблона наблюдателя для толкания событий (агент принимает действие, новое состояние, конец эпизода и т. Д.) Для разных регистраторов, которых я прикрепляю в качестве наблюдателей.
Есть ли лучшие способы реализовать эту функциональность? Или, может быть, есть хороший код примера, который я могу узнать?
Является ли использование модуля регистрации хорошей идеей? Я подумал, что это может быть полезно, потому что я могу контролировать, что регистрируется или включается или выключается. Но если я использую шаблон наблюдателя, мне это действительно не нужно.
С уважением Дэвид