Я энтузиаст программирования, поэтому, пожалуйста, извините меня и помогите заполнить любые пробелы. Из того, что я понимаю, хорошие результаты из нейронной сети требуют сигмоида и либо изучают скорость или скорость шага (в зависимости от метода обучения), которые должны быть установлены правильно вдоль с обучающими итерациями.Аппроксимация лучших настроек для нейронной сети?
Несмотря на то, что существует много знаний об этих значениях и принципах обобщения и избегания чрезмерной подгонки, похоже, что они не фокусируются на их связи с данными и сетью.
Я заметил, что количество образцов, нейронов и входов, похоже, масштабируется, где эти настройки лучше всего приземляются. (более или менее входы могут изменить, например, итерации).
Есть математический способ найти хорошую (приблизительную) отправную точку для сигмоида, узнать скорость, шаги, итерации и т. Д. На основе известных значений, таких как образцы, входы, выходы, слои и т. Д.?
Если ваша модель обратного распространения, я могу сказать вам, что вам нужен только один скрытый слой. Что касается других вещей, о которых вы спрашиваете, я уверен, что правильные параметры зависят от (и настраиваются) входных и выходных пространств. По крайней мере, это то, что я помню из литературы 10 лет назад. – Robinson
Даже если ваша модель использует обратное распространение, вы можете использовать более одного скрытого слоя. В то время как нейронные сети с одним скрытым слоем являются универсальными аппроксиматорами, большее количество слоев может быть полезным в зависимости от того, какую функцию активации вы используете, см. Глубокое обучение. – Cesar