Tensorflow CNN model получить ошибку «NaN потеря во время тренировки».

Я новичок в тензорном потоке. Когда я тренирую данные с помощью cnn, иногда происходит «потеря NaN во время тренировки» в первой партии.Tensorflow CNN model получить ошибку «NaN потеря во время тренировки».

> loss function is L1-norm 
> 
> GradientDescentOptimizer is used.

"bach_size", "learning_rate" регулируются, даже learning_rate = 0 используется.

Что я действительно смущаю, когда все параметры исправлены, результат иногда может нормально работать, иногда получается ошибка «Нан» при первой партии. Я хочу знать, как это происходит? какие факторы приводят к результату?

источник

2017-01-13 judyzha

Добро пожаловать в StackOverflow. Лучший способ для волонтеров здесь диагностировать вашу проблему пытается воспроизвести его. Попытайтесь улучшить этот вопрос, предоставив небольшой, самодостаточный и воспроизводимый пример - поскольку он стоит, это слишком много догадок. –

Ну, так как у нас нет вашего кода, трудно сказать точно. Но в большинстве случаев в обучении нейронной сети существует множество случайных факторов. Ваши данные тренировки перетасовываются. Ваши начальные веса выбираются случайным образом из какого-либо распределения. Получение случайного NaN в функции потерь не имеет большого значения, но это может указывать на то, что функция потерь не подходит для ваших данных или сети. –

Thks @ MadWombat ~ вы даете полезную информацию о факторах, которые могут привести к этой проблеме. – judyzha

Проверка на Nans в данных
РЕЛУ дает иногда Nans

источник

2017-01-14 10:11:04 klubow

Tensorflow CNN model получить ошибку «NaN потеря во время тренировки».

ответ

Смежные вопросы