1

Я новичок в тензорном потоке. Когда я тренирую данные с помощью cnn, иногда происходит «потеря NaN во время тренировки» в первой партии.Tensorflow CNN model получить ошибку «NaN потеря во время тренировки».

> loss function is L1-norm 
> 
> GradientDescentOptimizer is used. 

"bach_size", "learning_rate" регулируются, даже learning_rate = 0 используется.

Что я действительно смущаю, когда все параметры исправлены, результат иногда может нормально работать, иногда получается ошибка «Нан» при первой партии. Я хочу знать, как это происходит? какие факторы приводят к результату?

+0

Добро пожаловать в StackOverflow. Лучший способ для волонтеров здесь диагностировать вашу проблему пытается воспроизвести его. Попытайтесь улучшить этот вопрос, предоставив небольшой, самодостаточный и воспроизводимый пример - поскольку он стоит, это слишком много догадок. –

+0

Ну, так как у нас нет вашего кода, трудно сказать точно. Но в большинстве случаев в обучении нейронной сети существует множество случайных факторов. Ваши данные тренировки перетасовываются. Ваши начальные веса выбираются случайным образом из какого-либо распределения. Получение случайного NaN в функции потерь не имеет большого значения, но это может указывать на то, что функция потерь не подходит для ваших данных или сети. –

+0

Thks @ MadWombat ~ вы даете полезную информацию о факторах, которые могут привести к этой проблеме. – judyzha

ответ

1
  • Проверка на Nans в данных
  • активации
  • РЕЛУ дает иногда Nans

 Смежные вопросы

  • Нет связанных вопросов^_^