Применяется к неправильному использованию технических терминов. Я работаю над проектом семантической сегментации через CNN; пытаясь реализовать архитектуру типа Encoder-Decoder, поэтому выход имеет тот же размер, что и вход.Семантическая сегментация с энкодером-декодером CNN
Как вы проектируете этикетки? Какую функцию потерь следует применять? Особенно в ситуации тяжелого классового дисбаланса (но соотношение между классами варьируется от изображения к изображению).
Проблема связана с двумя классами (объекты интереса и фона). Я использую Keras с бэкэндом tensorflow.
До сих пор я планирую, что ожидаемые выходы будут такими же размерами, как и входные изображения, применяя пиксельную маркировку. Конечный слой модели имеет либо активацию softmax (для 2 классов), либо сигмоидную активацию (чтобы выразить вероятность того, что пиксели принадлежат классу объектов). У меня возникли проблемы с разработкой подходящей целевой функции для выполнения такой задачи, типа:
функцию (y_pred, y_true),
по согласованию с Keras.
Пожалуйста, постарайтесь уточнить размеры используемых тензоров (ввод/вывод модели). Любые мысли и предложения очень ценятся. Спасибо !
Рекомендовать переместить этот вопрос в http: // stats.stackexchange.com/ –
Рекомендую переместить этот вопрос на [datascience.stackexchange.com] (http://datascience.stackexchange.com/) –