Давайте рассмотрим, что у меня есть нейронная сеть с одним выходным нейроном. Чтобы описать сценарий: сеть получает изображение как входной сигнал и должна найти один объект в этом изображении. Для упрощения сценария он должен просто выводить x-координату объекта.Имея нейронную сеть, выведите гауссовское распределение, а не одно значение?
Однако, поскольку объект может находиться в разных местах, выход сети, безусловно, будет иметь некоторый шум. Кроме того, изображение может быть немного размытым и прочим.
Поэтому я подумал, что было бы лучше, если бы сеть выводила гауссовское распределение местоположения объекта.
К сожалению, я изо всех сил пытаюсь моделировать эту идею. Как бы я конструировал выход? Сплюснутый 100-мерный вектор, если изображение имеет ширину 100 пикселей? Чтобы сеть могла входить в гауссовское распределение в этом векторе, и мне просто нужно найти пики для получения местоположения аппроксимированного объекта?
Кроме того, я не могу определить функцию стоимости и сигнал учителя. Будет ли сигнал учителя идеальным гауссовым распределением по точной х-координации объекта? Как моделировать функцию стоимости, то? В настоящее время у меня есть кросс-энтропия softmax или просто квадрат ошибки: выход сети < -> реальная координата x.
Может быть, лучший способ справиться с этим сценарием? Как лучшее распределение или любой другой способ, чтобы сеть не выводила ни одного значения без какой-либо информации о шуме и так далее?
Я голосую, чтобы закрыть этот вопрос как не по теме, потому что вы, кажется, спрашиваете, чтобы предложить и сформулировать ответ на тему открытого исследования. Это не подходит для StackOverflow. – pjs