0

Я читал на глубоком подкреплении, например, как здесь:Выполняет ли предварительная обработка при глубоком Q/усилении обучения?

https://www.nervanasys.com/demystifying-deep-reinforcement-learning/

Это будет некоторое время, прежде чем я все понимаю математику, но это не мешает мне использовать библиотеки. Во всяком случае, я знаю, что в сверточном ANN, если вы хотите выполнить обучение на изображениях, вам нужно предварительно обработать изображения, иначе вычислительная мощность, необходимая для вычисления нейронной сети, будет астрономической. Это ухудшает качество сети в любом случае? Если да, то как?

Например, можно сказать, что у вас достаточно вычислительной мощности, чтобы подавать в сеть каждый пиксель каждого высококачественного изображения в видеопотоке, чтобы узнать, как достичь целей. Будет ли это сделать сеть гораздо более искусной в достижении своей цели? Расширит ли он типы целей, которые может достичь сеть, возможно, давая ей возможность лучше обобщить?

Я также думаю об этом в контексте компьютерного видения, где у вас может быть робот, рассуждающий об окружающей среде, чтобы научиться выполнять задания. Похоже, что предварительная обработка полученных ими изображений будет сродни тому, чтобы помешать ей с крайне плохим зрением.

ответ

1

Предварительно обрабатывая изображения, вы имеете в виду масштабирование их до стандартного размера, например, 256x256 пикселей?

С помощью supsampling изображения размером до 256x256 пикселей вы теряете информацию, поэтому сохранение изображения с высоким разрешением должно дать вам лучшие результаты.

Но это также будет стоить вам гораздо больше энергии компьютера, поэтому не стоит этого делать. В Scaling up Image Recognition авторы утверждают, что с использованием изображений с разрешением 512x512 вместо 256x256 они достигают более низкой частоты ошибок. Однако это всего на 0,54% ниже, что мало.

В других задачах я предполагаю, что эффекты использования изображений с более высоким разрешением должны быть похожими, это позволит модели увидеть более подробную информацию, следовательно, это, вероятно, будет лучше, но это может не стоить из-за увеличения вычислительной мощности.

Обратите внимание, что авторы ссылки, которую я предоставил, получили обман на ImageNet, поэтому даже снижение частоты ошибок может быть реальным, оценка, достигнутая на конкурсе ImageNet, должна быть проигнорирована.

+0

Да, я имею в виду понижающее масштабирование. Я еще много не работал с сетями, но я прошел курс и начал заниматься некоторым кодом. Я задал вопрос, потому что я представлял себе свое собственное видение, если бы все, что мне нужно было, было уменьшенным искаженным взглядом на мир, и насколько это лучше, чем я. Можно было бы подумать, что улучшение будет замечательным. Между 12MP-изображением и 256x256 существует большая разница. Возможно, если некоторые тесты были сделаны с чем-то большим, чем 512? Конечно, есть расчет, который необходимо учитывать, и, хотя важно, важно также знать, что обеспечивает масштабирование. – xendi

+0

Ну, как я уже сказал, и я уверен, что есть больше ссылок, тем больше разрешение, тем лучше результаты, но улучшения приходят за счет гораздо большего количества вычислений. – gcucurull