0

Когда я просматривал другую литературу, я нашел структуру из движения в предположении, что модель камеры орфографична, а в других ресурсах - перспективная проекция. и они следуют двум различным методам.Как модели орфографии и перспективной камеры в структуре от движения отличаются друг от друга?

Возможно, кому-то захочется поделиться своим опытом об этом?

ответ

0

Скажите, что у вас есть статическая сцена и движущаяся камера (или, что то же самое, жестко движущаяся сцена и статическая камера), и вы хотите восстановить геометрию сцены и движение камеры с двух или более изображений. Реконструкция обычно основывается на получении соответствия точек, т. Е. У вас есть некоторые уравнения, которые необходимо решить для точек и движения камеры.

Решение может быть основано на нелинейной минимизации или на различных приближениях. Камера может быть аппроксимирована орфографической или перспективной проекцией. В простейшем случае SFM камера может быть аппроксимирована орфографической проекцией (или, в более общем плане, слабой проекцией перспективы), где сцена может быть восстановлена ​​до масштаба. Но перевод перпендикулярно плоскости изображения никогда не может быть восстановлен из-за свойств орфографической проекции.

Новые методы SfM используют перспективную проекцию, потому что с орфографической проекцией мы не можем восстановить всю информацию. С полной перспективной проекцией мы можем восстановить, например, сдвиг по оптической оси. То есть геометрия и полное движение могут быть восстановлены до глобального масштабного коэффициента.

+0

Спасибо @ Kornel за ваш ответ. Итак, с предположением, что никакое движение вдоль оптической оси, можем ли мы в этом случае считать, что они дали бы близкие результаты? –

+0

Это вряд ли зависит от сцены, но я думаю, что SfM с орфографической проекцией весьма полезна для небольших Z относительных движений трехмерных объектов (движущихся по изображению). – Kornel

+0

Вы когда-нибудь сталкивались с каким-то хорошим учебным пособием, использующим орфографическую модель, которую вы могли бы мне сослаться на нее? –

0

Чтобы понять, почему каждый метод выбран, нам нужно взглянуть на модель камеры, когда мы моделируем ее как орфографическую, и когда мы моделируем ее как перспективу.

Модель орфографической камеры - это особый случай, если предположить, что расстояние от сцены от центра проекции бесконечно. Это означает, что мы предполагаем, что нет искажений, вызванных расстоянием между объектом и изображением. В результате мы ожидаем получить идентичность между координатой объекта в реальном мире и в изображении.

Так, например, если у нас есть треугольник в реальном мире в координатах (X1, Y1, Z1), (X2, Y2, Z2), (X3, Y3, Z3), мы ожидаем увидеть треугольник на изображении (x1, y1), (x2, y2), (x3, y3) были X1 = w x1 X2 = w x2 .. Y1 = w * y1 .. и так далее. где w - некоторый масштабный коэффициент.

Если это хорошее предположение? Обратите внимание, что я не учитывал значения Z для каждой точки. Поэтому это предположение хорошо, когда мы смотрим на сцену, где расстояние сцены от камеры почти постоянное.

Примечание: Это очень упрощенное объяснение, которое не учитывает многие другие факторы, такие как искажение объектива самой камеры и многое другое.

+0

Прежде всего, спасибо за ваш ответ. Мне все еще интересно, как решить, использовать ли метод, предполагающий орфографическую или перспективную. не могли бы вы привести пример приложений, когда лучше использовать орфографическую модель и аналогично для перспективной модели? –