Чтобы понять, почему каждый метод выбран, нам нужно взглянуть на модель камеры, когда мы моделируем ее как орфографическую, и когда мы моделируем ее как перспективу.
Модель орфографической камеры - это особый случай, если предположить, что расстояние от сцены от центра проекции бесконечно. Это означает, что мы предполагаем, что нет искажений, вызванных расстоянием между объектом и изображением. В результате мы ожидаем получить идентичность между координатой объекта в реальном мире и в изображении.
Так, например, если у нас есть треугольник в реальном мире в координатах (X1, Y1, Z1), (X2, Y2, Z2), (X3, Y3, Z3), мы ожидаем увидеть треугольник на изображении (x1, y1), (x2, y2), (x3, y3) были X1 = w x1 X2 = w x2 .. Y1 = w * y1 .. и так далее. где w - некоторый масштабный коэффициент.
Если это хорошее предположение? Обратите внимание, что я не учитывал значения Z для каждой точки. Поэтому это предположение хорошо, когда мы смотрим на сцену, где расстояние сцены от камеры почти постоянное.
Примечание: Это очень упрощенное объяснение, которое не учитывает многие другие факторы, такие как искажение объектива самой камеры и многое другое.
Спасибо @ Kornel за ваш ответ. Итак, с предположением, что никакое движение вдоль оптической оси, можем ли мы в этом случае считать, что они дали бы близкие результаты? –
Это вряд ли зависит от сцены, но я думаю, что SfM с орфографической проекцией весьма полезна для небольших Z относительных движений трехмерных объектов (движущихся по изображению). – Kornel
Вы когда-нибудь сталкивались с каким-то хорошим учебным пособием, использующим орфографическую модель, которую вы могли бы мне сослаться на нее? –