Вот упрощенная (но и сущность) проблемы. Предположим, что у меня есть поле в пространстве в некоторой исходной позиции/ориентации и калиброванная камера C с известной позицией/ориентацией. Я делаю снимок коробки и могу идентифицировать N точек функции x_i на проецируемом изображении B.Компьютерное зрение 3D-преобразование из изображений
Теперь предположим, что кто-то перемещает коробку (преобразование твердого тела) относительно небольшую величину. Я делаю снимок окна и снова могу идентифицировать N объектов точек x * _i. Я хочу решить для преобразования твердого тела T.
Моя стратегия эквивалентна предположению, что ящик не двигался, и предположим, что у меня есть другая камера C *, которая найдена путем преобразования камеры C на инверсию преобразования T Таким образом, точки N x _i - это проецируемые точки функции на изображении B относительно камеры C *.
Итак, я считаю, что могу решить для существенной матрицы E из двух наборов проецируемых точек изображения (при условии, что у меня достаточно - я думаю, мне нужно 8). (Поскольку камеры откалиброваны, я думаю, что я могу просто использовать важную матрицу, а не фундаментальную матрицу?) Оттуда я могу использовать матричную декомпозицию, чтобы извлечь преобразование вращения и трансляции, которое описывает, как камеры отличаются. Обратное это преобразование, которое я хочу.
Звучит так, как будто это сработает? Что произойдет, если я не смогу найти 8 пунктов, но скажу только 3? Смогу ли я получить оценку существенной матрицы или это будет совершенно неправильно?