0

Множество наборов данных реального мира имеют представления в виде нескольких видов. Например, человек может быть идентифицирован лицом, отпечатком пальца, сигнатурой и радужкой или изображением, которое может быть представлено его цветовыми и текстурными особенностями. Мульти-просмотр - это в основном информация, полученная из нескольких источников. В контексте машинного обучения/кластеризации данных/компьютерного зрения, каковы наиболее релевантные приложения, которые занимаются этим подходом?Каково современное состояние в кластере Multi-View?

ответ

5

В контексте компьютерного зрения multi-view относится к изображениям одного и того же объекта, взятым из разных видов/углов/положений. Существует несколько приложений этой стратегии. 3D reconstruction from multiple view - один из самых популярных примеров.

Тип Мультивидовых вы ссылаетесь в основном увеличениеданных для решения одной проблемы. Как вы уже упоминали, идентификация лица из разных источников данных является применением данных-увеличения. Также может быть несколько других приложений. Например, оценка выражения, чтобы определить настроение человека, используя данные из камеры RGB + 3D-данные от Kinect + Audio, является еще одним примером.

В контексте машинного обучения данные-увеличение есть везде. Объединение различных характеристик изображения или звука для классификации - data-augmentation.

+0

Спасибо за ответ! Я был бы признателен, если бы вы могли предоставить некоторые статьи или хорошие ссылки об этом. –