Если вы хотите распознавать плоские изображения, то текущее поколение мобильных AR SDK от Metaio, Qualcomm и Layar позволит вам загружать изображения в соответствии с ними и выполнять сопоставление.
Если вы хотите свободно сопоставлять с набором трехмерных объектов, например. Toyota Prius или Empire State, те же самые методы могут применяться для сопоставления с наборами изображений, выполненных с разными оборотами, но вам может потребоваться выбрать только один объект из-за ограничений на то, как большая база данных изображений, которую вы можете иметь с помощью сервис или связаться с этими компаниями для пользовательского решения, и он может не работать очень надежно, учитывая, что уровень техники соответствует надежным сопоставлениям с плоскими изображениями.
Если вы хотите узнать общие классы (человек, автомобиль, здание), это очень сложная проблема, и я не знаю ни одного решения, где бы вы ни были достаточно быстры, чтобы работать в сети (что я предполагаю, это требование, данное вам хотите решение AR - это справедливое предположение?). Прошло несколько лет с тех пор, как я изучил CV, но в то время самым многообещающим решением для визуальной классификации были подходы «сумка визуальных слов» - вы можете попробовать их прочитать.