6

Я создаю приложение, которое должно взять изображение и вывести теги, связанные с ним. Эти теги могут быть о вещах, прилагательных или даже эмоциях, связанных с изображением.Нужен автоматический API тегов изображений, любые предложения?

Я уже нашел ALIPR. Но я тестировал его, some other people tested it также, и он не работает хорошо. ALIPR делает слишком много ошибок в наборе из 15 прогнозируемых тегов. По крайней мере, для моего приложения лучше иметь несколько, но правильных тегов.

Предпочтительно, чтобы API был основан на веб-интерфейсе и был бесплатным. Какие-либо предложения?

Заранее благодарен!

ответ

4

Я думаю, что если изображения могут быть помечены автоматически, Google давно бы отказался от image labeler. К сожалению, у компьютеров много проблем с пониманием образов.

Edit:

  • Если вы заинтересованы в исследованиях компьютерного зрения взглянуть на CVPapers, особенно Open Source Computer Vision Implementations. Автоматическая маркировка изображений далека от решения (если у вас нет особого/ограниченного набора тем).

  • Цитата The Google Guide от вторник 13 марта, 2007:

    Слова «Ларри Пейдж» и «Сергей Брин» появляются рядом образы Эрика Шмидта, или в подписях изображения, или ссылки на эти изображения. Google делает предположение, что слова связаны с изображением. Технология Google еще не дошла до того, что она может сказать, что находится в изображении, глядя на нее напрямую.

НТН, не надейся слишком высоко.

PS: Я надеюсь, что вы (или кто-то другой) доказывает меня неправильно и разделяет его здесь со мной ;-)

Edit2:

Я просто наткнулся на Voc 2010 Challenge, который, по моему мнению, , очень хорошо иллюстрирует текущее состояние компьютерного зрения. В одной из задач участники должны найти объект (из очень ограниченного набора объектов) на изображении и классифицировать его. На result page вы можете видеть, что одному из алгоритмов удается классифицировать воздушный самолет с точностью 93%, но «не удается» в других категориях.

Это просто для поиска, чтобы найти «вещи», даже не прилагательные или эмоции.

+0

Google Image Labeler должен быть помощником для поиска изображений Google, это, безусловно, не является основным методом маркировки изображений в Google. Но спасибо за ваши мысли! – fjsj

+0

У меня такое чувство, что Google в основном использует окружающий текст для вывода меток. – bjoernz

3

Отъезд https://imagga.com/ У этого есть впечатляющие результаты. Также некоторые дико развлекательные результаты ... К счастью, все созданные теги приходят с доверительным значением, поэтому вы всегда можете игнорировать что-либо меньшее, чем порог (~ 15% для моего варианта использования). 12 000 изображений в месяц бесплатно, неплохо. Если у вас более 12 000-месячных изображений, просто закажите свои запросы.

+0

Теперь они предлагают 2000 изображений в месяц бесплатно :( – BesLoi

1

попробуйте clarifai api лучший api, с которым я столкнулся.также они предлагают 5000 изображений в месяц бесплатно, чтобы вы могли протестировать их. они предлагают несколько стартовых проектов для Android, IOS, JavaScript, Python и т.д.

Есть много других, как imagga, alchemyapi, clevapi и т.д. Используйте Google, чтобы найти более

если и нужно больше помощи и может мне текст.

+0

Это должно быть комментарий – ketan

3

Это не совсем ясно, будет ли вам хотеться бы определить тег использовать самостоятельно, или просто позволить программному обеспечению использовать «здравый смысл» универсального набора тегов об объектах, показанных и т.д.

Давайте что вы хотите определить свой собственный набор тегов - они могут быть о сезоне года фотография была сделана в, настроения ассоциируется с образом (на основе цветовой схемы и изображенных объекты и т.д.), или что-то техническое you nee d, чтобы различать (нагота, деталь, тип фона и т. д.).

Мы можем использовать машинное обучение для этого! Это отрасль искусственного интеллекта, которая изучает правила (например, как пометить изображения - даже очень сложные правила), когда мы приводим много примеров изображений. Таким образом, основной шаг для вас - собрать набор примеров изображений для каждого тега, который вы хотите. После того, как вы сделаете это, для изображений у вас есть два основных варианта:

  • Использование рамки с глубокого изучения, который позволяет применить нейронную сеть на этой проблеме. Вам нужно будет разделить свои данные на более мелкие части, сделать довольно немного кодирования, и если у вас много изображений, используйте множество трюков, чтобы заставить его хорошо изучить вашу задачу. Если вы не заинтересованы в исследованиях, то взглянуть на это сейчас - caffe и TensorFlow (год назад рекомендация была иной, и через год она может быть другой).

  • Использовать онлайн API, как вы упомянули. Но для задачи, где вы хотите свой собственный набор задач, у вас не так много вариантов, так как большинство служб просто общая классификация - они сортируют ваши изображения на основе того, какие объекты «повседневной жизни» они обнаруживают на изображениях (и иногда специальные случаи, такие как NSFW, но часто не на уровне чувствительности, который вы хотели бы).

Опцион у вас есть среди веб-интерфейсов является vize.it, который предлагает веб-интерфейс, где вы можете загрузить и маркировать свои примеры изображений и позволяет тренировать свой собственный API AI, который генерирует теги,. Таким образом, вы получаете лучшее из обоих миров. К сожалению, это не совсем бесплатно, но план довольно дешевый для небольшого количества изображений, и вы получаете бесплатный образец в начале (плюс тренировочный процесс также свободен).

Отказ от ответственности: Я являюсь одним из создателей vize.it.