2016-06-14 3 views
1

Я озадачен вопросом и хотел бы ваше мнение. Я работаю над сверлильной нейронной сетью в тензорном потоке. Теперь у меня есть изображения с тегами. Есть около 10000 уникальных тегов, и я хотел бы, чтобы изображения были автоматически помечены. Теперь я использую одну горячую кодировку для меток. Для 10000 уникальных тегов это будет похоже на функцию erruption. Как мы имеем дело с такими ситуациями?одна горячая кодировка для огромного количества тегов

Как сделать facebook своим тегом? Есть миллионы лиц. Наверное, они не делают ни одного горячего кодирования для тега лица правильно?

ответ

5

При распознавании лиц стандартным способом обработки миллионов классов является использование встраивания. CNN создает вложение размером от 64 до 1024.

В этом пространстве внедрения каждый класс изображений должен образовывать кластер изображений, а кластеры разных классов должны быть далеко друг от друга.


Подход Facebook описан в их DeepFace paper (июнь 2014 года), но я бы рекомендовал более современный подход от Google, используя потери триплетную: FaceNet: A Unified Embedding for Face Recognition and Clustering.

triplet loss

+0

Спасибо, хорошо объяснено. – Nipun

+0

Пожалуйста, не забудьте принять ваш любимый ответ, поэтому SO может должным образом уйти в отставку. – Prune

+0

Спасибо @Prune :) –

 Смежные вопросы

  • Нет связанных вопросов^_^