Я совершенно новый для области распознавания мимики лица и в настоящее время я делаю исследование по этому вопросу с помощью Deep Learning специально CNN. У меня есть некоторые вопросы относительно подготовки и/или предварительной обработки моих данных.Выражения распознавание лица Подготовка данных для CNN
У меня есть сегментированное видео лобных мимик (например, 2-3 секунд видео человека, выражающий счастливой эмоцию, основанная на его/ее аннотацию).
Примечание: выражения, выводимые моих участники довольно низкая интенсивность (не преувеличенные выражения/микро-выражения)
Общего Вопрос: Теперь, как я должен подготовить свои данные для обучения с CNN (I я немного склонен к использованию глубокой учебной библиотеки, TensorFlow)?
Вопрос 1: Я прочитал некоторое глубокое признание мимики обучения на основе (ЧОК) документы, которые свидетельствуют, чтобы взять пик этого выражения (скорее всего, одно изображения) и использовать это изображение, как часть ваших данных обучения , Как узнать пик выражения? Какова моя основа? Если я собираюсь взять одно изображение, не будут ли потеряны некоторые важные рамки тонкости выражения, отображаемые моими участниками?
Вопрос 2: Или было бы также правильно выполнить сегментированного видео в OpenCV для обнаружения (например, Viola-Jones), обрезать и сохранить его лица в каждом кадре, и использовать эти изображения как часть моего обучения данные с соответствующими метками? Я предполагаю, что некоторые рамки граней будут лишними. Однако, поскольку мы знали, что участники наших данных показывают низкую интенсивность выражений (микро-выражения), некоторые движения лица также могут быть важными.
Я был бы очень признателен всем, кто может ответить, спасибо много!
Правильно, вот что я забыл упомянуть. Мои данные содержат спонтанные выражения лица. Сначала субъект записывался при выполнении определенной операции на весь сеанс. После сеанса ему/ей предлагается аннотировать всю деятельность, в которой, если он/она считает, что определенное выражение в течение определенного периода времени в видео, например, счастливо, он/она будет комментировать этот период времени, чтобы быть счастливым , Это процесс. Видео обрезаны в зависимости от аннотации темы, поэтому я считаю, что это может быть субъективное суждение, если я буду определять пик. Спасибо – Renz
Это означает, что вы * имеете * состояние покоя на видео, а затем, с собственной оценкой субъекта, не находясь в особом эмоциональном состоянии. В этом случае применяется мой первый параграф. – Prune
Говоря с вашим последним моментом, да, было бы полезно использовать видеоклип, чтобы выразить всю эмоцию. Тем не менее, мое понимание области говорит, что это излишне для вашего приложения: достаточно одного репрезентативного «пикового» кадра. – Prune