Отказ от ответственности: Причина, по которой вы все еще не получили ответа на этот вопрос, вероятно, потому что это текущая исследовательская проблема. Поэтому я не могу дать вам прямой ответ, но попытаюсь помочь с некоторой информацией и полезными ресурсами для этой темы.
В основном есть два разных подхода для создания скелета с карты глубины. Первый - использование машинного обучения, второе - чисто алгоритмическое.
Для обучения машинам вам понадобится много образцов людей, выполняющих заданный ход, и используйте эти образцы для обучения вашему любимому алгоритму обучения. Это подход, который был сделан и внедрен Microsoft в XBox (source), он работает очень хорошо, но вам нужны миллионы образцов, чтобы сделать его надежным ... довольно слабым.
«Алгоритмический» подход (понимающий без использования учебного набора) может быть выполнен разными способами и является проблемой исследования. Это часто основывается на моделировании возможных позах тела и попытке сопоставить это с полученным глубинным изображением. Это подход, который был выбран PrimeSense (ребята, стоящие за технологией камеры глубины kinect) для своего инструмента отслеживания скелета NITE.
OpenKinect community содержит wiki, где перечисляет interesting research material по этой теме. Вы также можете быть заинтересованы в this thread on the OpenNI mailing list.
Если вы ищете для реализации инструмента отслеживания скелета, PrimeSense выпустил Nite (закрыт источника), тот, который они сделали: это часть OpenNI framework. Это то, что используется в большинстве видеороликов, которые вы видели, включая отслеживание скелета. Я думаю, что он способен обрабатывать до 2 скелетов одновременно, но это требует подтверждения.
google openNI и kinect, он встроен. –