2014-01-10 2 views
2

В моем проекте я использую библиотеку LIUM_SpkDiarization-4.7.jar, но я не совсем уверен, как она работает. Может кто-нибудь, пожалуйста, объясните это немного?Как работает диаритизация динамиков LIUM?

Кроме того, я использую его с python.

Ссылка на библиотеки: https://voiceid.googlecode.com/svn-history/r11/trunk/scripts/LIUM_SpkDiarization-4.7.jar

Спасибо заранее.

ответ

2

Я не знал об этом инструменте. Это выглядит здорово. Вы проверили свою вики? У них есть некоторые документы о том, как работает система: http://lium3.univ-lemans.fr/diarization/doku.php

В основном, они вычисляют коэффициенты Cepstrum MFCC Mel Frequency Cepstrum (стандартная техника). Это фундаментальный шаг. Он создает пространство для работы. Он похож на вычисление FFT по скользящему окну во времени. В конечном итоге кластеризация выполняется на этих временных срезах с использованием методов байесовского информационного критерия (BIC). Сначала сегментируйте пространственное пространство, основанное на времени, затем кластер и найдите согласованные функции для каждого динамика. HMM, viterbi, EM, а иногда и GMM.

Я не знаю, алгоритм достаточно хорошо, чтобы объяснить это подробно, но это также должно помочь: http://lium3.univ-lemans.fr/diarization/doku.php/overview

+0

Спасибо. Я видел вики, и это выглядит многообещающим. Я посмотрю. – dmacan23