Я не знал об этом инструменте. Это выглядит здорово. Вы проверили свою вики? У них есть некоторые документы о том, как работает система: http://lium3.univ-lemans.fr/diarization/doku.php
В основном, они вычисляют коэффициенты Cepstrum MFCC Mel Frequency Cepstrum (стандартная техника). Это фундаментальный шаг. Он создает пространство для работы. Он похож на вычисление FFT по скользящему окну во времени. В конечном итоге кластеризация выполняется на этих временных срезах с использованием методов байесовского информационного критерия (BIC). Сначала сегментируйте пространственное пространство, основанное на времени, затем кластер и найдите согласованные функции для каждого динамика. HMM, viterbi, EM, а иногда и GMM.
Я не знаю, алгоритм достаточно хорошо, чтобы объяснить это подробно, но это также должно помочь: http://lium3.univ-lemans.fr/diarization/doku.php/overview
Спасибо. Я видел вики, и это выглядит многообещающим. Я посмотрю. – dmacan23