Я пытаюсь реализовать модуль распознавания речи, используя Mel Частотный кепстральный коэффициент (MFCC) и динамическое деформирование времени (DTW).Как применять коэффициенты MFCC для DTW
Я разделяю сигнал (x (n)) на кадры с 25 мс с перекрытием 10 мс и нахожу параметры MFCC для каждого кадра. Мое главное сомнение в том, как я могу выполнить DTW в этом сценарии. Предположим, что существуют M-кадры и коэффициенты N (13) MFCC.
Итак, у меня есть матрица M x N. Теперь, как я должен вычислять DTW?