2017-01-27 10 views
-1

Я запустил код ниже для wav-файла, и я получил 4 переменные: sound.files, selec, start и end на выходе. output. Кто-нибудь знает, можно ли получить ораторов для каждого разговора, чтобы мы могли узнать каждую звезду и продолжительность окончания речи говорящего или говорящего.Можно ли идентифицировать динамики для каждого разговора после функции «autodetec» в R

autodetec(flist = sub, threshold = 0.5, env = "abs", ssmooth = 500, power = 1, redo = TRUE, 
      bp=c(0,9), xl = 2, picsize = 2, res = 200, flim= c(0,10), osci = TRUE, 
      wl = 300, ls = FALSE, sxrow = 2, rows = 4, mindur=0.5, maxdur=8, set = TRUE) 
+0

Откуда эта функция автоопределения? – PatriceG

+0

из warbleR упаковка – MLM

ответ

0

Вопрос строится на тему speaker diarisation. Если у вас уже есть однородные сегменты для каждого громкоговорителя (выдержка вашей функции автоопределения), вы можете вычислить звуковые дескрипторы, такие как хорошо используемый MFCC, для классификации каждого сегмента. Простой классификатор, такой как Kmeans, мог бы выполнить эту работу.