Мне нужно рассчитать скорость речи для каждой строки субтитров. . Содержание файла SRT (субтитры) выглядит следующим образом:R: Извлечение времени из файла srt (субтитров)
1
00:00:19,000 --> 00:00:21,989
I'm Annita McVeigh and welcome to Election Today where we'll bring you
2
00:00:22,000 --> 00:00:23,989
the latest from the campaign trail, plus debate and analysis.
3
00:00:24,000 --> 00:00:28,989
The Liberal Democrats promise to protect the pay of millions
Например, требуется 4 секунды 989 миллисекунды чтобы сказать 10 слов «Либеральные демократы обещают защитить платить миллионы» , Средняя скорость речи этих 10 слов: 498,9 миллисекунды за слово.
Как прочитать файл SRT, так что я могу иметь dataframe с STARTTIME, EndTime, и текстовой строкой WordCount в виде столбцов и строк субтитров, как строки, как ниже?
startTime<-c("00:00:19,000", "00:00:22,000", "00:00:24,000")
endTime<-c("00:00:21,989", "00:00:23,989", "00:00:28,989")
textString<-c("I'm Annita McVeigh and welcome to Election Today where we'll bring you", "the latest from the campaign trail, plus debate and analysis.", "The Liberal Democrats promise to protect the pay of millions")
wordCount<-c(12,10,10)
rate.df<-data.frame(startTime, endTime, textString, wordCount)
Как вычесть STARTTIME из EndTime в R, когда время представлено в виде часов: минуты: секунды, миллисекунды?
мне удалось задачу с помощью MS Excel, но у меня есть слишком много данных, чтобы использовать Excel для этой задачи. – Ninjacat