Я заинтересован в использовании аудиофайла в качестве записи событий, происходящих во времени. То есть у меня будет несколько потоков данных, которые нужно выровнять по времени, и я хотел бы использовать аудиофайл в качестве ссылки. Итак, мне интересно, можно ли получить фактическую временную базу для аудиопотока, как указано относительно часов реального времени?
Я ценю, что можно определить продолжительность аудиоклипа из отсчета и частоты дискретизации (скажем, 16 кГц). Для коротких клипов это, вероятно, хорошая оценка, но для длинных (многочасовых записей) насколько точна будет эта оценка? Я бы хотел поддерживать точность в секундах в течение нескольких часов.Как получить точную временную базу звука
Иными словами, записывает ли аудиофайл фактическое время начала и окончания аудиозаписи, как указано в RTC (часы реального времени). Это позволит генерировать временную базу для каждого образца в аудиофайле. Если да, могу ли я получить эти данные из аудио-библиотеки python?
Я использую MP4/AAC для кодирования на платформе Android и pydub
для последующей обработки.
Спасибо.
Я не думаю, что аудиозапись имеет точность во второй раз. [много людей] (https://www.google.com/search?client=safari&rls=ru&q=audio+recording+drift&ie=UTF-8&oe=UTF-8) обнаружили «дрифт» в своих аудиозаписях и разработали различные стратегии получения нескольких (независимых) записей одного и того же события для правильного выравнивания. Подкасты, в частности, где каждый хост записывает себя локально, а затем объединяет записи впоследствии – Jiaaro