Я захватил звуковой сигнал входного сигнала с помощью моего микрофона и визуализировал его в OpenCV Мате:OpenCV с помощью преобразования Фурье, чтобы получить частотную спектрограмму
Я прочитал каждые 20 выборок (= каждые 20 пикселей в й -определение «звукового мата») и умножить его на функцию hann-window. Затем я выполняю dft (преобразование с уменьшенным преобразованием) в OpenCV (docs here) этой оконной последовательности. Вот пример mangitude выходе ДПФ такого сигнала в 20-образец:
Но как я могу получить частоту спектрограммы? Является ли описанная попытка правильной? Что я должен делать с этими выходами dft, чтобы получить спектрограмму?
Извините, что не публиковали фотографии; только ссылки. Поскольку я новичок в stackoverflow, я не могу публиковать фотографии напрямую.
Спасибо за ваш ответ! Я не понимаю, где частоты и его интенсивность находятся в изображении величины. Во-первых, это подход, позволяющий преобразовать аудиосигнал в такое изображение (первое изображение, о котором идет речь), и сделать FT в интересующей области, которая имеет размер Y-образа звукового изображения и количество образцов, которые я хочу, анализировать как X-размер? Для меня изображение величины должно представлять где-то интенсивность каждой частоты в анализируемой аудиопоследовательности. – bingoStack
spectrogram: http://sail.usc.edu/Peter/mystery/mystery.jpg Первое изображение - график аудиосигнала. FT должен выполняться в массиве аудиоданных, а не на изображении. Информация о частотах, добавленных в сообщение. – MBo