В настоящее время я пытаюсь воспроизвести функцию getSpectrum
функции звуковой библиотеки FMOD. Эта функция считывает данные PCM текущего воспроизводящего буфера, применяет окно к этим данным и применяет FFT для получения спектра.FFT - Применение окна на данных PCM
Он возвращает массив с плавающей точкой, где каждый поплавок находится между 0 и 1 дБ (10.0f * (float)log10(val) * 2.0f
).
Я не уверен, что я делаю то, что я должен сделать, так что я объясню:
Во-первых, я получаю данные PCM в байтах буфера 4096, в соответствии с документацией, данные ИКМ состоящий из выборок, которые представляют собой левую-правую пару данных.
В моем случае я работаю с образцами 16bit, как на картинке выше. Так что, если я хочу работать только с левым каналом, я сохраняю левые данные PCM в коротком массиве делает:
short *data = malloc(4096);
FMOD_Sound_ReadData(sound, (void *)data, 4096, &read);
Таким образом, если образец = 4 байта, у меня есть 1024 выборки, т.е. 1024 шорт, представляющих левые канал и 1024 шортов, представляющих правый канал.
Для выполнения БПФА, мне нужно иметь буи и применить окно (Ханнинг) на моих данных:
float hanningWindow(short in, size_t i, size_t s)
{
return in*0.5f*(1.0f-cos(2.0f*M_PI*(float)(i)/(float)(s-1.0f)));
}
Уф in
является входом, i
позиции в массиве и s
размер массива (1024).
Чтобы получить только левый канал:
float *input = malloc(1024*sizeof(float));
for (i = 0; i < 1024; i++)
input[i] = hanningWindow(data[i*2], i, 1024);
Затем я выполняю FFT благодаря kiss_fft (от реального к сложному). Я получаю kiss_fft_cpx *ouput
(массив) комплекса размером 1024/2 + 1 = 513.
рассчитать амплитуду каждой частоты с:
kiss_fft_cpx c = output[i];
float amp = sqrt(c.r*c.r + c.i*c.i);
стоимость в дБ:
amp = 10.0f * (float)log10(amp) * 2.0f;
amp
не находится между 0 и 1. Я не знаю, где я должен нормализовать свои данные (по данным PCM или в конце). Также я не уверен, как я применяю свое окно к данным PCM.
Вот результат, который я получаю от песни 0 до 20 кГц по сравнению с результатом функции getSpectrum. (Для прямоугольного окна)
My Result getSpectrum Result
Как я могу достичь того же результата?
На скорости ноты, вы должны действительно хранить коэффициенты Hann окна, а не вычисляя их аккуратные каждый время. –
Не нужно брать sqrt. Примечание: 20 * log10 (sqrt (x)) == 10 * log10 (x) –