2010-05-21 11 views
6

Для всех, кто не знаком с программой SongID от Verizon, это бесплатное приложение, загружаемое через сеть Verizon VCast. Он прослушивает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные некоторому всезнающему алгоритмическому зверю, который пережевывает его и отправляет вам все теги ID3 (исполнитель, альбом, песня и т. Д.).Verizon SongID - Как это запрограммировано?

Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?

Я полагаю, что он должен взять звуковой файл (какой формат?), Проанализировать его (как? С чем?) Для некоторых ключевых идентификаторов (каковы эти регулярные атрибуты волновых функций? Фаза/сдвиг/амплитуда/и т. Д.). , и проверить его на базе базы данных.

Все, что я нашел в Интернете, о том, как это работает, является чем-то общим, как то, что я набрал выше.

От audiotag.info

Эта услуга основана на сложного звукового распознавания алгоритм, сочетающий передовые аудио отпечатков пальцев технологии и большую базу данных песен. Когда вы загружаете аудиофайл , он анализируется звуковым движком . Во время анализа извлекается звуковой «отпечаток пальца» и идентифицируется путем сравнения его с музыкальной базой . По завершении этот процесс распознавания, информация о песнях с их соответствующими вероятностями отображается на экране.

ответ

5

Все эти службы работают, беря «отпечаток пальца» из дискретизированных аудиоданных на стороне клиента, отправляя их на сервер и сравнивая их с базой данных отпечатков пальцев.

Один из разработчиков Shazam написал чрезвычайно информативный white paper о том, как работает технология. Это должно дать вам всю необходимую информацию.

+0

+10 (если бы я мог) для бумаги – Andrey

+0

это то, что я искал - что вы искали и где вы его искали? отличный материал – CheeseConQueso

+1

Я прочитал его в прошлом году. Это область, представляющая интерес для меня, поскольку я работаю с подобными технологиями. –