Для всех, кто не знаком с программой SongID от Verizon, это бесплатное приложение, загружаемое через сеть Verizon VCast. Он прослушивает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные некоторому всезнающему алгоритмическому зверю, который пережевывает его и отправляет вам все теги ID3 (исполнитель, альбом, песня и т. Д.).Verizon SongID - Как это запрограммировано?
Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?
Я полагаю, что он должен взять звуковой файл (какой формат?), Проанализировать его (как? С чем?) Для некоторых ключевых идентификаторов (каковы эти регулярные атрибуты волновых функций? Фаза/сдвиг/амплитуда/и т. Д.). , и проверить его на базе базы данных.
Все, что я нашел в Интернете, о том, как это работает, является чем-то общим, как то, что я набрал выше.
Эта услуга основана на сложного звукового распознавания алгоритм, сочетающий передовые аудио отпечатков пальцев технологии и большую базу данных песен. Когда вы загружаете аудиофайл , он анализируется звуковым движком . Во время анализа извлекается звуковой «отпечаток пальца» и идентифицируется путем сравнения его с музыкальной базой . По завершении этот процесс распознавания, информация о песнях с их соответствующими вероятностями отображается на экране.
+10 (если бы я мог) для бумаги – Andrey
это то, что я искал - что вы искали и где вы его искали? отличный материал – CheeseConQueso
Я прочитал его в прошлом году. Это область, представляющая интерес для меня, поскольку я работаю с подобными технологиями. –