Я хочу сборки нечто похожее на Tunatic или Midomi (попробуйте их, если вы не уверены, что они делают), и мне интересно, что алгоритмы, я должен был бы использовать; Идея у меня есть о работах таких приложений, как-то так:распознавание музыки и обработка сигналов
- имеет большую базу данных с несколькими песнями
- для каждой песни в 1. снижения качества/скорости передачи в битах (64 кбит например) и вычислить звук «хэш»
- есть звук/отрывок из музыки, которую вы хотите определить
- на песню в 3. снижают качество/битрейт (опять 64kbps) и вычислить звук «хэш "
- , если 4. звук хэш в любом из 2. звуковых хешей возвратить совпавшие музыку
Я, хотя снижения качества/скорости передачи битов из-за шумов окружающей среды и различия кодирования.
Я нахожусь на правильном пути здесь? Может ли кто-нибудь предоставить мне любую конкретную документацию или примеры? Мидори, похоже, даже признает hum's
, это довольно впечатляюще! Как они это делают?
Имеются ли звуковые хэши или это что-то, что я только что нарисовал? Если они это сделают, как я могу их вычислить? И что еще более важно, как я могу проверить, child-hash
находится в father-hash
?
Как мне поступить создание аналогичной системы с Python (возможно, встроенный модуль) или PHP?
Будут оценены некоторые примеры (желательно на Python или PHP). Заранее спасибо!
Связанные вопросы: [Звуковая библиотека распознавания образцов/код] (http://stackoverflow.com/questions/2817663/sound-sample-recognition-library-code), [Акустический отпечаток отпечатка пальца?] (Http: // stackoverflow .com/вопросы/2462410/акустико-отпечатков пальцев с открытым исходным кодом). Хороший обзор wiki от MusicBrainz (http://wiki.musicbrainz.org/Fingerprinting). – Albert
Вот отличный вариант для Python: https://github.com/worldveil/dejavu – lollercoaster