Как преобразовать звуковой сигнал в список фонем?преобразовать звук в список фонем в python
I. Настоящая методология и/или код, чтобы перейти от цифрового сигнала к списку фонем, из которого производится запись звука.
например:
lPhonemes = audio_to_phonemes(aSignal)
, где, например
from scipy.io.wavfile import read
iSampleRate, aSignal = read(sRecordingDir)
aSignal = #numpy array for the recorded word 'hear'
lPhonemes = ['HH', 'IY1', 'R']
Мне нужна функция audio_to_phonemes
Не все звуки языка слова, так что я не могу просто использовать something that uses the google API, например.
Редактировать
Я не хочу аудио словами, я хочу аудио фонем. Большинство библиотек, похоже, не выводит это. Любая библиотека, которую вы рекомендуете, должна иметь возможность выводить упорядоченный список фонем, из которых состоит звук. И это должно быть в python.
Я также хотел бы узнать, как работает звук звука для фонем. Если не для целей реализации, то ради интереса.
Привет, Николай. У меня возникла проблема с установкой последней версии и возникла еще одна проблема. Не могли бы вы взглянуть ?: http://stackoverflow.com/questions/30728041/install-pocketsphinx-for-python2-7 – Roman
@Nikolay Shmyrev Не могли бы вы разработать reg 'MODELDIR'? что там? Благодарю. – oba2311
MODELDIR - это расположение модели. Это может быть где угодно в системе, это зависит от того, куда вы положили файлы. –