3

Я пытаюсь найти библиотеку распознавания речи, подобную PySpeech, которая будет работать на малине Pi 2. Я новичок в этом и попытался исследовать, но есть так много приложений, мне просто нужна помощь выбирая правильный.распознавание речи на Python для Raspberry Pi 2

Все, что я пытаюсь сделать, когда пользователь что-то говорит, программа распознает ключевые слова и откроет правильную часть моего кода, которая будет просто отображать информацию об этом ключевом слове.
Прямо сейчас я использую Python 2.7 и PyQt4 для отображения того, что хочу, но хочу изменить, если есть что-то более простое, например, KivyPi, PyGame и т. Д. Я за любые идеи или любую помощь, чтобы подтолкнуть меня вправо направление.

Спасибо!

ответ

1

Признать несколько слов на Raspberry Pi 2 с Python вы можете использовать привязки Python к Pocketsphinx

Вы можете найти pocketsphinx учебник, чтобы начать работу here.

Вы можете найти некоторые сведения об установке для RPi here.

Вы можете найти пример кода here.

Вы можете найти уже действующий пример, используя pocketsphinx и python here.

+0

Я рассмотрю это, спасибо. – Josh

4

Я создал библиотеку под названием SpeakPython, которая помогает разработчикам Python делать именно это и только что выпустила ее под GPL3. Библиотека построена на основе pocketsphinx (sphinxbase) и gstreamer (для распознавания потоков, что приводит к быстрым результатам). Это позволит вам прикрепить код python к речевым командам.

Это очень точный и динамичный для синтаксического анализа команды, такой как этот, и я уже тестировал его на Pi. Дайте мне знать, если у вас возникнут проблемы.

1

Вот что у меня есть и работает на моем pi, он использует распознавание речи python, pyaudio и pythons espeak для ответа голоса (если вы хотите, чтобы, если не просто вытащить его), это будет прослушивать ввод голоса, распечатать это текст и говорить об этом вам. Вы можете манипулировать этим, чтобы делать все, что хотите в основном -

import pyaudio 
from subprocess import call 
import speech_recognition 

r = sr.Recognizer() 
r.energy_threshold=4000 
with sr.Microphone(device_index = 2, sample_rate = 44100, chunk_size = 512) as source 
print 'listening..' 
audio = r.listen(source) 
print 'processing' 

try: 
    message = (r.recognize_google(audio, language = 'en-us', show_all=False)) 
    call(["espeak", message]) 
except: 
    call(['espeak', 'Could not understand you'])