1

Итак, я использую распознавание речи Microsoft в Windows 10, выполняя упражнения по обучению, диктуя текст в Wordpad и исправляя его, добавляя слова в словарь и т. Д. Я хотел бы использовать программное обеспечение для расшифровки .wav-файлов. Похоже, что это можно сделать с помощью API распознавания речи Windows, но, похоже, это связано с созданием и загрузкой собственных грамматических файлов, что говорит мне о том, что это в основном создаст новый распознаватель речи, который использует одни и те же строительные блоки, но отличается программа из той, которая запускается, когда я нажимаю «Начать распознавание речи» в меню «Пуск». В частности, он будет работать по-разному из-за различий в обучении или настройке.Стандартные значения распознавания речи Microsoft по сравнению с API

Я не прав в этом? И если я не буду, есть ли способ получить все данные, используемые речевым распознавателем по умолчанию, чтобы я мог точно воспроизвести его поведение? Если мне нужно создать отдельный речевой распознаватель со своими собственными грамматическими файлами и отдельной историей обучения и т. Д., Чтобы транскрибировать файлы .wav, пусть так будет, но я хотел бы лучше понять, что здесь происходит.

+0

Вы говорите о различиях между разными '' ограничениями 'SpeechRecognizer'? Я не могу понять, что вы хотите сделать, но если вы не укажете каких-либо ограничений для вашего объекта SpeechRecognizer, по умолчанию будет использоваться предопределенная грамматика диктовки (SpeechRecognitionTopicConstrant). –

ответ

0

Проект с открытым исходным кодом Woundify содержит примеры преобразования wav-файлов и текста (STT).

 Смежные вопросы

  • Нет связанных вопросов^_^