У меня есть следующие, очень простой код (Delphi/Object Pascal), который использует Microsoft SAPI 5.4, чтобы сделать некоторые Text To SpeechSAPI 5.4 Параметры вывода аудио
// init
var engine : tspvoice;
var voice : ispeechobjecttoken;
engine:=tspvoice.Create(nil);
// pick the first voice and assign it to the engine
voice := ISpeechObjectToken(0);
engine.Voice := Voice;
// speak
engine.Speak(text, SVSFlagsAsync);
Однако я не вижу всякого контроля выходной формат (бит на образец/частота). У меня есть пример приложения (TTSapp) из старого SAPI SDKdownload, который позволяет управлять такими параметрами. К сожалению, я не могу найти исходный код в любом месте, и я не могу найти никакой загрузки в обновленный SDK sapi.
Любые подсказки?
Спасибо. Тем не менее, я знал об этом, я уже использовал приведенное выше при записи TTS в файл Wav. Моя проблема в том, что я не вижу одинакового уровня управления (параметры аудиоформата) для вывода в реальном времени. Тем не менее, некоторые тестовые приложения SAPI позволяют пользователю настраивать формат выходного аудиосигнала для выхода волны. – resle