Я использовал (предварительный) запрос CRIS для текстовой службы в Azure. Для некоторых коротких wav-файлов я получаю правильный текстовый эквивалент, но за ним следует «non». Это ключевое слово, означающее «не-слово», или это ошибка? - это происходит как при использовании базовой диалоговой модели, так и при использовании пользовательской языковой модели на основе базовой диалоговой модели, но не происходит с моделью поиска и диктовки.Azure Custom Speech Service «non» ответ
например, я посылаю шумный wav-файл кого-то, говорящего «да», и я возвращаюсь «да не». Если wav-файл не шумный, этого не происходит, и если устного текста есть два или более слова, это не происходит. это похоже на шумные однословные файлы. что означает «не»?