Я пытаюсь преобразовать видеоклип mp4 в аудиофайл FLAC, а затем речевая речь Google выплевывает слова из видео, чтобы я мог обнаружить, если были сказаны конкретные слова.Google Speech API «Частота дискретизации в запросе не соответствует заголовку FLAC»
У меня все работает за исключением того, что я получаю сообщение об ошибке от Speech API:
{
"error": {
"code": 400,
"message": "Sample rate in request does not match FLAC header.",
"status": "INVALID_ARGUMENT"
}
}
Я использую FFMPEG для того, чтобы преобразовать mp4 в файл FLAC. Я указываю, что файл FLAC должен быть 16 бит в команде, но когда я нажимаю правой кнопкой мыши на файл FLAC, Windows говорит мне, что это 302 Кбит/с.
Вот мой PHP код:
// convert mp4 video to 16 bit flac audio file
$cmd = 'C:/wamp/www/ffmpeg/bin/ffmpeg.exe -i C:/wamp/www/test.mp4 -c:a flac -sample_fmt s16 C:/wamp/www/test.flac';
exec($cmd, $output);
// convert flac to text so we can detect if certain words were said
$data = array(
"config" => array(
"encoding" => "FLAC",
"sampleRate" => 16000,
"languageCode" => "en-US"
),
"audio" => array(
"content" => base64_encode(file_get_contents("test.flac")),
)
);
$json_data = json_encode($data);
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://speech.googleapis.com/v1beta1/speech:syncrecognize?key=MY_API_KEY');
curl_setopt($ch, CURLOPT_HTTPHEADER, array("Content-Type: application/json"));
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, $json_data);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
$result = curl_exec($ch);
Существует разница между форматом выборки (который вы установили в 16) и частотой дискретизации. – fakedad
Спасибо, я понял это и дал ответ. Кажется, API Google Speech чрезвычайно разборчив с битами, образцом и каналом. – kjdion84