本インターフェースは、録音ファイルの高速認識シーンに適しており、大規模モデルの能力に基づき、より優れた認識効果と迅速な応答体験を提供します。呼び出し形式は、1回のリクエストで認識結果が返され、submit/queryによるポーリングは不要です。利用制限
プロジェクト 制限内容
音声の長さ 2時間以内
音声ファイルサイズ 100MB以内
音声エンコーディング PCM / WAV / MP3 / OGG OPUS対応
アップロードファイルのバイナリストリーム サイズは20MB以内、クライアントのアップロード帯域幅に依存
マルチチャンネル モノラルと比較して、処理時間が相応に増加します
Request
Body Params application/json
{
"url": "https://file.302.ai/gpt/imgs/20250701/a2057cbb50b14e779b11af54c38e6265.mp3"
}
Request Code Samples
curl --location --request POST 'https://api.302.ai/doubao/largemodel/recognize' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--header 'Content-Type: application/json' \
--data-raw '{
"url": "https://file.302.ai/gpt/imgs/20250701/a2057cbb50b14e779b11af54c38e6265.mp3"
}'
Responses
application/json Modified at 2025-08-04 06:11:30