独自の最適化されたささやきモデルを使用して、音声を単語レベルのテキスト データに転写します。シングルボーカルのみの価格: 0.001PTC/分
分離 + 転写 + アライメント 価格: 0.003PTC/分
Request
Body Params application/json
{
"audio_url": "https://file.302ai.cn/gpt/imgs/tts_demo_minimax_male-qn-qingse_en.mp3",
"language": "en",
"demucs": true
}
Request Code Samples
curl --location --request POST 'https://api.302.ai/302/vt/subtitle/extract' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--header 'Content-Type: application/json' \
--data-raw '{
"audio_url": "https://file.302ai.cn/gpt/imgs/tts_demo_minimax_male-qn-qingse_en.mp3",
"language": "en",
"demucs": true
}'
Responses
application/json Modified at 2025-01-19 07:10:10