Run in Apifox
音声を入力言語に転写します。 転写APIは、転写したい音声ファイルを入力として受け取り、希望する音声転写の出力ファイル形式を指定できます。現在、複数の入力形式と出力形式に対応しています。
Request
Example: Bearer {{YOUR_API_KEY}}
Body Params multipart/form-data
転写する音声ファイルは、以下のいずれかの形式を使用してください:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
使用するモデルのID whisper-v3 , whisper-v3-turbo
none dynamic soft_dynamic bass_dynamic
返信のフォーマットは、以下のいずれかのフォーマットを使用してください:srt、verbose_json、vtt
Request samples curl --location --request POST 'https://api.302.ai/v1/audio/alignments' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--form 'file=@""' \
--form 'text=""' \
--form 'model="whisper-v3-turbo"' \
--form 'vad_model="silero"' \
--form 'preprocessing="none"' \
--form 'response_format="verbose_json"' \
--form 'alignment_model="tdnn_ffn"'
Responses application/json Generate Code
{
"text" : "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
Modified at 2025-01-15 02:54:09