Omnihuman-1（デジタル人間がタスクを提出する）

POST

/doubao/omnihuman/video

ユーザーがアップロードした単一画像と音声から、その画像に対応する動画効果を生成します。OmniHumanデジタルヒューマンモデルは、任意のアスペクト比で人物が含まれる画像を入力として受け付け、音声と組み合わせて、臨場感のある高品質な動画を生成します。人物の感情や動きは音声と強く関連しています。また、本モデルはアニメやカートゥーンなどのキャラクターにも一定の汎化性を持ち、コンテンツ表現、歌唱、演技など幅広いシーンで活用できます。
音声の長さは15秒未満にすることを推奨します。これにより生成効果が保証されます。音声が長すぎると、効果が低下する可能性があります。
価格：0.15PTC/秒

Request

Header Params

Body Params application/json

Example

{
    "image_url":"https://file.302.ai/gpt/imgs/20250731/1ead841266e9499ba6bf1ffcbc9c02cd.png",
    "audio_url": "https://file.302ai.cn/gpt/imgs/20250731/7ea29b034c154b3587872a9cc908582f.mp3"
}

Request Code Samples

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location 'https://api.302.ai/doubao/omnihuman/video' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data '{
    "image_url":"https://file.302.ai/gpt/imgs/20250731/1ead841266e9499ba6bf1ffcbc9c02cd.png",
    "audio_url": "https://file.302ai.cn/gpt/imgs/20250731/7ea29b034c154b3587872a9cc908582f.mp3"
}'

Responses

🟢200成功

application/json

Bodyapplication/json

Example

{
    "code": 10000,
    "data": {
        "task_id": "5361805649410983027"
    },
    "message": "Success",
    "request_id": "202507311619023CCB209944B1798D0896",
    "status": 10000,
    "time_elapsed": "1.517715703s"
}

Modified at 2025-11-12 10:57:05

Seedance（タスク結果の取得）

Omnihuman-1（タスク結果を取得する）

Omnihuman-1（デジタル人間がタスクを提出する ）

Request

Request Code Samples

Responses

Omnihuman-1（デジタル人間がタスクを提出する）