wavespeed-ai/image-captioner
image-captionerは高精度の画像説明ツールで、画像から詳細で人間らしい説明を生成することができます。コンテンツ理解、アクセシビリティ、データセット注釈付け、SEOおよびマルチモーダルAIワークフローに非常に適しています。すぐに使えるREST推論APIで、性能が最良で、コールドスタートがなく、価格も手頃です。2.
「detail_level」を選択、デフォルトは「medium」
3.
「focus」に重点的に注目する領域を記入(オプション)
4.
「enable_sync_mode」、デフォルトはfalseで、タスクインターフェースをもう一度呼び出す必要があります。trueの場合は、結果が生成されてアップロードされ るまで待ってから応答を返します
Request
Body Params application/jsonRequired
{
"detail_level": "medium",
"enable_sync_mode": false,
"image": "https://d1q70pf5vjeyhc.cloudfront.net/media/92d2d4ca66f84793adcb20742b15d262/images/1763119579060567755_cjMaoFHV.png"
}
Request Code Samples
curl --location --request POST 'https://api.302.ai/ws/api/v3/wavespeed-ai/image-captioner' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
"detail_level": "medium",
"enable_sync_mode": false,
"image": "https://d1q70pf5vjeyhc.cloudfront.net/media/92d2d4ca66f84793adcb20742b15d262/images/1763119579060567755_cjMaoFHV.png"
}'
Responses
application/json {
"code": 200,
"message": "success",
"data": {
"id": "38f41631694041b993c5ba7522a9c37d",
"model": "wavespeed-ai/image-captioner",
"outputs": [],
"urls": {
"get": "https://api.302.ai/ws/api/v3/predictions/38f41631694041b993c5ba7522a9c37d/result"
},
"has_nsfw_contents": [],
"status": "created",
"created_at": "2025-11-21T07:47:10.064Z",
"error": "",
"executionTime": 0,
"timings": {
"inference": 0
}
}
}
Modified at 2025-11-28 07:15:09