Run in Apifox
すべてのモデルに画像認識機能を追加するには、それらを開くには2つの方法があります。 1.GPT-3.5-Turbo-ocr(サードパーティソフトウェアに便利な)など、すべてのモデル接尾辞に-corを追加 2.モデルを要求するときにOCRモデルを指定します:「OCR_Model」:「GPT-4O-MINI」、例のように(APIに便利) 注:マルチモーダルモデルに-ocrの接尾辞がある場合、指定されたOCRモデルまたはデフォルトのOCRモデルも画像分析に使用されるため、マルチモーダルモデルのこの機能を可能な限りオンにしないでください。 この関数の原則は次のとおりです。各要求の前に、ユーザーイメージを解析のためにマルチモーダルモデルに渡し、モデルの参照情報として分析結果をモデルコンテキストに持ち込みます。特定のプロセスは、APIが呼び出されるとログで表示できます。使用されるデフォルトのOCRモデルは、GPT-4O-MINIになりました。 画像分析プロンプトワード: Request Body Params application/json
{
"model" : "gpt-3.5-turbo-ocr" ,
"ocr_model" : "gpt-4o-mini" ,
"stream" : false ,
"messages" : [
{
"role" : "user" ,
"content" : [
{
"type" : "text" ,
"text" : "这张图片有什么"
} ,
{
"type" : "image_url" ,
"image_url" : {
"url" : "https://s2.loli.net/2024/02/01/QSWVdw9bX56gj7O.jpg"
}
}
]
}
]
} Request Code Samples
curl --location --request POST 'https://api.302.ai/v1/chat/completions' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer sk-mfYQzy0XTFfz4P16vRE4gFrKK1Nly4TozsMqbbb9PSiJUvFO' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "gpt-3.5-turbo-ocr",
"ocr_model":"gpt-4o-mini",
"stream": false,
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "这张图片有什么"
},
{
"type": "image_url",
"image_url": {
"url": "https://s2.loli.net/2024/02/01/QSWVdw9bX56gj7O.jpg"
}
}
]
}
]
}' Responses application/json Generate Code
{
"id" : "chatcmpl-123" ,
"object" : "chat.completion" ,
"created" : 1677652288 ,
"choices" : [
{
"index" : 0 ,
"message" : {
"role" : "assistant" ,
"content" : "\n\nHello there, how may I assist you today?"
} ,
"finish_reason" : "stop"
}
] ,
"usage" : {
"prompt_tokens" : 9 ,
"completion_tokens" : 12 ,
"total_tokens" : 21
}
} Modified at 2025-02-13 02:15:48