GLM-TTS

POST

/bigmodel/api/paas/v4/audio/speech

GLM-TTS音声合成モデルは、新一代の智谱（Zhipu）音声大規模モデルをコアとしており、従来の音声合成フレームワークを突破しています。コンテキストに基づいてテキストの感情とイントネーションをインテリジェントに予測することで、音声の自然さと表現力を大幅に向上させ、合成音声に真の感情と生命力を与えています。GLM-TTSはアーキテクチャ上、二段階生成を採用しており、訓練にはGRPOに基づく強化学習手法を導入しています。公開された評価における「文字誤り率」と「感情表現」では、オープンソースのSOTA（State Of The Art）性能を達成しています。

価格：0.03 PTC/1000文字

Request

Query Params

Header Params

Body Params application/json

Example

{
      "model": "glm-tts",
      "input": "こんにちは、智譜オープンプラットフォームへようこそ",
      "voice": "tongtong",
      "response_format": "wav",
      "speed": 1.0,
      "volume": 1.0
}

Request Code Samples

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location 'https://api.302.ai/bigmodel/api/paas/v4/audio/speech?output_format=url' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data '{
      "model": "glm-tts",
      "input": "こんにちは、智譜オープンプラットフォームへようこそ",
      "voice": "tongtong",
      "response_format": "wav",
      "speed": 1.0,
      "volume": 1.0
}'

Responses

🟢200成功

application/json

Bodyapplication/json

Example

{
    "created": 1741748613,
    "data": [
        {
            "url": "https://file.302ai.cn/gpt/imgs/c1ae01f52d5b2611dcc419bdc7dff829.jpg"
        }
    ]
}

Modified at 2025-12-30 02:02:25

Inpaint（音楽修正／編集）

GLM-TTS-Clone