你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文详细介绍了 Azure OpenAI 的推理 REST API 端点。
API 规范
管理 Azure OpenAI 模型和资源并与之交互分为三个主要 API 图面:
- 控制面板
- 数据平面 - 创作
- 数据平面 - 推理
每个 API 图面/规范封装了一组不同的 Azure OpenAI 功能。 每个 API 都有自己独特的预览版和稳定/正式发布 (GA) API 版本集。 预览版目前按月发布。
重要
现在有一个新的预览推理 API。 在 API 生命周期指南中了解详细信息。
API | 最新预览版 | 最新 GA 版本 | 规格 | DESCRIPTION |
---|---|---|---|---|
控制平面 | 2024-06-01-preview |
2024-10-01 |
规范文件 | Azure OpenAI 与所有其他服务共享通用控制平面。 控制平面 API 用于创建 Azure OpenAI 资源、模型部署和其他更高级别的资源管理任务等。 控制平面还控制使用 Azure 资源管理器、Bicep、Terraform 和 Azure CLI 等功能可以执行的操作。 |
数据平面 - 创作 | 2025-04-01-preview |
2024-10-21 |
规范文件 | 数据平面创作 API 可控制微调、文件上传、引入作业、批处理,以及某些模型级查询 |
数据平面 - 推理 | 2025-04-01-preview |
2024-10-21 |
规范文件 | 数据平面推理 API 为补全、聊天补全、嵌入、音频、基于自有数据、Dall-e、助手等功能提供推理功能/终结点。 |
身份验证
Azure OpenAI 提供两种身份验证方法。 可以使用 API 密钥或 Microsoft Entra ID。
API 密钥身份验证:对于这种类型的身份验证,所有 API 请求都必须在
api-key
HTTP 标头中包含 API 密钥。 本快速入门提供有关如何通过此类身份验证进行调用的指南。Microsoft Entra ID 身份验证:可以使用 Microsoft Entra 令牌对 API 调用进行身份验证。 身份验证令牌作为
Authorization
标头包含在请求中。 提供的令牌必须以Bearer
开头,例如Bearer YOUR_AUTH_TOKEN
。 可以阅读有关如何使用 Microsoft Entra ID 进行身份验证的操作指南。
REST API 版本控制
服务 API 使用 api-version
查询参数进行版本控制。 所有版本都遵循 YYYY-MM-DD 日期结构。 例如:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
数据平面推理
本文的其余部分介绍了 2025-04-01-preview
Azure OpenAI 数据平面推理规范的预览版本。
若要查找有关最新 GA API 版本的文档,请参阅最新 GA 数据平面推理 API
补全 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
为提供的提示、参数和所选模型创建补全。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
精选 | 整数 | 在服务器端生成 best_of 补全并返回“最佳”项(每个标记的对数概率最高的项)。 无法流式传输结果。与 n 一起使用时,best_of 控制着候选补全数,n 指定返回的补全数,best_of 必须大于 n 。注意:由于此参数会生成许多补全,因此可能会快速消耗你的标记配额。 谨慎使用并确保对 max_tokens 和 stop 进行了合理的设置。 |
否 | 1 |
echo | 布尔 | 除了完成之外,还回显提示 | 否 | 假 |
frequency_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 | 否 | 0 |
logit_bias | 对象 | 修改指定令牌在完成中出现的可能性。 接受 JSON 对象,该对象将标记(由其在 GPT tokenizer 中的标记 ID 指定)映射到一个 -100 到 100 之间的关联偏差值。 在数学上,采样之前会将偏差添加到由模型生成的 logit 中。 具体效果因模型而异,但 -1 和 1 之间的值会减少或增加选择的可能性;-100 或 100 等值会导致相关令牌的禁止或独占选择。 例如,可以传递 {"50256": -100} 以防止生成 <|endoftext|> 标记。 |
否 | 没有 |
logprobs | 整数 | 包含有关 logprobs 最有可能的输出标记和已选择的标记的对数概率。 例如,如果 logprobs 为 5,则 API 将返回包含 5 个最有可能的标记的列表。 API 将始终返回采样令牌的 logprob ,因此响应中可能最多包含 logprobs+1 个元素。logprobs 的最大值是 5。 |
否 | 没有 |
max_tokens | 整数 | 可以在补全时生成的最大令牌数。 提示加上 max_tokens 的令牌计数不能超过模型的上下文长度。 |
否 | 16 |
n | 整数 | 要为每个提示生成的完成数。 注意:由于此参数会生成许多补全,因此可能会快速消耗你的标记配额。 谨慎使用并确保对 max_tokens 和 stop 进行了合理的设置。 |
否 | 1 |
presence_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否在文本中出现来惩罚新令牌,从而增加模型谈论新话题的可能性。 | 否 | 0 |
提示 | 字符串或数组 | 要生成补全的提示,以字符串、字符串数组、标记数组或标记数组的数组的形式编码。 请注意,<|endoftext|> 是模型在训练期间看到的文档分隔符,因此如果未指定提示,则模型将像从新文档的开头一样生成。 |
是的 | |
seed | 整数 | 指定后,我们的系统将尽最大努力进行确定性采样,以便具有相同 seed 和参数的重复请求应返回相同的结果。无法保证确定性,你应参考 system_fingerprint 响应参数来监视后端的更改。 |
否 | |
stop | 字符串或数组 | 最多四个序列,其中 API 将停止生成更多令牌。 返回的文本将不包含停止序列。 | 否 | |
数据流 | 布尔 | 是否流式传输回部分进度。 如果已设置,令牌将在可用时作为仅限数据的服务器发送的事件发送,并且流式传输由 data: [DONE] 消息终止。 Python 代码示例。 |
否 | 假 |
suffix | 字符串 | 插入的文本完成后的后缀。 此参数仅支持 gpt-3.5-turbo-instruct 。 |
否 | 没有 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 |
否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | createCompletionResponse |
状态代码:默认值
说明:服务不可用
内容类型 | 类型 | 说明 |
---|---|---|
application/json | errorResponse |
例子
示例:
为提供的提示、参数和所选模型创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
响应:状态代码:200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
嵌入 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
获取给定输入的向量表示形式,该输入可由机器学习模型和算法轻松使用。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | 已部署的模型的部署 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
尺寸 | 整数 | 生成的输出嵌入应有的维度数。 仅在 text-embedding-3 及更高版本中受支持。 |
否 | |
编码格式 | 字符串 | 嵌入的返回格式。 可以为 float 或 base64 。 默认为 float 。 |
否 | |
输入 | 字符串或数组 | 要嵌入的输入文本,编码为字符串或令牌数组。 若要在单个请求中嵌入多项输入,请传递一个由字符串构成的数组或一个由令牌数组构成的数组。 输入不能超过模型的最大输入标记(8192 标记), text-embedding-ada-002 不能为空字符串,任何数组都必须为 2048 维度或更少。 |
是的 | |
输入类型 | 字符串 | 要使用的嵌入搜索的输入类型 | 否 | |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | 对象 |
例子
示例:
返回给定提示的嵌入。
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
{
"input": [
"this is a test"
]
}
响应:状态代码:200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0020113448
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
聊天补全 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
为聊天消息创建完成操作
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
音频 | 对象 | 音频输出的参数。 当请求音频输出时,使用 modalities: ["audio"] 是必需的。 |
否 | |
└─ 格式 | 枚举 | 指定输出音频格式。 必须是 、wav mp3 、 flac opus 或pcm16 之一。 可能的值: wav 、、mp3 flac 、opus 、pcm16 |
否 | |
└─ voice | 枚举 | 指定语音类型。 支持的语音包括alloy 、echo 、fable 、onyx 和nova shimmer 。可能的值: alloy 、、echo 、fable onyx 、nova 、shimmer |
否 | |
数据来源 | 数组 | 使用它们的 Azure OpenAI 聊天扩展的配置条目。 此附加规范仅与 Azure OpenAI 兼容。 |
否 | |
frequency_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 |
否 | 0 |
function_call | 字符串或 chatCompletionFunctionCallOption | 弃用了,改用 tool_choice 。控制模型调用的函数(如有)。 none 表示模型不会调用函数,而是生成消息。auto 表示模型可以在生成消息和调用函数之间进行选择。通过 {"name": "my_function"} 指定特定函数会强制模型调用该函数。当不存在任何函数时,默认值为 none 。 如果存在函数,则 auto 是默认值。 |
否 | |
functions | 数组 | 弃用了,改用 tools 。模型可能为其生成 JSON 输入的函数的列表。 |
否 | |
logit_bias | 对象 | 修改指定令牌在完成中出现的可能性。 接受 JSON 对象,该对象将标记(由 tokenizer 中的标记 ID 指定)映射到一个介于 -100 到 100 之间的相关偏差值。 在数学上,采样之前会将偏差添加到由模型生成的 logit 中。 具体效果因模型而异,但 -1 和 1 之间的值会减少或增加选择的可能性;-100 或 100 等值会导致相关令牌的禁止或独占选择。 |
否 | 没有 |
logprobs | 布尔 | 是否返回输出标记的对数概率。 如果为 true,则返回在 message 的 content 中返回的每个输出标记的对数概率。 |
否 | 假 |
max_completion_tokens | 整数 | 可为完成生成的令牌数的上限,包括可见的输出令牌和推理令牌。 这仅在 o1 系列模型中受支持。 在未来的 API 版本中,会将支持扩展到其他模型。 | 否 | |
max_tokens | 整数 | 可以在聊天补全时生成的最大词元数。 输入词元和生成的词元的总长度受模型上下文长度的限制。 |
否 | |
消息 | 数组 | 包含到目前为止的对话的消息列表。 Python 代码示例。 | 是的 | |
元数据 | 对象 | 开发人员定义的标记和值,用于在已存储的完成仪表板中筛选完成内容。 | 否 | |
方式 | ChatCompletionModalities | 你希望模型为此请求生成的输出类型。 大多数模型都能够生成文本,这是默认设置: ["text"] gpt-4o-audio-preview 模型还可用于生成音频。 若要请求此模型生成文本和音频响应,你可以使用:["text", "audio"] |
否 | |
n | 整数 | 要为每个输入消息生成的聊天完成选项数。 请注意,将根据所有选项中生成的令牌数向你收费。 将 n 保留为 1 以尽量降低成本。 |
否 | 1 |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
预测 | PredictionContent | 预测输出的配置,当提前知道模型响应的大部分内容时,预测输出可以大大改善响应时间。 这在你重新生成文件且大部分内容仅做微小更改时最为常见。 | 否 | |
presence_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否在文本中出现来惩罚新令牌,从而增加模型谈论新话题的可能性。 |
否 | 0 |
推理努力 | 枚举 | 仅限 o1 模型 限制推理模型的推理力度。 当前支持的值为 low 、medium 和 high 。 减少推理工作量可以加快回复速度,减少回复中用于推理的标记。可能的值: low 、、 medium high |
否 | |
响应格式 | ResponseFormatText 或 ResponseFormatJsonObject 或 ResponseFormatJsonSchema | 一个对象,指定模型必须输出的格式。 与 GPT-4o、GPT-4o mini、GPT-4 Turbo 和高于 gpt-3.5-turbo-1106 的所有 GPT-3.5 Turbo 模型兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,可保证模型与提供的 JSON 架构匹配。设置为 { "type": "json_object" } 可启用 JSON 模式,这可以保证模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
seed | 整数 | 此功能以 Beta 版本提供。 指定后,我们的系统将尽最大努力进行确定性采样,以便具有相同 seed 和参数的重复请求应返回相同的结果。无法保证确定性,你应参考 system_fingerprint 响应参数来监视后端的更改。 |
否 | |
stop | 字符串或数组 | 最多四个序列,其中 API 将停止生成更多令牌。 |
否 | |
存储 | 布尔 | 是否存储此聊天完成请求的输出,以用于模型蒸馏或评估产品。 | 否 | |
数据流 | 布尔 | 如果设置此选项,将发送部分消息增量,如在 ChatGPT 中一样。 词元将在可用时作为服务器发送的事件发送(内容仅包括数据),并且流式传输将由 data: [DONE] 消息终止。 Python 代码示例。 |
否 | 假 |
stream_options | chatCompletionStreamOptions | 用于流式处理响应的选项。 仅在设置 stream: true 时设置此项。 |
否 | 没有 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
工具选择 | chatCompletionToolChoiceOption | 控制模型调用哪些工具(如有)。 none 表示模型不会调用任何工具,而是生成消息。 auto 表示模型可以在生成消息和调用一个或多个工具之间进行选择。 required 表示模型必须调用一个或多个工具。 通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具将强制模型调用该工具。 如果没有工具,则 none 为默认值。 如果存在工具,则 auto 为默认值。 |
否 | |
工具 | 数组 | 模型可能调用的工具列表。 目前,仅支持函数作为工具。 使用它可以提供函数列表,模型可能为其生成 JSON 输入。 最多支持 128 个函数。 |
否 | |
top_logprobs | 整数 | 一个介于 0 和 20 之间的整数,指定在每个标记位置最有可能返回的的标记数,每个都有关联的对数概率。 如果使用此参数,则必须将 logprobs 设置为 true 。 |
否 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 |
否 | |
用户安全上下文 | userSecurityContext | 用户安全性上下文包含描述 AI 应用程序本身以及与 AI 应用程序交互的最终用户的多个参数。 这些字段通过提供全面的方法来保护 AI 应用程序,从而帮助安全运营团队调查和缓解安全事件。 详细了解如何使用 Microsoft Defender for Cloud 保护 AI 应用程序。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | 对象 |
状态代码:默认值
说明:服务不可用
内容类型 | 类型 | 说明 |
---|---|---|
application/json | errorResponse |
例子
示例:
为提供的提示、参数和所选模型创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
基于 Azure 认知搜索数据和系统分配的托管标识创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
基于 Azure 认知搜索图像矢量数据创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"query_type": "vector",
"fields_mapping": {
"image_vector_fields": [
"image_vector"
]
},
"authentication": {
"type": "api_key",
"key": "{api key}"
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion."
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
基于 Azure 认知搜索矢量数据、以前的助手消息和用户分配的托管标识创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
为提供的 Azure Cosmos DB 创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
为提供的 Mongo DB 创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "mongo_db",
"parameters": {
"authentication": {
"type": "username_and_password",
"username": "<username>",
"password": "<password>"
},
"endpoint": "<endpoint_name>",
"app_name": "<application name>",
"database_name": "sampledb",
"collection_name": "samplecollection",
"index_name": "sampleindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
为提供的 Elasticsearch 创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "elasticsearch",
"parameters": {
"endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
"index_name": "{index name}",
"authentication": {
"type": "key_and_key_id",
"key": "{key}",
"key_id": "{key id}"
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
示例:
为提供的 Pinecone 资源创建补全。
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "pinecone",
"parameters": {
"authentication": {
"type": "api_key",
"key": "{api key}"
},
"environment": "{environment name}",
"index_name": "{index name}",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"title_field": "title",
"url_field": "url",
"filepath_field": "filepath",
"content_fields": [
"content"
],
"content_fields_separator": "\n"
}
}
}
]
}
响应:状态代码:200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
听录 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
将音频转录为输入语言。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
Content-Type:multipart/form-data
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件 | 字符串 | 要转录的音频文件对象。 | 是的 | |
语言 | 字符串 | 输入音频的语言。 以 ISO-639-1 格式提供输入语言将提高准确性并减少延迟。 | 否 | |
提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 提示应与音频语言匹配。 | 否 | |
响应格式 | audioResponseFormat | 定义输出的格式。 | 否 | |
温度 | 数字 | 采样温度,介于 0 和 1 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 如果设置为 0,则模型将使用对数概率自动升高温度,直到达到特定阈值。 | 否 | 0 |
timestamp_granularities[] | 数组 | 要为此听录填充的时间戳粒度。 response_format 必须设为 verbose_json 以使用时间戳粒度。 支持以下任一选项或两个选项:word 或 segment 。 注意:段时间戳没有额外的延迟,但生成单词时间戳会产生额外的延迟。 |
否 | ['segment'] |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | 对象 | |
text/plain | 字符串 | 输出格式的转录文本(当 response_format 为 text 、vtt 或 srt 之一时)。 |
例子
示例:
从提供的语音音频数据中获取转录的文本和关联的元数据。
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
示例:
从提供的语音音频数据中获取转录的文本和关联的元数据。
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
响应:状态代码:200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
翻译 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
将输入音频转录并翻译为英语文本。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
Content-Type:multipart/form-data
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件 | 字符串 | 要翻译的音频文件。 | 是的 | |
提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 提示应为英语。 | 否 | |
响应格式 | audioResponseFormat | 定义输出的格式。 | 否 | |
温度 | 数字 | 采样温度,介于 0 和 1 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 如果设置为 0,则模型将使用对数概率自动升高温度,直到达到特定阈值。 | 否 | 0 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | 对象 | |
text/plain | 字符串 | 输出格式的转录文本(当 response_format 为 text、vtt 或 srt 之一时)。 |
例子
示例:
从提供的语音音频数据中获取转录的英语语言文本和关联的元数据。
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
响应:状态代码:200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
示例:
从提供的语音音频数据中获取转录的英语语言文本和关联的元数据。
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
响应:状态代码:200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
语音 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
从输入文本生成音频。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
内容类型:multipart/form-data
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
输入 | 字符串 | 要为其合成音频的文本。 最大长度为 4096 个字符。 | 是的 | |
响应格式 | 枚举 | 合成音频的格式。 可能的值: mp3 、、opus 、aac flac 、wav 、pcm |
否 | |
速度 | 数字 | 合成音频的速度。 从 0.25 到 4.0 范围选择值。 1.0 是默认值。 |
否 | 1.0 |
voice | 枚举 | 用于语音合成的语音。 可能的值: alloy 、、echo 、fable onyx 、nova 、shimmer |
是的 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/octet-stream | 字符串 |
例子
示例:
从提供的文本合成音频。
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
{
"input": "Hi! What are you going to make?",
"voice": "fable",
"response_format": "mp3"
}
响应:状态代码:200
{
"body": "101010101"
}
生成图像 - 创建
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
根据给定的 DALLE 或 gpt-image-1 模型部署上的文本描述生成一批图像
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
后台的 | imageBackground | 允许为生成的图像的背景设置透明度。 仅 gpt-image-1 支持此参数。 | 否 | 汽车 |
n | 整数 | 要生成的图像数。 对于 dall-e-3,仅支持 n=1。 | 否 | 1 |
输出压缩 | 整数 | 生成的图像的压缩级别(0-100%)。 此参数仅在 gpt-image-1 的 jpeg 输出格式下受到支持。 | 否 | 100 |
输出格式 | imagesOutputFormat | 返回生成的图像的文件格式。 仅支持 gpt-image-1。 | 否 | png |
提示 | 字符串 | 所需图像的文本说明。 gpt-image-1 的最大长度为 32000 个字符,dall-e-3 的最大长度为 4000 个字符 | 是的 | |
quality | imageQuality | 将生成的图像的质量。 | 否 | 汽车 |
响应格式 | imagesResponseFormat | 返回生成图像的格式。 | 否 | url |
大小 | imageSize | 生成的图像的大小。 | 否 | 汽车 |
样式 | imageStyle | 生成的图像的样式。 仅支持 dall-e-3。 | 否 | vivid |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | generateImagesResponse |
状态代码:默认值
说明:发生错误。
内容类型 | 类型 | 说明 |
---|---|---|
application/json | dalleErrorResponse |
例子
示例:
根据提示创建图像。
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
响应:状态代码:200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
},
"custom_blocklists": {
"filtered": false,
"details": []
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
图像代系 - 编辑
POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview
根据给定 gpt-image-1 模型部署上的文本描述编辑图像
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
部署标识符 (deployment-id) | 路径 | 是的 | 字符串 | |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
Content-Type:multipart/form-data
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
图像 | 字符串或数组 | 待编辑的图片。 必须是受支持的图像文件或图像数组。 每个图像应为小于 25MB 的 png 或 jpg 文件。 | 是的 | |
过滤 | 字符串 | 另一个图像,其完全透明区域(例如 alpha 为零)指示应编辑图像的位置。 如果提供了多个映像,掩码将应用于第一个图像。 必须是有效的 PNG 文件,小于 4MB,并且具有与图像相同的尺寸。 | 否 | |
n | 整数 | 要生成的图像数。 | 否 | 1 |
提示 | 字符串 | 所需图像的文本说明。 最大长度为 32000 个字符。 | 是的 | |
quality | imageQuality | 将生成的图像的质量。 | 否 | 汽车 |
响应格式 | imagesResponseFormat | 返回生成图像的格式。 | 否 | url |
大小 | imageSize | 生成的图像的大小。 | 否 | 汽车 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | generateImagesResponse |
状态代码:默认值
说明:发生错误。
内容类型 | 类型 | 说明 |
---|---|---|
application/json | dalleErrorResponse |
列表 - 助手
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
返回助手列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | listAssistantsResponse |
例子
示例:
返回助手列表。
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "asst_abc123",
"object": "assistant",
"created_at": 1707257477,
"name": "Stock Analyst",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc456",
"object": "assistant",
"created_at": 1698982718,
"name": "My Assistant",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant designed to make me better at coding!",
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc789",
"object": "assistant",
"created_at": 1698982643,
"name": null,
"description": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
],
"first_id": "asst_abc123",
"last_id": "asst_abc789",
"has_more": false
}
}
创建 - 助手
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
使用模型和说明创建助手。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 助手的说明。 最大长度为 512 个字符。 |
否 | |
instructions | 字符串 | 助手使用的系统说明。 最大长度为 256,000 个字符。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 是的 | ||
姓名 | 字符串 | 助手的名称。 最大长度为 256 个字符。 |
否 | |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此助手的矢量存储。 助手最多可以附加 1 个矢量存储。 |
否 | |
向量存储 | 数组 | 一个帮助程序,用于创建具有 file_ids 的矢量存储,并将其附加到此助手。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 在助手上启用的工具列表。 每个助手最多可以有 128 个工具。 工具类型可以是 code_interpreter 、retrieval 或 function 。 |
否 | [] |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | assistantObject |
例子
示例:
使用模型和说明创建助手。
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
{
"name": "Math Tutor",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"model": "gpt-4-1106-preview"
}
响应:状态代码:200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant",
"created_at": 1707295707,
"name": "Math Tutor",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
获取 - 助手
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
检索助手。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
助手ID | 路径 | 是的 | 字符串 | 要检索的助手的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | assistantObject |
例子
示例:
检索助手。
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "asst_abc123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
"tools": [
{
"type": "file_search"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
修改 - 助手
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
修改助手。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
助手ID | 路径 | 是的 | 字符串 | 要修改的助手的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 助手的说明。 最大长度为 512 个字符。 |
否 | |
instructions | 字符串 | 助手使用的系统说明。 最大长度为 32768 个字符。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 否 | ||
姓名 | 字符串 | 助手的名称。 最大长度为 256 个字符。 |
否 | |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 替代可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 替代附加到此助手的矢量存储。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 在助手上启用的工具列表。 每个助手最多可以有 128 个工具。 工具类型可以是 code_interpreter 、retrieval 或 function 。 |
否 | [] |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | assistantObject |
例子
示例:
修改助手。
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
{
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"model": "gpt-4-turbo"
}
响应:状态代码:200
{
"body": {
"id": "asst_123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": []
}
},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
删除 - 助手
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
删除助手。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
助手ID | 路径 | 是的 | 字符串 | 要删除的助手的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | deleteAssistantResponse |
例子
示例:
删除助手。
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant.deleted",
"deleted": true
}
}
创建 - 线程
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
创建线程。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
消息 | 数组 | 用于启动线程的消息列表。 | 否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
工具资源 | 对象 | 一组可供此线程中的助手工具使用的资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
└─ file_search | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此线程的矢量存储。 线程最多可以附加 1 个矢量存储。 |
否 | |
└─ vector_stores | 数组 | 一个帮助程序,用于创建具有 file_ids 的矢量存储,并将其附加到此线程。 线程最多可以附加 1 个矢量存储。 |
否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | threadObject |
例子
示例:
创建线程。
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {}
}
}
获取 - 线程
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
检索线程。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 要检索的线程的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | threadObject |
例子
示例:
检索线程。
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {},
"tool_resources": {
"code_interpreter": {
"file_ids": []
}
}
}
}
修改 - 线程
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
修改线程。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 要修改的线程的 ID。 只有metadata 可以被修改。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
工具资源 | 对象 | 一组可供此线程中的助手工具使用的资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
└─ code_interpreter | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此线程的矢量存储。 线程最多可以附加 1 个矢量存储。 |
否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | threadObject |
例子
示例:
修改线程。
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
响应:状态代码:200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {
"modified": "true",
"user": "abc123"
},
"tool_resources": {}
}
}
删除 - 线程
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
删除线程。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 要删除的线程的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | deleteThreadResponse |
例子
示例:
删除线程。
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread.deleted",
"deleted": true
}
}
列出 - 消息
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
返回给定线程的消息列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 消息所属的线程的 ID。 |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
run_id | 查询 | 否 | 字符串 | 按生成消息的运行 ID 筛选消息。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | 列出消息响应 |
例子
示例:
列出消息
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
},
{
"id": "msg_abc456",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "Hello, what is AI?",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
],
"first_id": "msg_abc123",
"last_id": "msg_abc456",
"has_more": false
}
}
创建 - 消息
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
创建消息。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 要为其创建消息的线程的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
attachments | 数组 | 附加到消息的文件列表及其应添加到的工具。 | 否 | |
内容 | 字符串 | 消息的内容。 | 是的 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
角色 | 字符串 | 正在创建消息的实体的角色。 允许的值包括: - user :指示消息是由实际用户发送的,应在大多数情况下用于表示用户生成的消息。- assistant :指示消息由助手生成。 使用此值将来自助手的消息插入对话。 |
是的 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | messageObject |
例子
示例:
创建消息。
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
{
"role": "user",
"content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}
响应:状态代码:200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"assistant_id": null,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
}
获取 - 消息
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
检索消息。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 此消息所属的线程的 ID。 |
message_id | 路径 | 是的 | 字符串 | 要检索的消息的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | messageObject |
例子
示例:
检索消息。
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"file_ids": [],
"assistant_id": null,
"run_id": null,
"metadata": {}
}
}
修改 - 消息
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
修改消息。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 此消息所属的线程的 ID。 |
消息编号 | 路径 | 是的 | 字符串 | 要修改的消息的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | messageObject |
例子
示例:
修改消息。
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
响应:状态代码:200
{
"body": {
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699017614,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"file_ids": [],
"metadata": {
"modified": "true",
"user": "abc123"
}
}
}
创建 - 线程和运行
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
创建线程并在单个请求中运行它。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
助手ID | 字符串 | 用于执行此运行的助手的 ID。 | 是的 | |
instructions | 字符串 | 替代助手的默认系统消息。 这对按运行修改行为很有用。 | 否 | |
max_completion_tokens | 整数 | 在运行过程中可能会使用的完成令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的补全令牌数。 如果运行超过指定的补全令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
最大提示标记数 | 整数 | 在运行过程中可能会使用的提示令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的提示令牌数。 如果运行超过指定的提示令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 要用于执行此运行的模型的 ID。 如果此处提供了一个值,它将替代与助手关联的模型。 否则,将使用与助手关联的模型。 | 否 | |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
数据流 | 布尔 | 如果为 true ,则返回在运行为服务器发送事件期间发生的事件流,在运行进入附带 data: [DONE] 消息的终端状态时终止。 |
否 | |
stream_options | chatCompletionStreamOptions | 用于流式处理响应的选项。 仅在设置 stream: true 时设置此项。 |
否 | 没有 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
会话 | createThreadRequest | 否 | ||
工具选择 | assistantsApiToolChoiceOption | 控制模型调用哪些工具(如有)。none 表示模型不会调用任何工具,而是生成消息。auto 是默认值,表示模型可以在生成消息和调用工具之间进行选择。指定特定工具(例如 {"type": "file_search"} 或 {"type": "function", "function": {"name": "my_function"}} )将强制模型调用该工具。 |
否 | |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此助手的矢量存储 ID。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 替代助手可用于此运行的工具。 这对按运行修改行为很有用。 | 否 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
截断策略 | truncationObject | 用于指示在运行之前如何截断线程的控件。 使用此控件可控制运行的初始上下文窗口。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runObject |
例子
示例:
创建线程并在单个请求中运行它。
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123",
"thread": {
"messages": [
{
"role": "user",
"content": "Explain deep learning to a 5 year old."
}
]
}
}
响应:状态代码:200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076792,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": null,
"expires_at": 1699077392,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"required_action": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant.",
"tools": [],
"tool_resources": {},
"metadata": {},
"temperature": 1.0,
"top_p": 1.0,
"max_completion_tokens": null,
"max_prompt_tokens": null,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"incomplete_details": null,
"usage": null,
"response_format": "auto",
"tool_choice": "auto"
}
}
列出 - 运行
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
返回属于线程的运行列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 运行所属的线程的 ID。 |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | listRunsResponse |
例子
示例:
返回属于线程的运行列表。
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
},
{
"id": "run_abc456",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
],
"first_id": "run_abc123",
"last_id": "run_abc456",
"has_more": false
}
}
创建 - 运行
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
创建运行。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 要运行的线程的 ID。 |
include[] | 查询 | 否 | 数组 | 要包含在响应中的其他字段的列表。 目前唯一支持的值是 step_details.tool_calls[*].file_search.results[*].content 提取文件搜索结果内容。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
附加说明 | 字符串 | 在运行指令的末尾追加其他指令。 这对不替代其他指令的情况下按运行修改行为很有用。 | 否 | |
附加消息 | 数组 | 在创建运行之前,将其他消息添加到线程。 | 否 | |
助手ID | 字符串 | 用于执行此运行的助手的 ID。 | 是的 | |
instructions | 字符串 | 替代助手的默认系统消息。 这对按运行修改行为很有用。 | 否 | |
max_completion_tokens | 整数 | 在运行过程中可能会使用的完成令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的补全令牌数。 如果运行超过指定的补全令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
max_prompt_tokens | 整数 | 在运行过程中可能会使用的提示令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的提示令牌数。 如果运行超过指定的提示令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 用于执行此运行的模型的 ID。 如果此处提供了一个值,它将替代与助手关联的模型。 否则,将使用与助手关联的模型。 | 否 | |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
数据流 | 布尔 | 如果为 true ,则返回在运行为服务器发送事件期间发生的事件流,在运行进入附带 data: [DONE] 消息的终端状态时终止。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具选择 | assistantsApiToolChoiceOption | 控制模型调用哪些工具(如有)。none 表示模型不会调用任何工具,而是生成消息。auto 是默认值,表示模型可以在生成消息和调用工具之间进行选择。指定特定工具(例如 {"type": "file_search"} 或 {"type": "function", "function": {"name": "my_function"}} )将强制模型调用该工具。 |
否 | |
工具 | 数组 | 替代助手可用于此运行的工具。 这对按运行修改行为很有用。 | 否 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
截断策略 | truncationObject | 用于指示在运行之前如何截断线程的控件。 使用此控件可控制运行的初始上下文窗口。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runObject |
例子
示例:
创建运行。
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123"
}
响应:状态代码:200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
获取 - 运行
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
检索运行。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 运行的线程的 ID。 |
run_id | 路径 | 是的 | 字符串 | 要检索的运行的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runObject |
例子
示例:
启动运行。
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
"object": "thread.run",
"created_at": 1707303196,
"assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
"thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
"status": "completed",
"started_at": 1707303197,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1707303201,
"last_error": null,
"model": "gpt-4-1106-preview",
"instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
"tools": [],
"file_ids": [],
"metadata": {}
}
}
修改 - 运行
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
修改运行。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 运行的线程的 ID。 |
run_id | 路径 | 是的 | 字符串 | 要修改的运行的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runObject |
例子
示例:
修改运行。
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
{
"metadata": {
"user_id": "user_abc123"
}
}
响应:状态代码:200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {
"user_id": "user_abc123"
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
提交 - 要运行的工具输出
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
当运行具有 status: "requires_action"
且 required_action.type
为 submit_tool_outputs
时,此终结点可用于在工具调用完成后提交输出。 所有输出都必须在单个请求中提交。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 此运行所属的线程的 ID。 |
run_id | 路径 | 是的 | 字符串 | 需要工具输出提交的运行的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据流 | 布尔 | 如果为 true ,则返回在运行为服务器发送事件期间发生的事件流,在运行进入附带 data: [DONE] 消息的终端状态时终止。 |
否 | |
工具输出 | 数组 | 其输出正在提交的工具列表。 | 是的 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runObject |
例子
示例:
当运行具有 status: "requires_action"
且 required_action.type
为 submit_tool_outputs
时,此终结点可用于在工具调用完成后提交输出。 所有输出都必须在单个请求中提交。
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
{
"tool_outputs": [
{
"tool_call_id": "call_001",
"output": "70 degrees and sunny."
}
]
}
响应:状态代码:200
{
"body": {
"id": "run_123",
"object": "thread.run",
"created_at": 1699075592,
"assistant_id": "asst_123",
"thread_id": "thread_123",
"status": "queued",
"started_at": 1699075592,
"expires_at": 1699076192,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": [
"celsius",
"fahrenheit"
]
}
},
"required": [
"location"
]
}
}
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
取消 - 运行
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
取消 in_progress
的运行。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 此运行所属的线程的 ID。 |
run_id | 路径 | 是的 | 字符串 | 要取消的运行的 ID。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runObject |
例子
示例:
取消 in_progress
的运行。
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076126,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "cancelling",
"started_at": 1699076126,
"expires_at": 1699076726,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You summarize books.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": [
"vs_123"
]
}
},
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"response_format": "auto"
}
}
列出 - 运行步骤
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
返回属于运行的运行步骤列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 运行和运行步骤所属的线程的 ID。 |
run_id | 路径 | 是的 | 字符串 | 运行步骤所属的 ID。 |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
api-version | 查询 | 是的 | 字符串 | |
include[] | 查询 | 否 | 数组 | 要包含在响应中的其他字段的列表。 目前唯一支持的值是 step_details.tool_calls[*].file_search.results[*].content 提取文件搜索结果内容。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | listRunStepsResponse |
例子
示例:
返回属于运行的运行步骤列表。
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
],
"first_id": "step_abc123",
"last_id": "step_abc456",
"has_more": false
}
}
获取 - 运行步骤
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
检索运行步骤。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
线程ID | 路径 | 是的 | 字符串 | 运行和运行步骤所属的线程的 ID。 |
run_id | 路径 | 是的 | 字符串 | 运行步骤所属的运行的 ID。 |
step_id | 路径 | 是的 | 字符串 | 要检索的运行步骤的 ID。 |
include[] | 查询 | 否 | 数组 | 要包含在响应中的其他字段的列表。 目前唯一支持的值是 step_details.tool_calls[*].file_search.results[*].content 提取文件搜索结果内容。 |
api-version | 查询 | 是的 | 字符串 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | runStepObject |
例子
示例:
检索运行步骤。
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
}
列出 - 矢量存储
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
返回矢量存储列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | listVectorStoresResponse |
例子
示例:
返回矢量存储列表。
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
},
{
"id": "vs_abc456",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ v2",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
],
"first_id": "vs_abc123",
"last_id": "vs_abc456",
"has_more": false
}
}
创建 - 矢量存储
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
创建矢量存储。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | autoChunkingStrategyRequestParam 或 staticChunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 仅当 file_ids 非空时适用。 |
否 | |
过期时间 | vectorStoreExpirationAfter | 矢量存储过期策略。 | 否 | |
file_ids | 数组 | 矢量存储应使用的文件 ID 列表。 适用于可以访问文件的 file_search 等工具。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
姓名 | 字符串 | 矢量存储的名称。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreObject |
例子
示例:
创建矢量存储。
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
获取 - 矢量存储
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
检索矢量存储。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 要检索的矢量存储的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreObject |
例子
示例:
检索矢量存储。
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776
}
}
修改 - 矢量存储
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
修改矢量存储。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 要修改的矢量存储的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
过期时间 | vectorStoreExpirationAfter | 矢量存储过期策略。 | 否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
姓名 | 字符串 | 矢量存储的名称。 | 否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreObject |
例子
示例:
修改矢量存储。
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
{
"name": "Support FAQ"
}
响应:状态代码:200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
删除 - 矢量存储
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
删除矢量存储。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 要删除的矢量存储的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | deleteVectorStoreResponse |
例子
示例:
删除矢量存储。
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "vs_abc123",
"object": "vector_store.deleted",
"deleted": true
}
}
列出 - 矢量存储文件
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
返回矢量存储文件列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件所属的矢量存储的 ID。 |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
筛选器 | 查询 | 否 | 字符串 可能的值: in_progress 、completed 、failed 、cancelled |
按文件状态进行筛选。 in_progress , completed , failed , cancelled 之一。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | listVectorStoreFilesResponse |
例子
示例:
返回矢量存储文件列表。
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
创建 - 矢量存储文件
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
通过将文件附加到矢量存储来创建矢量存储文件。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 要为其创建文件的矢量存储的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | chunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 |
否 | |
file_id | 字符串 | 矢量存储应使用的文件 ID。 适用于可以访问文件的 file_search 等工具。 |
是的 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreFileObject |
例子
示例:
通过将文件附加到矢量存储来创建矢量存储文件。
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
{
"file_id": "file-abc123"
}
响应:状态代码:200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"usage_bytes": 1234,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
获取 - 矢量存储文件
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
检索矢量存储文件。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件所属的矢量存储的 ID。 |
file_id | 路径 | 是的 | 字符串 | 要检索的文件的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreFileObject |
例子
示例:
检索矢量存储文件。
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
删除 - 矢量存储文件
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
删除矢量存储文件。 这会从矢量存储中删除文件,但不会删除文件本身。 若要删除该文件,请使用删除文件终结点。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件所属的矢量存储的 ID。 |
file_id | 路径 | 是的 | 字符串 | 要删除的文件的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | deleteVectorStoreFileResponse |
例子
示例:
删除矢量存储文件。 这会从矢量存储中删除文件,但不会删除文件本身。 若要删除该文件,请使用删除文件终结点。
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "file_abc123",
"object": "vector_store.file.deleted",
"deleted": true
}
}
更新向量存储文件属性
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
更新向量存储文件的属性。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件所属的矢量存储的 ID。 |
file_id | 路径 | 是的 | 字符串 | 要更新属性的文件的 ID。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
属性 | VectorStoreFileAttributes | 按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符、布尔值或数字的字符串。 |
是的 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreFileObject |
检索矢量存储文件内容
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview
检索矢量存储文件的已分析内容。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 矢量存储的 ID。 |
file_id | 路径 | 是的 | 字符串 | 矢量存储中文件的 ID。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | VectorStoreFileContentResponse |
搜索矢量存储
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview
根据查询和文件属性筛选器,在向量存储库中搜索相关的区块。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 要搜索的矢量存储的 ID。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
筛选器 | ComparisonFilter 或 CompoundFilter | 基于文件属性应用的筛选器。 | 否 | |
max_num_results(最大结果数) | 整数 | 要返回的最大结果数。 此数字应介于 1 和 50 之间(含)。 | 否 | 10 |
查询 | 字符串或数组 | 用于搜索的查询字符串 | 是的 | |
排名选项 | 对象 | 用于搜索的排名选项。 | 否 | |
└─ ranker | 枚举 | 可能的值: auto default-2024-11-15 |
否 | |
分数阈值 | 数字 | 否 | 0 | |
rewrite_query | 布尔 | 是否重写矢量搜索的自然语言查询。 | 否 | 假 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | VectorStoreSearchResultsPage |
创建 - 矢量存储文件批处理
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
创建矢量存储文件批处理。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 要为其创建文件批处理的矢量存储的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | chunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 |
否 | |
file_ids | 数组 | 矢量存储应使用的文件 ID 列表。 适用于可以访问文件的 file_search 等工具。 |
是的 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreFileBatchObject |
例子
示例:
创建矢量存储文件批处理。
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
{
"file_ids": [
"file-abc123",
"file-abc456"
]
}
响应:状态代码:200
{
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
获取 - 矢量存储文件批处理
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
检索矢量存储文件批处理。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件批处理所属的矢量存储的 ID。 |
batch_id | 路径 | 是的 | 字符串 | 正在检索的文件批处理的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreFileBatchObject |
例子
示例:
检索矢量存储文件批处理。
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
}
取消 - 矢量存储文件批处理
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
取消矢量存储文件批处理。 这会尝试尽快取消此批处理中的文件处理。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件批处理所属的矢量存储的 ID。 |
batch_id | 路径 | 是的 | 字符串 | 要取消的文件批处理的 ID。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | vectorStoreFileBatchObject |
例子
示例:
取消矢量存储文件批处理。 这会尝试尽快取消此批处理中的文件处理。
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "cancelling",
"file_counts": {
"in_progress": 12,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 15
}
}
}
列出 - 矢量存储文件批处理文件
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
返回批处理中的矢量存储文件列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
vector_store_id | 路径 | 是的 | 字符串 | 文件所属的矢量存储的 ID。 |
batch_id | 路径 | 是的 | 字符串 | 文件所属的文件批处理的 ID。 |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
按 created_at 对象的时间戳排序顺序。 asc 为升序和 desc 降序。 |
after | 查询 | 否 | 字符串 | 用于分页的游标。 after 是一个对象 ID,用于定义你在列表中的位置。 例如,如果你发出一个列表请求并收到 100 个对象,以 obj_foo 结尾,那么你的后续调用可以包含 after=obj_foo,以提取列表的下一页。 |
before | 查询 | 否 | 字符串 | 用于分页的游标。 before 是一个对象 ID,用于定义你在列表中的位置。 例如,如果发出列表请求并接收 100 个对象,从obj_foo开始,后续调用可以包括 before=obj_foo,以便提取列表的上一页。 |
筛选器 | 查询 | 否 | 字符串 可能的值: in_progress 、completed 、failed 、cancelled |
按文件状态进行筛选。 in_progress , completed , failed , cancelled 之一。 |
api-version | 查询 | 是的 | 字符串 | API 版本 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | listVectorStoreFilesResponse |
例子
示例:
返回矢量存储文件列表。
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
响应:状态代码:200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
创建 - Realtimesession
POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview
创建临时 API 令牌,以便在客户端应用程序中使用实时 API。 可以配置与 session.update
客户端事件相同的会话参数。
它返回一个会话对象,并且 client_secret
是一个包含可用临时 API 令牌的密钥,该令牌可用于对浏览器客户端进行实时 API 认证。
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
输入音频格式 | 枚举 | 输入音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。对于 pcm16 ,输入音频必须是采样率为 24kHz、单声道(mono)、小端字节顺序的 16 位 PCM。可能的值: pcm16 、、 g711_ulaw g711_alaw |
否 | |
输入音频降噪 | 对象 | 输入音频降噪的配置。 可以将其设置为 null 以关闭功能。降噪会筛选添加到输入音频缓冲区的音频,然后再将其发送到 VAD 和模型。 筛选音频可以通过改进输入音频的感知来提高 VAD 和轮次检测准确性(减少误报)和模型性能。 |
否 | |
└─ 类型 | 枚举 | 降噪类型。 near_field 用于近距离麦克风(如耳机), far_field 适用于远场麦克风,例如笔记本电脑或会议室麦克风。可能的值: near_field far_field |
否 | |
输入音频转录 | 对象 | 输入音频转录的配置,默认是关闭状态,可以设置为null 在开启后关闭。 输入音频转录不是模型本身的功能,因为模型可以直接处理音频。 听录通过听录终结点异步运行,应被视为输入音频内容的参考,而不是模型听到的精确内容。 客户端可以选择设置语言和转录提示,它们为转录服务提供额外的指导。 |
否 | |
└─ 语言 | 字符串 | 输入音频的语言。 以 ISO-639-1(例如 en )格式提供输入语言将提高准确性并减少延迟。 |
否 | |
└─ 模型 | 字符串 | 用于转录的模型,当前的选项有gpt-4o-transcribe 、gpt-4o-mini-transcribe 、和whisper-1 。 |
否 | |
└─ 提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 对于 whisper-1 ,提示是关键字列表。对于 gpt-4o-transcribe 模型,提示是一个自由文本字符串,例如“预期与技术相关的字词”。 |
否 | |
instructions | 字符串 | 附加到模型调用前的默认系统指令(即系统消息)。 此字段允许客户端指导模型处理所需的响应。 可以指示模型响应内容和格式(例如“非常简洁”、“行为友好”、“下面是良好响应的示例”)和音频行为(例如“快速说话”、“将情感注入语音”、“经常笑”)。 这些说明不保证遵循模型,但它们为模型提供有关所需行为的指南。 请注意,如果未设置此字段,服务器将设置默认说明,并在会话开始时的 session.created 事件中可见。 |
否 | |
最大响应输出标记数 | 整数或字符串 | 单个助手响应(包括工具调用)的最大输出令牌数。 提供介于 1 和 4096 之间的整数来限制输出令牌,或者 inf 提供给定模型的最大可用令牌。 默认为 inf 。 |
否 | |
方式 | 模型可以响应的一组模态。 若要禁用音频,请将此项设置为 [“text”]。 |
否 | ||
模型 | 字符串 | 用于此会话的部署的名称。 |
否 | |
输出音频格式 | 枚举 | 输出音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。对于 pcm16 ,输出音频的采样速率为 24kHz。可能的值: pcm16 、、 g711_ulaw g711_alaw |
否 | |
温度 | 数字 | 模型的采样温度限制为 [0.6, 1.2]。 对于音频模型,强烈建议将温度为 0.8,以获得最佳性能。 |
否 | 0.8 |
工具选择 | 字符串 | 模型如何选择工具。 选项为 auto 、 none 或 required 指定函数。 |
否 | 汽车 |
工具 | 数组 | 可用于模型的工具(函数)。 | 否 | |
turn_detection | 对象 | 用于轮次检测、以太网服务器 VAD 或语义 VAD 的配置。 这可以设置为 null 关闭,在这种情况下,客户端必须手动触发模型响应。服务器 VAD 表示模型将基于音频音量检测语音的开始和结束,并在用户语音结束时做出响应。 语义 VAD 更高级,使用轮次检测模型(与 VAD 结合使用)以语义方式估计用户是否已完成说话,然后根据此概率动态设置超时。 例如,如果用户的语音以 uhhm 结尾,模型将判定轮次结束的概率较低,并等待更长时间,以便用户继续说话。 这对于更自然的对话非常有用,但延迟可能更高。 |
否 | |
└─ 创建响应 | 布尔 | 是否在发生 VAD 停止事件时自动生成响应。 |
否 | True |
└─ eagerness | 枚举 | 仅用于 semantic_vad 模式。 模型做出响应的积极性。 low 将等待更长的时间让用户继续说话,而 high 会更快地响应。 auto 是默认值,等效于 medium 。可能的值: low 、medium 、high 、auto |
否 | |
└─ interrupt_response | 布尔 | 当 VAD 启动事件发生时,是否自动中断输出到默认会话(例如 conversation 的 auto )的任何进行中的响应。 |
否 | True |
└─ prefix_padding_ms | 整数 | 仅用于 server_vad 模式。 VAD 检测到语音之前要包括的音频量(以毫秒为单位)。 默认为 300 毫秒。 |
否 | |
silence_duration_ms(静音时长毫秒) | 整数 | 仅用于 server_vad 模式。 用于检测语音停止的沉默持续时间(以毫秒为单位)。 默认值为 500 毫秒。 使用较短的值,模型将更快地响应,但可能会在用户短暂暂停时突然打断。 |
否 | |
~~ 阈值 | 数字 | 仅用于 server_vad 模式。 VAD(0.0 到 1.0)的激活阈值,默认为 0.5。 更高的阈值需要更响亮的音频来激活模型,因此在干扰环境中性能可能更好。 |
否 | |
└─ 类型 | 枚举 | 轮次检测的类型。 可能的值: server_vad semantic_vad |
否 | |
voice | VoiceIdsShared | 否 |
反应
状态代码:200
说明:已成功创建会话。
内容类型 | 类型 | 说明 |
---|---|---|
application/json | RealtimeSessionCreateResponse |
创建 - Transcriptionrealtimesession
POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview
创建临时 API 令牌,以便在客户端应用程序中使用实时 API,专门用于实时听录。
可以配置与 transcription_session.update
客户端事件相同的会话参数。
它返回一个会话对象,并且 client_secret
是一个包含可用临时 API 令牌的密钥,该令牌可用于对浏览器客户端进行实时 API 认证。
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
include | 数组 | 要包含在听录中的一组项。 当前可用的项包括: - item.input_audio_transcription.logprobs |
否 | |
输入音频格式 | 枚举 | 输入音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。对于 pcm16 ,输入音频必须是采样率为 24kHz、单声道(mono)、小端字节顺序的 16 位 PCM。可能的值: pcm16 、、 g711_ulaw g711_alaw |
否 | |
输入音频降噪 | 对象 | 输入音频降噪的配置。 可以将其设置为 null 以关闭功能。降噪会筛选添加到输入音频缓冲区的音频,然后再将其发送到 VAD 和模型。 筛选音频可以通过改进输入音频的感知来提高 VAD 和轮次检测准确性(减少误报)和模型性能。 |
否 | |
└─ 类型 | 枚举 | 降噪类型。 near_field 用于近距离麦克风(如耳机), far_field 适用于远场麦克风,例如笔记本电脑或会议室麦克风。可能的值: near_field far_field |
否 | |
输入音频转录 | 对象 | 输入音频转录的配置。 客户端可以选择设置语言和转录提示,它们为转录服务提供额外的指导。 |
否 | |
└─ 语言 | 字符串 | 输入音频的语言。 以 ISO-639-1(例如 en )格式提供输入语言将提高准确性并减少延迟。 |
否 | |
└─ 模型 | 枚举 | 用于转录的模型,当前的选项有gpt-4o-transcribe 、gpt-4o-mini-transcribe 、和whisper-1 。可能的值: gpt-4o-transcribe 、、 gpt-4o-mini-transcribe whisper-1 |
否 | |
└─ 提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 对于 whisper-1 ,提示是关键字列表。对于 gpt-4o-transcribe 模型,提示是一个自由文本字符串,例如“预期与技术相关的字词”。 |
否 | |
方式 | 模型可以响应的一组模态。 若要禁用音频,请将此项设置为 [“text”]。 |
否 | ||
turn_detection | 对象 | 用于轮次检测、以太网服务器 VAD 或语义 VAD 的配置。 这可以设置为 null 关闭,在这种情况下,客户端必须手动触发模型响应。服务器 VAD 表示模型将基于音频音量检测语音的开始和结束,并在用户语音结束时做出响应。 语义 VAD 更高级,使用轮次检测模型(与 VAD 结合使用)以语义方式估计用户是否已完成说话,然后根据此概率动态设置超时。 例如,如果用户的语音以 uhhm 结尾,模型将判定轮次结束的概率较低,并等待更长时间,以便用户继续说话。 这对于更自然的对话非常有用,但延迟可能更高。 |
否 | |
└─ 创建响应 | 布尔 | 是否在发生 VAD 停止事件时自动生成响应。 不适用于听录会话。 |
否 | True |
└─ eagerness | 枚举 | 仅用于 semantic_vad 模式。 模型做出响应的积极性。 low 将等待更长的时间让用户继续说话,而 high 会更快地响应。 auto 是默认值,等效于 medium 。可能的值: low 、medium 、high 、auto |
否 | |
└─ interrupt_response | 布尔 | 当 VAD 启动事件发生时,是否自动中断输出到默认会话(例如 conversation 的 auto )的任何进行中的响应。 不适用于听录会话。 |
否 | True |
└─ prefix_padding_ms | 整数 | 仅用于 server_vad 模式。 VAD 检测到语音之前要包括的音频量(以毫秒为单位)。 默认为 300 毫秒。 |
否 | |
silence_duration_ms(静音时长毫秒) | 整数 | 仅用于 server_vad 模式。 用于检测语音停止的沉默持续时间(以毫秒为单位)。 默认值为 500 毫秒。 使用较短的值,模型将更快地响应,但可能会在用户短暂暂停时突然打断。 |
否 | |
~~ 阈值 | 数字 | 仅用于 server_vad 模式。 VAD(0.0 到 1.0)的激活阈值,默认为 0.5。 更高的阈值需要更响亮的音频来激活模型,因此在干扰环境中性能可能更好。 |
否 | |
└─ 类型 | 枚举 | 轮次检测的类型。 可能的值: server_vad semantic_vad |
否 |
反应
状态代码:200
说明:已成功创建会话。
内容类型 | 类型 | 说明 |
---|---|---|
application/json | RealtimeTranscriptionSessionCreateResponse |
反应
POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview
创建模型响应。
请求主体
“内容类型”: application/json
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
include | 数组 | 否 | ||
输入 | 字符串或数组 | 模型输入 | 是的 | |
instructions | 字符串 | 将系统(或开发人员)消息作为模型上下文中的第一项插入。 与之前响应一起使用 previous_response_id 时,不会将上一个响应中的说明转交给下一个响应。 这样就可以轻松地在新响应中交换系统(或开发人员)消息。 |
否 | |
最大输出标记数量 (max_output_tokens) | 整数 | 可为响应生成的令牌数上限,包括可见输出令牌和会话状态。 |
否 | |
并行工具调用 | 布尔 | 是否允许模型并行运行工具调用。 |
否 | True |
previous_response_id | 字符串 | 对模型的上一个响应的唯一 ID。 使用此方法可创建多轮次对话。 了解有关聊天状态的详细信息。 |
否 | |
推理 | 推理 | 仅适用于 O 系列模型 推理模型的配置选项。 |
否 | |
存储 | 布尔 | 是否存储生成的模型响应,以便以后通过 API 进行检索。 |
否 | True |
数据流 | 布尔 | 如果设置为 true,模型响应数据将通过服务器发送的事件实时生成并流式传送到客户端。 有关更多信息,请参阅下面的“流媒体”部分。 |
否 | 假 |
文本消息 | 对象 | 来自模型的文本响应的配置选项。 可以是纯文本或结构化 JSON 数据。 了解详细信息: - 文本输入和输出 - 结构化输出 |
否 | |
└─ 格式 | TextResponseFormatConfiguration | 一个对象,指定模型必须输出的格式。 配置 { "type": "json_schema" } 启用结构化输出,这可确保模型与提供的 JSON 架构匹配。默认格式 { "type": "text" } 没有其他选项。不建议用于 gpt-4o 和较新的模型: { "type": "json_object" } 设置为启用较旧的 JSON 模式,这可确保模型生成的消息是有效的 JSON。 对于支持它的模型,首选使用 json_schema 。 |
否 | |
工具选择 | ToolChoiceOptions 或 ToolChoiceTypes 或 ToolChoiceFunction | 模型在生成响应时应如何选择要使用的工具(或工具)。 请参阅参数 tools ,了解如何指定模型可以调用的工具。 |
否 | |
工具 | 数组 | 生成响应时,模型可能会调用的工具数组。 可以通过设置 tool_choice 参数来指定要使用的工具。可以提供模型的两类工具包括: - 内置工具:OpenAI 提供的工具,用于扩展 模型的功能 |
否 | |
truncation | 枚举 | 要用于模型响应的截断策略。 - auto :如果此响应的上下文和以前的上下文超出模型的上下文窗口大小,则模型将通过删除会话中间的输入项来截断响应以适应上下文窗口。 - disabled (默认值):如果模型响应将超过模型的上下文窗口大小,则请求将失败并出现 400 错误。可能的值: auto disabled |
否 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | response | |
text/event-stream | 响应流事件 |
状态代码:默认值
说明:服务不可用
内容类型 | 类型 | 说明 |
---|---|---|
application/json | errorResponse |
响应 API - 输入项
GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
检索具有给定 ID 的模型响应。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
response_id (响应编号) | 路径 | 是的 | 字符串 | 要检索的响应的 ID。 |
include | 查询 | 否 | 数组 | 要包含在响应中的其他字段。 有关详细信息,请参阅用于上述响应创建的 include 参数。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | response |
状态代码:默认值
说明:服务不可用
内容类型 | 类型 | 说明 |
---|---|---|
application/json | errorResponse |
删除响应
DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
删除具有给定 ID 的模型响应。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
response_id (响应编号) | 路径 | 是的 | 字符串 | 要删除的响应的 ID。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
状态代码: 404
说明:找不到
内容类型 | 类型 | 说明 |
---|---|---|
application/json | 错误 |
状态代码:默认值
说明:服务不可用
内容类型 | 类型 | 说明 |
---|---|---|
application/json | errorResponse |
响应 API - 响应项列表
GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview
返回给定响应的输入项的列表。
URI 参数
名称 | In | 必选 | 类型 | DESCRIPTION |
---|---|---|---|---|
终结点 | 路径 | 是的 | 字符串 url | 支持的 Azure OpenAI 终结点(协议和主机名,例如:https://aoairesource.openai.azure.com 。将“aoairesource”替换为你的 Azure OpenAI 资源名称)。 https://{your-resource-name}.openai.azure.com |
response_id (响应编号) | 路径 | 是的 | 字符串 | 要检索其输入项的响应的 ID。 |
限制 | 查询 | 否 | 整数 | 要返回的对象数的限制。 限制可以介于 1 和 100 之间,默认值为 20。 |
顺序 | 查询 | 否 | 字符串 可能的值: asc desc |
要返回输入项的顺序。 默认值为 asc 。- asc :按升序返回输入项。- desc :按降序返回输入项。 |
after | 查询 | 否 | 字符串 | 要在其后列出项的项 ID,用于分页。 |
before | 查询 | 否 | 字符串 | 要在其之前列出项的项 ID,用于分页。 |
请求标头
使用基于令牌的身份验证或 API 密钥。 建议使用基于令牌的身份验证进行身份验证,更安全。
名称 | 必选 | 类型 | DESCRIPTION |
---|---|---|---|
授权 | True | 字符串 | 示例:Authorization: Bearer {Azure_OpenAI_Auth_Token} 使用 Azure CLI 生成身份验证令牌: az account get-access-token --resource https://cognitiveservices.azure.com 类型:oauth2 授权 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 范围: https://cognitiveservices.azure.com/.default |
API密钥 | True | 字符串 | 在此处提供 Azure OpenAI API 密钥 |
反应
状态代码:200
说明:请求成功
内容类型 | 类型 | 说明 |
---|---|---|
application/json | responseItemList |
组件
错误响应
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
错误 | 错误 | 否 |
errorBase
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | 字符串 | 否 | ||
消息 | 字符串 | 否 |
错误
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
inner_error | innerError | 包含其他详细信息的内部错误。 | 否 | |
param | 字符串 | 否 | ||
类型 | 字符串 | 否 |
innerError
包含其他详细信息的内部错误。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | innerErrorCode | 内部错误对象的错误代码。 | 否 | |
内容过滤结果 | contentFilterPromptResults | 有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关越狱内容和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。 | 否 |
innerErrorCode
内部错误对象的错误代码。
资产 | 价值 |
---|---|
说明 | 内部错误对象的错误代码。 |
类型 | 字符串 |
价值观 | ResponsibleAIPolicyViolation |
dalleErrorResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
错误 | dalleError | 否 |
dalleError
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
inner_error | dalleInnerError | 包含其他详细信息的内部错误。 | 否 | |
param | 字符串 | 否 | ||
类型 | 字符串 | 否 |
dalleInnerError
包含其他详细信息的内部错误。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | innerErrorCode | 内部错误对象的错误代码。 | 否 | |
内容过滤结果 | dalleFilterResults | 有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关越狱内容和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。 | 否 | |
修订后的提示 | 字符串 | 用于生成图像的提示(如果有对提示的任何修订)。 | 否 |
contentFilterCompletionTextSpan
描述生成的补全文本中的跨度。 偏移量 0 是补全文本的第一个 UTF32 码位元素。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
completion_end_offset | 整数 | 从跨度中排除的第一个 UTF32 码位元素的偏移量。 对于空跨度,此字段始终等于 completion_start_offset。 对于非空范围,此字段始终大于completion_start_offset。 | 是的 | |
completion_start_offset | 整数 | 开始跨度的 UTF32 码位元素的偏移量。 | 是的 |
内容过滤结果基础
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
filtered | 布尔 | 是的 |
contentFilterSeverityResult
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
filtered | 布尔 | 是的 | ||
严重性 | 字符串 | 否 |
内容过滤检测结果
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
检测到 | 布尔 | 否 | ||
filtered | 布尔 | 是的 |
contentFilterDetectedWithCitationResult
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
引文 | 对象 | 否 | ||
└─ 网址 | 字符串 | 否 | ||
~~ 许可证 | 字符串 | 否 |
contentFilterDetectedWithCompletionTextSpansResult
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
细节 | 数组 | 否 |
contentFilterIdResult
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
filtered | 布尔 | 是的 | ||
id | 字符串 | 否 |
contentFilterResultsBase
有关内容筛选结果的信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
自定义屏蔽列表 | 内容过滤详细结果 | 包含筛选段内容筛选器 ID 详细信息的内容筛选结果。 | 否 | |
错误 | errorBase | 否 | ||
hate | contentFilterSeverityResult | 否 | ||
亵渎 | 内容过滤检测结果 | 否 | ||
自残 | contentFilterSeverityResult | 否 | ||
sexual | contentFilterSeverityResult | 否 | ||
暴力 | contentFilterSeverityResult | 否 |
内容过滤提示结果
有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关越狱内容和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
自定义屏蔽列表 | 内容过滤详细结果 | 包含筛选段内容筛选器 ID 详细信息的内容筛选结果。 | 否 | |
错误 | errorBase | 否 | ||
hate | contentFilterSeverityResult | 否 | ||
间接攻击 | 内容过滤检测结果 | 否 | ||
越狱 | 内容过滤检测结果 | 否 | ||
亵渎 | 内容过滤检测结果 | 否 | ||
自残 | contentFilterSeverityResult | 否 | ||
sexual | contentFilterSeverityResult | 否 | ||
暴力 | contentFilterSeverityResult | 否 |
内容过滤选择结果
有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关第三方文本和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
自定义屏蔽列表 | 内容过滤详细结果 | 包含筛选段内容筛选器 ID 详细信息的内容筛选结果。 | 否 | |
错误 | errorBase | 否 | ||
hate | contentFilterSeverityResult | 否 | ||
亵渎 | 内容过滤检测结果 | 否 | ||
protected_material_code | 检测到包含引用结果的内容过滤器 | 否 | ||
protected_material_text | 内容过滤检测结果 | 否 | ||
自残 | contentFilterSeverityResult | 否 | ||
sexual | contentFilterSeverityResult | 否 | ||
ungrounded_material | contentFilterDetectedWithCompletionTextSpansResult | 否 | ||
暴力 | contentFilterSeverityResult | 否 |
内容过滤详细结果
包含筛选段内容筛选器 ID 详细信息的内容筛选结果。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
细节 | 数组 | 否 | ||
filtered | 布尔 | 是的 |
promptFilterResult
请求中单个提示的内容筛选结果。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容过滤结果 | contentFilterPromptResults | 有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关越狱内容和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。 | 否 | |
prompt_index | 整数 | 否 |
提示过滤结果
请求中零个或多个提示的内容筛选结果。 在流式处理请求中,不同提示的结果可能以不同的时间或不同的顺序到达。
未为此组件定义任何属性。
DALLE内容过滤结果
有关内容筛选结果的信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
hate | contentFilterSeverityResult | 否 | ||
自残 | contentFilterSeverityResult | 否 | ||
sexual | contentFilterSeverityResult | 否 | ||
暴力 | contentFilterSeverityResult | 否 |
dalleFilterResults
有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关越狱内容和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
自定义屏蔽列表 | 内容过滤详细结果 | 包含筛选段内容筛选器 ID 详细信息的内容筛选结果。 | 否 | |
hate | contentFilterSeverityResult | 否 | ||
越狱 | 内容过滤检测结果 | 否 | ||
亵渎 | 内容过滤检测结果 | 否 | ||
自残 | contentFilterSeverityResult | 否 | ||
sexual | contentFilterSeverityResult | 否 | ||
暴力 | contentFilterSeverityResult | 否 |
chatCompletionsRequestCommon
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
frequency_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 | 否 | 0 |
logit_bias | 对象 | 修改指定令牌在完成中出现的可能性。 接受 json 对象,该对象将标记(由 tokenizer 中的标记 ID 指定)映射到从 -100 到 100 的相关偏差值。 在数学上,采样之前会将偏差添加到由模型生成的 logit 中。 具体效果因模型而异,但 -1 和 1 之间的值会减少或增加选择的可能性;-100 或 100 等值会导致相关令牌的禁止或独占选择。 | 否 | |
max_completion_tokens | 整数 | 可为完成生成的令牌数的上限,包括可见的输出令牌和推理令牌。 这仅在 o1 系列模型中受支持。 在未来的 API 版本中,会将支持扩展到其他模型。 | 否 | |
max_tokens | 整数 | 生成的答案允许的最大令牌数。 默认情况下,模型可返回的标记数将为(4096 - 提示标记)。 这与 o1 系列模型不兼容。 | 否 | 4096 |
元数据 | 对象 | 开发人员定义的标记和值,用于在已存储的完成仪表板中筛选完成内容。 | 否 | |
presence_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否在文本中出现来惩罚新令牌,从而增加模型谈论新话题的可能性。 | 否 | 0 |
stop | 字符串或数组 | 最多四个序列,其中 API 将停止生成更多令牌。 | 否 | |
存储 | 布尔 | 是否存储此聊天完成请求的输出,以用于模型蒸馏或评估产品。 | 否 | |
数据流 | 布尔 | 如果设置此选项,将发送部分消息增量,如在 ChatGPT 中一样。 词元将在可用时作为服务器发送的事件发送(内容仅包括数据),并且流式传输将由 data: [DONE] 消息终止。 |
否 | 假 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助 Azure OpenAI 监视和检测滥用行为。 | 否 |
createCompletionRequest(创建完成请求)
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
精选 | 整数 | 在服务器端生成 best_of 补全并返回“最佳”项(每个标记的对数概率最高的项)。 无法流式传输结果。使用 n 时, best_of 控制候选完成次数,并 n 指定要返回的次数。 best_of 必须大于 n 。注意:由于此参数会生成许多补全,因此可能会快速消耗你的标记配额。 谨慎使用并确保对 max_tokens 和 stop 进行了合理的设置。 |
否 | 1 |
echo | 布尔 | 除了完成之外,还回显提示 |
否 | 假 |
frequency_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 |
否 | 0 |
logit_bias | 对象 | 修改指定令牌在完成中出现的可能性。 接受 JSON 对象,该对象将标记(由其在 GPT tokenizer 中的标记 ID 指定)映射到一个 -100 到 100 之间的关联偏差值。 在数学上,采样之前会将偏差添加到由模型生成的 logit 中。 具体效果因模型而异,但 -1 和 1 之间的值会减少或增加选择的可能性;-100 或 100 等值会导致相关令牌的禁止或独占选择。 例如,可以传递 {"50256": -100} 以防止生成 <|endoftext|> 标记。 |
否 | 没有 |
logprobs | 整数 | 包含有关 logprobs 最有可能的输出标记和已选择的标记的对数概率。 例如,如果 logprobs 为 5,则 API 将返回包含 5 个最有可能的标记的列表。 API 将始终返回采样令牌的 logprob ,因此响应中可能最多包含 logprobs+1 个元素。logprobs 的最大值是 5。 |
否 | 没有 |
max_tokens | 整数 | 可以在补全时生成的最大令牌数。 提示加上 max_tokens 的令牌计数不能超过模型的上下文长度。 |
否 | 16 |
n | 整数 | 要为每个提示生成的完成数。 注意:由于此参数会生成许多补全,因此可能会快速消耗你的标记配额。 谨慎使用并确保对 max_tokens 和 stop 进行了合理的设置。 |
否 | 1 |
presence_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否在文本中出现来惩罚新令牌,从而增加模型谈论新话题的可能性。 |
否 | 0 |
提示 | 字符串或数组 | 要生成补全的提示,以字符串、字符串数组、标记数组或标记数组的数组的形式编码。 请注意,<|endoftext|> 是模型在训练期间看到的文档分隔符,因此如果未指定提示,则模型将像从新文档的开头一样生成。 |
是的 | |
seed | 整数 | 指定后,我们的系统将尽最大努力进行确定性采样,以便具有相同 seed 和参数的重复请求应返回相同的结果。无法保证确定性,你应参考 system_fingerprint 响应参数来监视后端的更改。 |
否 | |
stop | 字符串或数组 | 最多四个序列,其中 API 将停止生成更多令牌。 返回的文本不包含停止序列。 |
否 | |
数据流 | 布尔 | 是否流式传输回部分进度。 如果已设置,令牌将在可用时作为仅限数据的服务器发送的事件发送,并且流式传输由 data: [DONE] 消息终止。 Python 代码示例。 |
否 | 假 |
suffix | 字符串 | 插入的文本完成后的后缀。 此参数仅支持 gpt-3.5-turbo-instruct 。 |
否 | 没有 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 |
否 |
创建完成响应
表示来自 API 的补全响应。 注意:流式处理和非流式处理的响应对象共享相同的形状(与聊天终结点不同)。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
选择 | 数组 | 为输入提示生成的模型完成选项的列表。 | 是的 | |
created | 整数 | 创建完成时间的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 完成的唯一标识符。 | 是的 | |
模型 | 字符串 | 用于补全的模型。 | 是的 | |
对象 | 枚举 | 对象类型,始终为“text_completion”。 可能的值: text_completion |
是的 | |
提示过滤结果 | promptFilterResults | 请求中零个或多个提示的内容筛选结果。 在流式处理请求中,不同提示的结果可能以不同的时间或不同的顺序到达。 | 否 | |
系统指纹 | 字符串 | 这个指纹表示模型运行的后端配置。 可以与 seed 请求参数一起使用,以了解何时进行了可能影响确定性的后端更改。 |
否 | |
使用情况 | completionUsage | 完成请求的使用情况统计信息。 | 否 |
创建聊天完成请求 (createChatCompletionRequest)
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
音频 | 对象 | 音频输出的参数。 当请求音频输出时,使用 modalities: ["audio"] 是必需的。 |
否 | |
└─ 格式 | 枚举 | 指定输出音频格式。 必须是 、wav mp3 、 flac opus 或pcm16 之一。 可能的值: wav 、、mp3 flac 、opus 、pcm16 |
否 | |
└─ voice | 枚举 | 指定语音类型。 支持的语音包括alloy 、echo 、fable 、onyx 和nova shimmer 。可能的值: alloy 、、echo 、fable onyx 、nova 、shimmer |
否 | |
数据来源 | 数组 | 使用它们的 Azure OpenAI 聊天扩展的配置条目。 此附加规范仅与 Azure OpenAI 兼容。 |
否 | |
frequency_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 |
否 | 0 |
function_call | 字符串或 chatCompletionFunctionCallOption | 弃用了,改用 tool_choice 。控制模型调用的函数(如有)。 none 表示模型不会调用函数,而是生成消息。auto 表示模型可以在生成消息和调用函数之间进行选择。通过 {"name": "my_function"} 指定特定函数会强制模型调用该函数。当不存在任何函数时,默认值为 none 。 如果存在函数,则 auto 是默认值。 |
否 | |
functions | 数组 | 弃用了,改用 tools 。模型可能为其生成 JSON 输入的函数的列表。 |
否 | |
logit_bias | 对象 | 修改指定令牌在完成中出现的可能性。 接受 JSON 对象,该对象将标记(由 tokenizer 中的标记 ID 指定)映射到一个介于 -100 到 100 之间的相关偏差值。 在数学上,采样之前会将偏差添加到由模型生成的 logit 中。 具体效果因模型而异,但 -1 和 1 之间的值会减少或增加选择的可能性;-100 或 100 等值会导致相关令牌的禁止或独占选择。 |
否 | 没有 |
logprobs | 布尔 | 是否返回输出标记的对数概率。 如果为 true,则返回在 message 的 content 中返回的每个输出标记的对数概率。 |
否 | 假 |
max_completion_tokens | 整数 | 可为完成生成的令牌数的上限,包括可见的输出令牌和推理令牌。 这仅在 o1 系列模型中受支持。 在未来的 API 版本中,会将支持扩展到其他模型。 | 否 | |
max_tokens | 整数 | 可以在聊天补全时生成的最大词元数。 输入词元和生成的词元的总长度受模型上下文长度的限制。 |
否 | |
消息 | 数组 | 包含到目前为止的对话的消息列表。 Python 代码示例。 | 是的 | |
元数据 | 对象 | 开发人员定义的标记和值,用于在已存储的完成仪表板中筛选完成内容。 | 否 | |
方式 | ChatCompletionModalities | 你希望模型为此请求生成的输出类型。 大多数模型都能够生成文本,这是默认设置: ["text"] gpt-4o-audio-preview 模型还可用于生成音频。 若要请求此模型生成文本和音频响应,你可以使用:["text", "audio"] |
否 | |
n | 整数 | 要为每个输入消息生成的聊天完成选项数。 请注意,将根据所有选项中生成的令牌数向你收费。 将 n 保留为 1 以尽量降低成本。 |
否 | 1 |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
预测 | PredictionContent | 预测输出的配置,当提前知道模型响应的大部分内容时,预测输出可以大大改善响应时间。 这在你重新生成文件且大部分内容仅做微小更改时最为常见。 | 否 | |
presence_penalty | 数字 | 介于 -2.0 到 2.0 之间的数字。 正值会根据它们到目前为止是否在文本中出现来惩罚新令牌,从而增加模型谈论新话题的可能性。 |
否 | 0 |
推理努力 | 枚举 | 仅限 o1 模型 限制推理模型的推理力度。 当前支持的值为 low 、medium 和 high 。 减少推理工作量可以加快回复速度,减少回复中用于推理的标记。可能的值: low 、、 medium high |
否 | |
响应格式 | ResponseFormatText 或 ResponseFormatJsonObject 或 ResponseFormatJsonSchema | 一个对象,指定模型必须输出的格式。 与 GPT-4o、GPT-4o mini、GPT-4 Turbo 和高于 gpt-3.5-turbo-1106 的所有 GPT-3.5 Turbo 模型兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,可保证模型与提供的 JSON 架构匹配。设置为 { "type": "json_object" } 可启用 JSON 模式,这可以保证模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
seed | 整数 | 此功能以 Beta 版本提供。 指定后,我们的系统将尽最大努力进行确定性采样,以便具有相同 seed 和参数的重复请求应返回相同的结果。无法保证确定性,你应参考 system_fingerprint 响应参数来监视后端的更改。 |
否 | |
stop | 字符串或数组 | 最多四个序列,其中 API 将停止生成更多令牌。 |
否 | |
存储 | 布尔 | 是否存储此聊天完成请求的输出,以用于模型蒸馏或评估产品。 | 否 | |
数据流 | 布尔 | 如果设置此选项,将发送部分消息增量,如在 ChatGPT 中一样。 词元将在可用时作为服务器发送的事件发送(内容仅包括数据),并且流式传输将由 data: [DONE] 消息终止。 Python 代码示例。 |
否 | 假 |
stream_options | chatCompletionStreamOptions | 用于流式处理响应的选项。 仅在设置 stream: true 时设置此项。 |
否 | 没有 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
工具选择 | chatCompletionToolChoiceOption | 控制模型调用哪些工具(如有)。 none 表示模型不会调用任何工具,而是生成消息。 auto 表示模型可以在生成消息和调用一个或多个工具之间进行选择。 required 表示模型必须调用一个或多个工具。 通过 {"type": "function", "function": {"name": "my_function"}} 指定特定工具将强制模型调用该工具。 如果没有工具,则 none 为默认值。 如果存在工具,则 auto 为默认值。 |
否 | |
工具 | 数组 | 模型可能调用的工具列表。 目前,仅支持函数作为工具。 使用它可以提供函数列表,模型可能为其生成 JSON 输入。 最多支持 128 个函数。 |
否 | |
top_logprobs | 整数 | 一个介于 0 和 20 之间的整数,指定在每个标记位置最有可能返回的的标记数,每个都有关联的对数概率。 如果使用此参数,则必须将 logprobs 设置为 true 。 |
否 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 |
否 | |
用户安全上下文 | userSecurityContext | 用户安全性上下文包含描述 AI 应用程序本身以及与 AI 应用程序交互的最终用户的多个参数。 这些字段通过提供全面的方法来保护 AI 应用程序,从而帮助安全运营团队调查和缓解安全事件。 详细了解如何使用 Microsoft Defender for Cloud 保护 AI 应用程序。 | 否 |
用户安全上下文 (userSecurityContext)
用户安全性上下文包含描述 AI 应用程序本身以及与 AI 应用程序交互的最终用户的多个参数。 这些字段通过提供全面的方法来保护 AI 应用程序,从而帮助安全运营团队调查和缓解安全事件。 详细了解如何使用 Microsoft Defender for Cloud 保护 AI 应用程序。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
应用程序名称 | 字符串 | 应用程序的名称。 不应在此字段中包含个人敏感信息。 | 否 | |
最终用户ID | 字符串 | 此标识符是用于在生成式 AI 应用程序中对最终用户进行身份验证的 Microsoft Entra ID(以前称为 Azure Active Directory)用户对象 ID。 不应在此字段中包含个人敏感信息。 | 否 | |
end_user_tenant_id | 字符串 | 最终用户所属的 Microsoft 365 租户 ID。 当生成式 AI 应用程序是多租户时,这是必需的。 | 否 | |
源IP地址 | 字符串 | 捕获原始客户端的 IP 地址,同时接受 IPv4 和 IPv6 格式。 | 否 |
chatCompletionFunctions
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 函数作用的描述,由模型用于选择何时以及如何调用函数。 | 否 | |
姓名 | 字符串 | 要调用的函数的名称。 必须是 a-z、A-z、0-9,或包含下划线和短划线,最大长度为 64。 | 是的 | |
参数 | FunctionParameters | 函数接受的参数,被描述为 JSON 架构对象。 请参阅指南查看示例,参阅 JSON 架构参考查看有关格式的文档。 省略 parameters 会定义具有空参数列表的函数。 |
否 |
chatCompletionFunctionCallOption
通过 {"name": "my_function"}
指定特定函数会强制模型调用该函数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
姓名 | 字符串 | 要调用的函数名称。 | 是的 |
聊天完成功能参数
函数接受的参数,被描述为 JSON 架构对象。 请参阅指南/查看示例,参阅 JSON 架构参考查看有关格式的文档。
未为此组件定义任何属性。
聊天完成请求消息
此组件可以是下列组件之一:
- ChatCompletionRequestDeveloperMessage
- chatCompletionRequestSystemMessage
- chatCompletionRequestUserMessage
- chatCompletionRequestAssistantMessage
- chatCompletionRequestToolMessage
- chatCompletionRequestFunctionMessage
聊天完成请求开发者信息
开发人员提供的指令,无论用户发送什么消息,模型都应遵循。
使用 o1 模型和更新版本后,developer
消息替换以前的 system
消息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串或数组 | 开发人员消息的内容。 | 是的 | |
姓名 | 字符串 | 参与者的可选名称。 提供模型信息,以区分同一角色的参与者。 | 否 | |
角色 | 枚举 | 消息作者的角色,在本例中为 developer 。可能的值: developer |
是的 |
chatCompletionRequestSystemMessage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串或数组 | 系统消息的内容。 | 是的 | |
姓名 | 字符串 | 参与者的可选名称。 提供模型信息,以区分同一角色的参与者。 | 否 | |
角色 | 枚举 | 消息作者的角色,在本例中为 system 。可能的值: system |
是的 |
chatCompletionRequestUserMessage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串或数组 | 用户消息的内容。 |
是的 | |
姓名 | 字符串 | 参与者的可选名称。 提供模型信息,以区分同一角色的参与者。 | 否 | |
角色 | 枚举 | 消息作者的角色,在本例中为 user 。可能的值: user |
是的 |
chatCompletionRequestAssistantMessage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串或数组 | 助手消息的内容。 除非指定了 tool_calls 或 function_call ,否则是必需的。 |
否 | |
function_call | 对象 | 已弃用并替换为 tool_calls 。 应调用的函数的名称和参数,由模型生成。 |
否 | |
└─ arguments | 字符串 | 用于调用函数的参数,由模型以 JSON 格式生成。 请注意,该模型并非始终生成有效的 JSON,并且可能会幻化出未由函数架构定义的参数。 在调用函数之前验证代码中的参数。 | 否 | |
└─ 名称 | 字符串 | 要调用的函数名称。 | 否 | |
姓名 | 字符串 | 参与者的可选名称。 提供模型信息,以区分同一角色的参与者。 | 否 | |
拒绝 | 字符串 | 助手发出的拒绝消息。 | 否 | |
角色 | 枚举 | 消息作者的角色,在本例中为 assistant 。可能的值: assistant |
是的 | |
工具调用 | chatCompletionMessageToolCalls | 模型生成的工具调用,例如函数调用。 | 否 |
chatCompletionRequestToolMessage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串或数组 | 工具消息的内容。 | 是的 | |
角色 | 枚举 | 消息作者的角色,在本例中为 tool 。可能的值: tool |
是的 | |
tool_call_id | 字符串 | 此消息正在响应的工具调用。 | 是的 |
chatCompletionRequestFunctionMessage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串 | 函数消息的内容。 | 是的 | |
姓名 | 字符串 | 要调用的函数名称。 | 是的 | |
角色 | 枚举 | 消息作者的角色,在本例中为 function 。可能的值: function |
是的 |
chatCompletionRequestDeveloperMessageContentPart
此组件可以是下列组件之一:
聊天完成请求系统消息内容部分
此组件可以是下列组件之一:
chatCompletionRequestUserMessageContentPart
此组件可以是下列组件之一:
- 聊天完成请求消息内容部分文本
- chatCompletionRequestMessageContentPartImage
- chatCompletionRequestMessageContentPartAudio
chatCompletionRequestAssistantMessageContentPart
此组件可以是下列组件之一:
chatCompletionRequestToolMessageContentPart
此组件可以是下列组件之一:
chatCompletionRequestMessageContentPartText
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文本消息 | 字符串 | 文本内容。 | 是的 | |
类型 | 枚举 | 内容部件的类型。 可能的值: text |
是的 |
聊天完成请求消息内容部分音频
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
输入音频 | 对象 | 是的 | ||
└─ 数据 | 字符串 | Base64 编码的音频数据。 | 否 | |
└─ 格式 | 枚举 | 编码的音频数据的格式。 目前支持“wav”和“mp3”。 可能的值: wav mp3 |
否 | |
类型 | 枚举 | 内容部件的类型。 始终为 input_audio 。可能的值: input_audio |
是的 |
chatCompletionRequestMessageContentPartImage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
image_url | 对象 | 是的 | ||
└─ 详细信息 | 枚举 | 指定图像的详细信息级别。 在视觉指南中了解详细信息。 可能的值: auto 、、 low high |
否 | |
└─ 网址 | 字符串 | 图像的 URL 或 base64 编码的图像数据。 | 否 | |
类型 | 枚举 | 内容部件的类型。 可能的值: image_url |
是的 |
chatCompletionRequestMessageContentPartRefusal
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
拒绝 | 字符串 | 模型生成的拒绝消息。 | 是的 | |
类型 | 枚举 | 内容部件的类型。 可能的值: refusal |
是的 |
azureChat扩展配置 (azureChatExtensionConfiguration)
单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。
###azureChatExtensionConfiguration的判别器
此组件使用属性 type
区分不同类型的:
类型值 | 图式 |
---|---|
azure_search |
azureSearchChatExtensionConfiguration |
azure_cosmos_db |
azureCosmosDBChatExtensionConfiguration |
elasticsearch |
elasticsearchChatExtensionConfiguration |
mongo_db |
mongoDBChatExtensionConfiguration |
pinecone |
pineconeChatExtensionConfiguration |
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | azureChatExtensionType | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
是的 |
azureChatExtensionType
单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。
资产 | 价值 |
---|---|
说明 | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
类型 | 字符串 |
价值观 | azure_search azure_cosmos_db elasticsearch mongo_db pinecone |
Azure搜索聊天扩展配置(azureSearchChatExtensionConfiguration)
将 Azure 认知搜索用作 Azure OpenAI 聊天扩展时可配置选项的特定表示形式。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
参数 | azureSearchChatExtensionParameters(Azure搜索聊天扩展参数) | 用作 Azure OpenAI 聊天扩展时 Azure 认知搜索的参数。 | 否 | |
类型 | azureChatExtensionType | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
是的 |
Azure搜索聊天扩展参数
用作 Azure OpenAI 聊天扩展时 Azure 认知搜索的参数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
allow_partial_result | 布尔 | 如果指定为 true,系统将允许使用部分搜索结果,如果所有查询都失败,请求将失败。 如果未指定或指定为 false,若任何搜索查询失败,则请求将失败。 | 否 | 假 |
身份验证 | onYourDataApiKeyAuthenticationOptions 或 onYourDataSystemAssignedManagedIdentityAuthenticationOptions 或 onYourDataUserAssignedManagedIdentityAuthenticationOptions 或 onYourDataAccessTokenAuthenticationOptions | 是的 | ||
嵌入依赖 | onYourDataEndpointVectorizationSource 或 onYourDataDeploymentNameVectorizationSource 或 onYourDataIntegratedVectorizationSource | 否 | ||
终结点 | 字符串 | 要使用的 Azure 认知搜索资源的绝对终结点路径。 | 是的 | |
字段映射 | Azure搜索索引字段映射选项 | 用于控制使用配置的 Azure 认知搜索资源时如何处理字段的可选设置。 | 否 | |
筛选器 | 字符串 | 搜索筛选器。 | 否 | |
in_scope | 布尔 | 是否应将查询限制为使用索引数据。 | 否 | |
include_contexts | 数组 | 输出上下文所包含的属性。 如果未指定,默认值为 citations 和 intent 。 |
否 | |
索引名称 | 字符串 | 在引用的 Azure 认知搜索资源中可供使用的索引的名称。 | 是的 | |
max_search_queries (最大搜索查询次数) | 整数 | 对于一条用户消息,应将最大数量的重写查询发送到搜索提供程序。 如果未指定,系统将决定要发送的查询数。 | 否 | |
查询类型 | azureSearchQueryType | 在将其用作 Azure OpenAI 聊天扩展时应执行的 Azure 认知搜索检索查询的类型。 | 否 | |
语义配置 | 字符串 | 查询的附加语义配置。 | 否 | |
严谨性 | 整数 | 搜索相关性筛选的已配置严格性。 严格度越高,精准率越高,但回复的召回率越低。 | 否 | |
top_n_documents | 整数 | 为配置的查询提供的已配置最多文档数。 | 否 |
Azure 搜索索引字段映射选项
用于控制使用配置的 Azure 认知搜索资源时如何处理字段的可选设置。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容字段 | 数组 | 应被视为内容的索引字段的名称。 | 否 | |
content_fields_separator | 字符串 | 内容字段应使用的分隔符模式。 | 否 | |
文件路径字段 (filepath_field) | 字符串 | 要用作文件路径的索引字段的名称。 | 否 | |
图像矢量场 | 数组 | 表示图像矢量数据的字段的名称。 | 否 | |
标题字段 | 字符串 | 要用作标题的索引字段的名称。 | 否 | |
URL字段 | 字符串 | 要用作 URL 的索引字段的名称。 | 否 | |
向量场 | 数组 | 表示矢量数据的字段的名称。 | 否 |
Azure搜索查询类型
在将其用作 Azure OpenAI 聊天扩展时应执行的 Azure 认知搜索检索查询的类型。
资产 | 价值 |
---|---|
说明 | 在将其用作 Azure OpenAI 聊天扩展时应执行的 Azure 认知搜索检索查询的类型。 |
类型 | 字符串 |
价值观 | simple semantic vector vector_simple_hybrid vector_semantic_hybrid |
Azure CosmosDB 聊天扩展配置
将 Azure Cosmos DB 用作 Azure OpenAI 聊天扩展时可配置选项的特定表示形式。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
参数 | azureCosmosDBChatExtensionParameters | 使用 Azure Cosmos DB for MongoDB 配置 Azure OpenAI On Your Data 聊天扩展时要使用的参数。 | 否 | |
类型 | azureChatExtensionType | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
是的 |
Azure Cosmos DB 聊天扩展参数 (azureCosmosDBChatExtensionParameters)
使用 Azure Cosmos DB for MongoDB 配置 Azure OpenAI On Your Data 聊天扩展时要使用的参数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
allow_partial_result | 布尔 | 如果指定为 true,系统将允许使用部分搜索结果,如果所有查询都失败,请求将失败。 如果未指定或指定为 false,若任何搜索查询失败,则请求将失败。 | 否 | 假 |
身份验证 | 在您的数据连接字符串认证选项上 | 使用连接字符串时,基于自有数据的 Azure OpenAI 的验证选项。 | 是的 | |
容器名称(container_name) | 字符串 | Azure Cosmos DB 资源容器的名称。 | 是的 | |
数据库名称 | 字符串 | 用于 Azure Cosmos DB 的 MongoDB vCore 数据库名称。 | 是的 | |
嵌入依赖 | onYourDataEndpointVectorizationSource 或 onYourDataDeploymentNameVectorizationSource | 是的 | ||
字段映射 | azureCosmosDBFieldMappingOptions | 用于控制使用配置的 Azure Cosmos DB 资源时如何处理字段的可选设置。 | 是的 | |
in_scope | 布尔 | 是否应将查询限制为使用索引数据。 | 否 | |
include_contexts(包括上下文) | 数组 | 输出上下文所包含的属性。 如果未指定,默认值为 citations 和 intent 。 |
否 | |
索引名称 | 字符串 | 用于 Azure Cosmos DB 的 MongoDB vCore 索引名称。 | 是的 | |
最大搜索查询 | 整数 | 对于一条用户消息,应将最大数量的重写查询发送到搜索提供程序。 如果未指定,系统将决定要发送的查询数。 | 否 | |
严谨性 | 整数 | 搜索相关性筛选的已配置严格性。 严格度越高,精准率越高,但回复的召回率越低。 | 否 | |
top_n_documents | 整数 | 为配置的查询提供的已配置最多文档数。 | 否 |
azureCosmosDBFieldMappingOptions
用于控制使用配置的 Azure Cosmos DB 资源时如何处理字段的可选设置。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容字段 | 数组 | 应被视为内容的索引字段的名称。 | 是的 | |
content_fields_separator | 字符串 | 内容字段应使用的分隔符模式。 | 否 | |
文件路径字段 (filepath_field) | 字符串 | 要用作文件路径的索引字段的名称。 | 否 | |
标题字段 | 字符串 | 要用作标题的索引字段的名称。 | 否 | |
URL字段 | 字符串 | 要用作 URL 的索引字段的名称。 | 否 | |
向量场 | 数组 | 表示矢量数据的字段的名称。 | 是的 |
Elasticsearch聊天扩展配置
将 Elasticsearch 用作 Azure OpenAI 聊天扩展时可配置选项的特定表示形式。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
参数 | elasticsearchChatExtensionParameters | 将 Elasticsearch® 配置为 Azure OpenAI 聊天扩展时要使用的参数。 | 否 | |
类型 | azureChatExtensionType | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
是的 |
弹性搜索聊天扩展参数 (elasticsearchChatExtensionParameters)
将 Elasticsearch® 配置为 Azure OpenAI 聊天扩展时要使用的参数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
allow_partial_result | 布尔 | 如果指定为 true,系统将允许使用部分搜索结果,如果所有查询都失败,请求将失败。 如果未指定或指定为 false,若任何搜索查询失败,则请求将失败。 | 否 | 假 |
身份验证 | onYourDataKeyAndKeyIdAuthenticationOptions 或 onYourDataEncodedApiKeyAuthenticationOptions | 是的 | ||
嵌入依赖 | onYourDataEndpointVectorizationSource 或 onYourDataDeploymentNameVectorizationSource 或 onYourDataModelIdVectorizationSource | 否 | ||
终结点 | 字符串 | Elasticsearch® 的终结点。 | 是的 | |
字段映射 | elasticsearchIndexFieldMappingOptions | 可选设置,用于控制使用配置的 Elasticsearch 资源®时如何处理字段。 | 否 | |
in_scope | 布尔 | 是否应将查询限制为使用索引数据。 | 否 | |
include_contexts | 数组 | 输出上下文所包含的属性。 如果未指定,默认值为 citations 和 intent 。 |
否 | |
索引名称 | 字符串 | Elasticsearch® 的索引名称。 | 是的 | |
最大搜索查询数量 | 整数 | 对于一条用户消息,应将最大数量的重写查询发送到搜索提供程序。 如果未指定,系统将决定要发送的查询数。 | 否 | |
查询类型 | elasticsearchQueryType | 在将其用作 Azure OpenAI 聊天扩展时应执行的 Elasticsearch® 检索查询的类型。 | 否 | |
严谨性 | 整数 | 搜索相关性筛选的已配置严格性。 严格度越高,精准率越高,但回复的召回率越低。 | 否 | |
top_n_documents | 整数 | 为配置的查询提供的已配置最多文档数。 | 否 |
弹性搜索索引字段映射选项
可选设置,用于控制使用配置的 Elasticsearch 资源®时如何处理字段。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容字段 | 数组 | 应被视为内容的索引字段的名称。 | 否 | |
content_fields_separator | 字符串 | 内容字段应使用的分隔符模式。 | 否 | |
文件路径字段 (filepath_field) | 字符串 | 要用作文件路径的索引字段的名称。 | 否 | |
标题字段 | 字符串 | 要用作标题的索引字段的名称。 | 否 | |
URL字段 | 字符串 | 要用作 URL 的索引字段的名称。 | 否 | |
向量场 | 数组 | 表示矢量数据的字段的名称。 | 否 |
Elasticsearch查询类型
在将其用作 Azure OpenAI 聊天扩展时应执行的 Elasticsearch® 检索查询的类型。
资产 | 价值 |
---|---|
说明 | 在将其用作 Azure OpenAI 聊天扩展时应执行的 Elasticsearch® 检索查询的类型。 |
类型 | 字符串 |
价值观 | simple vector |
mongoDB聊天扩展配置
将 Mongo DB 用作 Azure OpenAI 聊天扩展时可配置选项的特定表示形式。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
参数 | mongoDBChatExtensionParameters | 使用 Mongo DB 配置 Azure OpenAI On Your Data 聊天扩展时使用的参数。 | 否 | |
类型 | azureChatExtensionType | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
是的 |
MongoDB聊天扩展参数
使用 Mongo DB 配置 Azure OpenAI On Your Data 聊天扩展时使用的参数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
allow_partial_result | 布尔 | 如果指定为 true,系统将允许使用部分搜索结果,如果所有查询都失败,请求将失败。 如果未指定或指定为 false,若任何搜索查询失败,则请求将失败。 | 否 | 假 |
应用名称 | 字符串 | Mongo DB 应用程序的名称。 | 是的 | |
身份验证 | 您的数据用户名和密码认证选项 | 使用用户名和密码时,Azure OpenAI On Your Data 的身份验证选项。 | 是的 | |
collection_name | 字符串 | Mongo DB 集合的名称。 | 是的 | |
数据库名称 | 字符串 | Mongo DB 数据库的名称。 | 是的 | |
嵌入依赖 | onYourDataEndpointVectorizationSource 或 onYourDataDeploymentNameVectorizationSource | 是的 | ||
终结点 | 字符串 | Mongo DB 群集终结点的名称。 | 是的 | |
字段映射 | mongoDBFieldMappingOptions | 用于控制使用配置的 Mongo DB 资源时如何处理字段的可选设置。 | 是的 | |
in_scope | 布尔 | 是否应将查询限制为使用索引数据。 | 否 | |
include_contexts | 数组 | 输出上下文所包含的属性。 如果未指定,默认值为 citations 和 intent 。 |
否 | |
索引名称 | 字符串 | Mongo DB 索引的名称。 | 是的 | |
最大搜索查询次数 | 整数 | 对于一条用户消息,应将最大数量的重写查询发送到搜索提供程序。 如果未指定,系统将决定要发送的查询数。 | 否 | |
严谨性 | 整数 | 搜索相关性筛选的已配置严格性。 严格度越高,精准率越高,但回复的召回率越低。 | 否 | |
top_n_documents | 整数 | 为配置的查询提供的已配置最多文档数。 | 否 |
mongoDBFieldMappingOptions
用于控制使用配置的 Mongo DB 资源时如何处理字段的可选设置。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容字段 | 数组 | 应被视为内容的索引字段的名称。 | 是的 | |
content_fields_separator | 字符串 | 内容字段应使用的分隔符模式。 | 否 | |
文件路径字段 (filepath_field) | 字符串 | 要用作文件路径的索引字段的名称。 | 否 | |
标题字段 | 字符串 | 要用作标题的索引字段的名称。 | 否 | |
URL字段 | 字符串 | 要用作 URL 的索引字段的名称。 | 否 | |
向量场 | 数组 | 表示矢量数据的字段的名称。 | 是的 |
pineconeChatExtensionConfiguration
将 Pinecone 用作 Azure OpenAI 聊天扩展时可配置选项的特定表示形式。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
参数 | pineconeChatExtensionParameters | 用于配置 Azure OpenAI Pinecone 聊天扩展的参数。 | 否 | |
类型 | azureChatExtensionType | 单个 Azure OpenAI 聊天扩展的配置数据的表示形式。 这将由聊天补全请求使用,该请求应使用 Azure OpenAI 聊天扩展来增强响应行为。 此配置的使用仅与 Azure OpenAI 兼容。 |
是的 |
pineconeChatExtensionParameters
用于配置 Azure OpenAI Pinecone 聊天扩展的参数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
允许部分结果 (allow_partial_result) | 布尔 | 如果指定为 true,系统将允许使用部分搜索结果,如果所有查询都失败,请求将失败。 如果未指定或指定为 false,若任何搜索查询失败,则请求将失败。 | 否 | 假 |
身份验证 | 有关您数据的Api密钥认证选项 | 使用 API 密钥时,基于自有数据的 Azure OpenAI 的验证选项。 | 是的 | |
嵌入依赖 | onYourDataDeploymentNameVectorizationSource | 应用矢量搜索时 Azure OpenAI On Your Data 使用的矢量化源的详细信息,此矢量化源基于同一 Azure OpenAI 资源中的内部嵌入模型部署名称。 | 是的 | |
环境 | 字符串 | Pinecone 的环境名称。 | 是的 | |
字段映射 | pineconeFieldMappingOptions | 用于控制使用配置的 Pinecone 资源时如何处理字段的可选设置。 | 是的 | |
in_scope | 布尔 | 是否应将查询限制为使用索引数据。 | 否 | |
include_contexts | 数组 | 输出上下文所包含的属性。 如果未指定,默认值为 citations 和 intent 。 |
否 | |
索引名称 | 字符串 | Pinecone 数据库索引的名称。 | 是的 | |
最大搜索查询数(max_search_queries) | 整数 | 对于一条用户消息,应将最大数量的重写查询发送到搜索提供程序。 如果未指定,系统将决定要发送的查询数。 | 否 | |
严谨性 | 整数 | 搜索相关性筛选的已配置严格性。 严格度越高,精准率越高,但回复的召回率越低。 | 否 | |
top_n_documents | 整数 | 为配置的查询提供的已配置最多文档数。 | 否 |
pineconeFieldMappingOptions
用于控制使用配置的 Pinecone 资源时如何处理字段的可选设置。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容字段 | 数组 | 应被视为内容的索引字段的名称。 | 是的 | |
content_fields_separator | 字符串 | 内容字段应使用的分隔符模式。 | 否 | |
文件路径字段 (filepath_field) | 字符串 | 要用作文件路径的索引字段的名称。 | 否 | |
标题字段 | 字符串 | 要用作标题的索引字段的名称。 | 否 | |
URL字段 | 字符串 | 要用作 URL 的索引字段的名称。 | 否 |
关于您的数据认证选项
Azure OpenAI On Your Data 的身份验证选项。
onYourDataAuthenticationOptions 的鉴别器
此组件使用属性 type
区分不同类型的:
类型值 | 图式 |
---|---|
api_key |
有关您数据的Api密钥认证选项 |
connection_string |
在您的数据连接字符串认证选项上 |
key_and_key_id |
onYourDataKeyAndKeyIdAuthenticationOptions |
encoded_api_key |
onYourDataEncodedApiKeyAuthenticationOptions |
access_token |
onYourDataAccessTokenAuthenticationOptions |
system_assigned_managed_identity |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions |
user_assigned_managed_identity |
onYourDataUserAssignedManagedIdentityAuthenticationOptions |
username_and_password |
您的数据用户名和密码认证选项 |
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | onYourDataAuthenticationType | 基于自有数据的 Azure OpenAI 支持的身份验证类型。 | 是的 |
onYourDataContextProperty
上下文属性。
资产 | 价值 |
---|---|
说明 | 上下文属性。 |
类型 | 字符串 |
价值观 | citations intent all_retrieved_documents |
onYourDataAuthenticationType
Azure OpenAI On Your Data 支持的身份验证类型。
资产 | 价值 |
---|---|
说明 | Azure OpenAI On Your Data 支持的身份验证类型。 |
类型 | 字符串 |
价值观 | api_key connection_string key_and_key_id encoded_api_key access_token system_assigned_managed_identity user_assigned_managed_identity username_and_password |
onYourDataApiKeyAuthenticationOptions
使用 API 密钥时,基于自有数据的 Azure OpenAI 的验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
关键值 | 字符串 | 用于身份验证的 API 密钥。 | 否 | |
类型 | onYourDataAuthenticationType | Azure OpenAI On Your Data 支持的身份验证类型。 | 是的 |
onYourDataConnectionStringAuthenticationOptions
使用连接字符串时,基于自有数据的 Azure OpenAI 的验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
connection_string | 字符串 | 用于身份验证的连接字符串。 | 否 | |
类型 | onYourDataAuthenticationType | 基于自有数据的 Azure OpenAI 支持的身份验证类型。 | 是的 |
onYourDataKeyAndKeyIdAuthenticationOptions
使用 Elasticsearch 密钥和密钥 ID 对时,基于自有数据的 Azure OpenAI 的身份验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
关键值 | 字符串 | 用于身份验证的 Elasticsearch 密钥。 | 否 | |
密钥ID | 字符串 | 用于身份验证的 Elasticsearch 密钥 ID。 | 否 | |
类型 | onYourDataAuthenticationType | 基于自有数据的 Azure OpenAI 支持的身份验证类型。 | 是的 |
onYourDataEncodedApiKeyAuthenticationOptions
使用 Elasticsearch 编码 API 密钥时,基于自有数据的 Azure OpenAI 的验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
编码的API密钥 | 字符串 | 用于身份验证的 Elasticsearch 编码 API 密钥。 | 否 | |
类型 | onYourDataAuthenticationType | Azure OpenAI On Your Data 支持的身份验证类型。 | 是的 |
onYourDataAccessTokenAuthenticationOptions
使用访问令牌时,基于自有数据的 Azure OpenAI 的验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
access_token | 字符串 | 要用于身份验证的访问令牌。 | 否 | |
类型 | onYourDataAuthenticationType | Azure OpenAI On Your Data 支持的身份验证类型。 | 是的 |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions
使用系统分配的托管标识时,基于自有数据的 Azure OpenAI 的验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | onYourDataAuthenticationType | Azure OpenAI On Your Data 支持的身份验证类型。 | 是的 |
onYourDataUserAssignedManagedIdentityAuthenticationOptions
使用用户分配的托管标识时,基于自有数据的 Azure OpenAI 的验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
managed_identity_resource_id | 字符串 | 用于进行身份验证的用户分配托管标识的资源 ID。 | 否 | |
类型 | onYourDataAuthenticationType | Azure OpenAI On Your Data 支持的身份验证类型。 | 是的 |
onYourDataUsernameAndPasswordAuthenticationOptions
使用用户名和密码时,Azure OpenAI On Your Data 的身份验证选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
密码 | 字符串 | 密码。 用于身份验证。 | 否 | |
类型 | onYourDataAuthenticationType | Azure OpenAI On Your Data 支持的身份验证类型。 | 是的 | |
用户名 | 字符串 | 用于身份验证的用户名。 | 否 |
onYourDataVectorizationSource
使用矢量搜索的 Azure OpenAI On Your Data 的矢量化源的抽象表示形式。
此组件使用属性 type
区分不同类型的:
类型值 | 图式 |
---|---|
endpoint |
在您的数据端点矢量化源上 |
deployment_name |
onYourDataDeploymentNameVectorizationSource |
integrated |
onYourDataIntegratedVectorizationSource |
model_id |
onYourDataModelIdVectorizationSource |
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | onYourDataVectorizationSourceType | 表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。 | 是的 |
onYourDataVectorizationSourceType
表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。
资产 | 价值 |
---|---|
说明 | 表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。 |
类型 | 字符串 |
价值观 | endpoint deployment_name integrated model_id |
onYourDataEndpointVectorizationSource
应用矢量搜索时 Azure OpenAI On Your Data 使用的矢量化源的详细信息,此矢量化源基于用于嵌入的公共 Azure OpenAI 终结点调用。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
身份验证 | onYourDataApiKeyAuthenticationOptions 或 onYourDataAccessTokenAuthenticationOptions | 否 | ||
尺寸 | 整数 | 嵌入应有的维度数。 仅在 text-embedding-3 及更高版本中受支持。 |
否 | |
终结点 | 字符串 | 指定应从中检索嵌入的资源终结点 URL。 其格式应为:https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings 。 不允许 api-version 查询参数。 |
否 | |
类型 | onYourDataVectorizationSourceType | 表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。 | 是的 |
onYourData部署名称向量化来源
应用矢量搜索时 Azure OpenAI On Your Data 使用的矢量化源的详细信息,此矢量化源基于同一 Azure OpenAI 资源中的内部嵌入模型部署名称。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
部署名称 | 字符串 | 指定要用于矢量化的模型部署的名称。 此模型部署必须位于同一 Azure OpenAI 资源中,但基于自有数据将通过内部调用(而不是公共调用)使用此模型部署,从而即使在专用网络中也能实现矢量搜索。 | 否 | |
尺寸 | 整数 | 嵌入应有的维度数。 仅在 text-embedding-3 及更高版本中受支持。 |
否 | |
类型 | onYourDataVectorizationSourceType | 表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。 | 是的 |
onYourDataIntegratedVectorizationSource
表示搜索资源中定义的集成矢量器。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | onYourDataVectorizationSourceType | 表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。 | 是的 |
onYourDataModelIdVectorizationSource
应用矢量搜索时基于自有数据的 Azure OpenAI 使用的矢量化源的详细信息,此矢量化源基于搜索服务模型 ID。 目前仅 Elasticsearch® 支持。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
模型编号 | 字符串 | 指定要用于矢量化的模型 ID。 必须在搜索服务中定义此模型 ID。 | 否 | |
类型 | onYourDataVectorizationSourceType | 表示 Azure OpenAI On Your Data 可用于配置用于矢量搜索的矢量化数据的可用源。 | 是的 |
azureChatExtensionsMessageContext
当 Azure OpenAI 聊天扩展涉及到生成相应的聊天补全响应时可用的其他上下文信息的表示形式。 仅当使用配置为使用匹配扩展的 Azure OpenAI 请求时,才会填充此上下文信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
获取的所有文档 | 数组 | 所有检索到的文档。 | 否 | |
引文 | 数组 | 数据源检索结果,用于在响应中生成助手消息。 | 否 | |
意向 | 字符串 | 聊天历史记录中检测到的意向,用于传递到下一轮,以传递上下文。 | 否 |
引文
聊天补全响应消息的引文信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
chunk_id | 字符串 | 引文的区块 ID。 | 否 | |
内容 | 字符串 | 引文的内容。 | 是的 | |
文件路径 | 字符串 | 引文的文件路径。 | 否 | |
重新排序分数 | 数字 | 检索到的文档的重新排名分数。 | 否 | |
title | 字符串 | 引文的标题。 | 否 | |
url | 字符串 | 引文的 URL。 | 否 |
已检索的文档
检索到的文档。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
chunk_id | 字符串 | 引文的区块 ID。 | 否 | |
内容 | 字符串 | 引文的内容。 | 是的 | |
数据源索引 | 整数 | 数据源的索引。 | 否 | |
文件路径 | 字符串 | 引文的文件路径。 | 否 | |
过滤原因 | filterReason | 检索的文档的筛选原因。 | 否 | |
原始搜索评分 | 数字 | 检索到的文档的原始搜索分数。 | 否 | |
重排评分 | 数字 | 检索到的文档的重新排名分数。 | 否 | |
search_queries | 数组 | 用于检索文档的搜索查询。 | 否 | |
title | 字符串 | 引文的标题。 | 否 | |
url | 字符串 | 引文的 URL。 | 否 |
过滤原因
检索的文档的筛选原因。
资产 | 价值 |
---|---|
说明 | 检索的文档的筛选原因。 |
类型 | 字符串 |
价值观 | score rerank |
chatCompletionMessageToolCall
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 模型调用的函数。 | 是的 | |
└─ arguments | 字符串 | 用于调用函数的参数,由模型以 JSON 格式生成。 请注意,该模型并非始终生成有效的 JSON,并且可能会幻化出未由函数架构定义的参数。 在调用函数之前验证代码中的参数。 | 否 | |
└─ 名称 | 字符串 | 要调用的函数名称。 | 否 | |
id | 字符串 | 工具调用的 ID。 | 是的 | |
类型 | 工具调用类型 | 工具调用的类型,在本例中为 function 。 |
是的 |
toolCallType
工具调用的类型,在本例中为 function
。
资产 | 价值 |
---|---|
说明 | 工具调用的类型,在本例中为 function 。 |
类型 | 字符串 |
价值观 | function |
chatCompletionRequestMessageTool
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串 | 消息的内容。 | 否 | |
tool_call_id | 字符串 | 此消息正在响应的工具调用。 | 否 |
聊天完成请求消息功能
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串 | 消息的内容。 | 否 | |
姓名 | 字符串 | 消息的内容。 | 否 | |
角色 | 枚举 | 消息作者的角色,在本例中为 function 。可能的值: function |
否 |
createChatCompletionResponse
表示模型根据提供的输入返回的聊天补全响应。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
选择 | 数组 | 聊天完成选项的列表。 如果 n 大于 1,则可以具备多个角色。 |
是的 | |
created | 整数 | 聊天补全创建时间的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 聊天补全的唯一标识符。 | 是的 | |
模型 | 字符串 | 用于聊天补全的模型。 | 是的 | |
对象 | 枚举 | 始终为 chat.completion 的对象类型。可能的值: chat.completion |
是的 | |
提示过滤结果 | promptFilterResults | 请求中零个或多个提示的内容筛选结果。 在流式处理请求中,不同提示的结果可能以不同的时间或不同的顺序到达。 | 否 | |
系统指纹 | 字符串 | 这个指纹表示模型运行的后端配置。 可以与 seed 请求参数一起使用,以了解何时进行了可能影响确定性的后端更改。 |
否 | |
使用情况 | completionUsage | 完成请求的使用情况统计信息。 | 否 |
createChatCompletionStreamResponse
表示模型根据提供的输入返回的聊天补全响应的流式区块。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
选择 | 数组 | 聊天完成选项的列表。 如果 n 大于 1,则可以包含多个元素。 |
是的 | |
created | 整数 | 聊天补全创建时间的 Unix 时间戳(以秒为单位)。 每个区块具有相同的时间戳。 | 是的 | |
id | 字符串 | 聊天补全的唯一标识符。 每个区块具有相同的 ID。 | 是的 | |
模型 | 字符串 | 要生成补全的模型。 | 是的 | |
对象 | 枚举 | 始终为 chat.completion.chunk 的对象类型。可能的值: chat.completion.chunk |
是的 | |
系统指纹 | 字符串 | 这个指纹表示模型运行的后端配置。 可以与 seed 请求参数一起使用,以了解何时进行了可能影响确定性的后端更改。 |
否 |
chatCompletionStreamResponseDelta
流式处理的模型响应生成的聊天补全增量。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串 | 区块消息的内容。 | 否 | |
function_call | 对象 | 已弃用并替换为 tool_calls 。 应调用的函数的名称和参数,由模型生成。 |
否 | |
└─ arguments | 字符串 | 用于调用函数的参数,由模型以 JSON 格式生成。 请注意,该模型并非始终生成有效的 JSON,并且可能会幻化出未由函数架构定义的参数。 在调用函数之前验证代码中的参数。 | 否 | |
└─ 名称 | 字符串 | 要调用的函数名称。 | 否 | |
拒绝 | 字符串 | 模型生成的拒绝消息。 | 否 | |
角色 | 枚举 | 此消息作者的角色。 可能的值: system 、user 、assistant 、tool |
否 | |
工具调用 | 数组 | 否 |
chatCompletionMessageToolCallChunk
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 否 | ||
└─ arguments | 字符串 | 用于调用函数的参数,由模型以 JSON 格式生成。 请注意,该模型并非始终生成有效的 JSON,并且可能会幻化出未由函数架构定义的参数。 在调用函数之前验证代码中的参数。 | 否 | |
└─ 名称 | 字符串 | 要调用的函数名称。 | 否 | |
id | 字符串 | 工具调用的 ID。 | 否 | |
索引 | 整数 | 是的 | ||
类型 | 枚举 | 工具的类型。 目前仅支持 function 。可能的值: function |
否 |
聊天完成流选项
用于流式处理响应的选项。 仅在设置 stream: true
时设置此项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
include_usage | 布尔 | 如果已设置,则会在 data: [DONE] 消息之前流式传输其他区块。 此区块上的 usage 字段将显示整个请求的令牌使用情况统计信息,并且 choices 字段将始终为空数组。 所有其他区块也将包含一个 usage 字段,但值为 null。 |
否 |
chatCompletionChoiceLogProbs
所选的对数概率信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 数组 | 包含对数概率信息的消息内容令牌列表。 | 是的 | |
拒绝 | 数组 | 包含对数概率信息的消息拒绝标记的列表。 | 否 |
chatCompletionTokenLogprob
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
字节 | 数组 | 表示令牌的 UTF-8 字节表示形式的整数列表。 在字符由多个令牌表示,并且其字节表示形式必须组合在一起才能生成正确的文本表示形式的情况下非常有用。 如果令牌没有字节表示形式,则为 null 。 |
是的 | |
logprob | 数字 | 此令牌的对数概率。 | 是的 | |
代币 | 字符串 | 令牌。 | 是的 | |
top_logprobs | 数组 | 在此标记位置上,最有可能的标记及其对数概率的列表。 在极少数情况下,返回的数量可能少于请求的 top_logprobs 数。 |
是的 |
聊天完成响应消息 (chatCompletionResponseMessage)
模型生成的聊天补全消息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
音频 | 对象 | 如果请求音频输出形式,此对象包含有关模型音频响应的数据。 | 否 | |
└─ 数据 | 字符串 | 模型生成的音频字节经过 Base64 编码,并以请求中指定的格式呈现。 |
否 | |
过期时间 | 整数 | 在服务器上不再可访问此音频响应的 Unix 时间戳(以秒为单位),以便在多轮对话中使用。 |
否 | |
└─ id | 字符串 | 此音频响应的唯一标识符。 | 否 | |
~~ 脚本 | 字符串 | 模型生成的音频的脚本。 | 否 | |
内容 | 字符串 | 消息的内容。 | 是的 | |
上下文 | azureChatExtensionsMessageContext | 当 Azure OpenAI 聊天扩展涉及到生成相应的聊天补全响应时可用的其他上下文信息的表示形式。 仅当使用配置为使用匹配扩展的 Azure OpenAI 请求时,才会填充此上下文信息。 | 否 | |
function_call | chatCompletionFunctionCall | 已弃用并替换为 tool_calls 。 应调用的函数的名称和参数,由模型生成。 |
否 | |
拒绝 | 字符串 | 模型生成的拒绝消息。 | 是的 | |
角色 | chatCompletionResponseMessageRole | 响应消息作者的角色。 | 是的 | |
工具调用 | 数组 | 模型生成的工具调用,例如函数调用。 | 否 |
chatCompletionResponseMessageRole
响应消息作者的角色。
资产 | 价值 |
---|---|
说明 | 响应消息作者的角色。 |
类型 | 字符串 |
价值观 | assistant |
聊天完成工具选项选择
控制模型调用哪些工具(如有)。 none
表示模型不会调用任何工具,而是生成消息。 auto
表示模型可以在生成消息和调用一个或多个工具之间进行选择。 required
表示模型必须调用一个或多个工具。 通过 {"type": "function", "function": {"name": "my_function"}}
指定特定工具将强制模型调用该工具。 如果没有工具,则 none
为默认值。 如果存在工具,则 auto
为默认值。
此组件可以是下列组件之一:
chatCompletionNamedToolChoice
指定模型应使用的工具。 用于强制模型调用特定函数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 是的 | ||
└─ 名称 | 字符串 | 要调用的函数名称。 | 否 | |
类型 | 枚举 | 工具的类型。 目前仅支持 function 。可能的值: function |
是的 |
ParallelToolCalls
是否在工具使用期间启用并行函数调用。
未为此组件定义任何属性。
预测内容
静态预测输出内容,例如正在重新生成的文本文件的内容。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 字符串或数组 | 生成模型响应时应匹配的内容。 如果生成的标记与该内容匹配,则返回整个模型响应的速度可以快得多。 | 是的 | |
类型 | 枚举 | 要提供的预测内容的类型。 此类型目前始终为 content 。可能的值: content |
是的 |
chatCompletionMessageToolCalls
模型生成的工具调用,例如函数调用。
未为此组件定义任何属性。
ChatCompletionModalities
你希望模型为此请求生成的输出类型。 大多数模型都能够生成文本,这是默认设置:
["text"]
gpt-4o-audio-preview
模型还可用于生成音频。 若要请求此模型生成文本和音频响应,你可以使用:
["text", "audio"]
未为此组件定义任何属性。
chatCompletionFunctionCall
已弃用并替换为 tool_calls
。 应调用的函数的名称和参数,由模型生成。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
论点 | 字符串 | 用于调用函数的参数,由模型以 JSON 格式生成。 请注意,该模型并非始终生成有效的 JSON,并且可能会幻化出未由函数架构定义的参数。 在调用函数之前验证代码中的参数。 | 是的 | |
姓名 | 字符串 | 要调用的函数名称。 | 是的 |
completionUsage
完成请求的使用情况统计信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
完成令牌 | 整数 | 生成的补全中的词元数。 | 是的 | |
completion_tokens_details | 对象 | 完成中使用的令牌明细。 | 否 | |
接受的预测标记 | 整数 | 使用预测输出时,在补全时出现的预测中标记数。 | 否 | |
音频标记 | 整数 | 模型生成的音频输入标记。 | 否 | |
└─ reasoning_tokens | 整数 | 用于推理的由模型生成的令牌。 | 否 | |
└─ rejected_prediction_tokens | 整数 | 使用预测输出时,未在补全时出现的预测中标记数。 但是,与推理标记一样,出于计费、输出和上下文窗口限制的目的,这些标记仍然计入总补全标记中。 | 否 | |
prompt_tokens | 整数 | 提示中的标记数。 | 是的 | |
prompt_tokens_details | 对象 | 提示令牌的详细信息。 | 否 | |
音频标记 | 整数 | 提示中存在的音频输入标记。 | 否 | |
└─ cached_tokens | 整数 | 缓存的提示令牌数。 | 否 | |
总令牌数量 | 整数 | 请求中使用的令牌总数(提示 + 补全)。 | 是的 |
chatCompletionTool
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | FunctionObject | 是的 | ||
类型 | 枚举 | 工具的类型。 目前仅支持 function 。可能的值: function |
是的 |
函数参数
函数接受的参数,被描述为 JSON 架构对象。 请参阅指南查看示例,参阅 JSON 架构参考查看有关格式的文档。
省略 parameters
会定义具有空参数列表的函数。
未为此组件定义任何属性。
FunctionObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 函数作用的描述,由模型用于选择何时以及如何调用函数。 | 否 | |
姓名 | 字符串 | 要调用的函数的名称。 必须是 a-z、A-z、0-9,或包含下划线和短划线,最大长度为 64。 | 是的 | |
参数 | FunctionParameters | 函数接受的参数,被描述为 JSON 架构对象。 请参阅指南查看示例,参阅 JSON 架构参考查看有关格式的文档。 省略 parameters 会定义具有空参数列表的函数。 |
否 | |
strict | 布尔 | 生成函数调用时是否启用严格的架构遵循。 如果设置为 true,则模型将遵循 parameters 字段中定义的确切架构。 当 strict 为 true 时仅支持 JSON 架构的子集。 |
否 | 假 |
响应格式文本
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 要定义的响应格式的类型:text 可能的值: text |
是的 |
响应格式JsonObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 要定义的响应格式的类型:json_object 可能的值: json_object |
是的 |
ResponseFormatJsonSchemaSchema
响应格式的架构,描述为 JSON 架构对象。
未为此组件定义任何属性。
响应格式JsonSchema
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
json_schema | 对象 | 是的 | ||
└─ 说明 | 字符串 | 对响应格式用途的描述,由模型用于确定如何以该格式进行响应。 | 否 | |
└─ 名称 | 字符串 | 响应格式的名称。 必须是 a-z、A-z、0-9,或包含下划线和短划线,最大长度为 64。 | 否 | |
└─ 架构 | 响应格式Json模式Schema | 响应格式的架构,描述为 JSON 架构对象。 | 否 | |
└─ 严格 | 布尔 | 是否在生成输出时启用严格的架构遵循。 如果设置为 true,则模型将始终遵循 schema 字段中定义的确切架构。 当 strict 为 true 时仅支持 JSON 架构的子集。 |
否 | 假 |
类型 | 枚举 | 要定义的响应格式的类型:json_schema 可能的值: json_schema |
是的 |
chatCompletionChoiceCommon
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
finish_reason | 字符串 | 否 | ||
索引 | 整数 | 否 |
创建翻译请求
翻译请求。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件 | 字符串 | 要翻译的音频文件。 | 是的 | |
提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 提示应为英语。 | 否 | |
响应格式 | audioResponseFormat | 定义输出的格式。 | 否 | |
温度 | 数字 | 采样温度,介于 0 和 1 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 如果设置为 0,则模型将使用对数概率自动升高温度,直到达到特定阈值。 | 否 | 0 |
audioResponse
response_format 为 json 时的翻译或听录响应
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文本消息 | 字符串 | 已翻译或听录的文本。 | 是的 |
audioVerboseResponse
response_format 为 verbose_json 时的翻译或听录响应
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
持续时间 | 数字 | 持续时间。 | 否 | |
语言 | 字符串 | 语言。 | 否 | |
细分 | 数组 | 否 | ||
任务 | 字符串 | 音频任务的类型。 | 否 | |
文本消息 | 字符串 | 已翻译或听录的文本。 | 是的 | |
words | 数组 | 否 |
音频响应格式
定义输出的格式。
资产 | 价值 |
---|---|
说明 | 定义输出的格式。 |
类型 | 字符串 |
价值观 | json text srt verbose_json vtt |
创建转录请求
听录请求。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件 | 字符串 | 要转录的音频文件对象。 | 是的 | |
语言 | 字符串 | 输入音频的语言。 以 ISO-639-1 格式提供输入语言将提高准确性并减少延迟。 | 否 | |
提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 提示应与音频语言匹配。 | 否 | |
响应格式 | audioResponseFormat | 定义输出的格式。 | 否 | |
温度 | 数字 | 采样温度,介于 0 和 1 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 如果设置为 0,则模型将使用对数概率自动升高温度,直到达到特定阈值。 | 否 | 0 |
timestamp_granularities[] | 数组 | 要为此听录填充的时间戳粒度。 response_format 必须设为 verbose_json 以使用时间戳粒度。 支持以下任一选项或两个选项:word 或 segment 。 注意:段时间戳没有额外的延迟,但生成单词时间戳会产生额外的延迟。 |
否 | ['segment'] |
音频段
听录或翻译段。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
avg_logprob | 数字 | 平均对数概率。 | 否 | |
压缩比 | 数字 | 压缩率。 | 否 | |
end | 数字 | 段结束偏移量。 | 否 | |
id | 整数 | 段标识符。 | 否 | |
no_speech_prob | 数字 | “无语音”的概率。 | 否 | |
seek | 数字 | 段的偏移量。 | 否 | |
start | 数字 | 段初始偏移量。 | 否 | |
温度 | 数字 | 温度。 | 否 | |
文本消息 | 字符串 | 段文本。 | 否 | |
令牌 | 数组 | 文本令牌。 | 否 |
audioWord
听录或翻译字。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
end | 数字 | 字结束偏移量。 | 否 | |
start | 数字 | 字初始偏移量。 | 否 | |
字 | 字符串 | 单词 | 否 |
创建语音请求 (createSpeechRequest)
语音请求。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
输入 | 字符串 | 要为其合成音频的文本。 最大长度为 4096 个字符。 | 是的 | |
响应格式 | 枚举 | 合成音频的格式。 可能的值: mp3 、、opus 、aac flac 、wav 、pcm |
否 | |
速度 | 数字 | 合成音频的速度。 从 0.25 到 4.0 范围选择值。 1.0 是默认值。 |
否 | 1.0 |
voice | 枚举 | 用于语音合成的语音。 可能的值: alloy 、、echo 、fable onyx 、nova 、shimmer |
是的 |
图像质量
将生成的图像的质量。
资产 | 价值 |
---|---|
说明 | 将生成的图像的质量。 |
类型 | 字符串 |
默认 | 汽车 |
价值观 | auto high medium low hd standard |
图像响应格式
返回生成图像的格式。
资产 | 价值 |
---|---|
说明 | 返回生成图像的格式。 |
类型 | 字符串 |
默认 | url |
价值观 | url b64_json |
图像输出格式
返回生成的图像的文件格式。 仅支持 gpt-image-1。
资产 | 价值 |
---|---|
说明 | 返回生成的图像的文件格式。 仅支持 gpt-image-1。 |
类型 | 字符串 |
默认 | png |
价值观 | png jpeg |
imageSize
生成的图像的大小。
资产 | 价值 |
---|---|
说明 | 生成的图像的大小。 |
类型 | 字符串 |
默认 | 汽车 |
价值观 | auto 1792x1024 1024x1792 1024x1024 1024x1536 1536x1024 |
imageStyle
生成的图像的样式。 仅支持 dall-e-3。
资产 | 价值 |
---|---|
说明 | 生成的图像的样式。 仅支持 dall-e-3。 |
类型 | 字符串 |
默认 | vivid |
价值观 | vivid natural |
图片背景
允许为生成的图像的背景设置透明度。 仅 gpt-image-1 支持此参数。
资产 | 价值 |
---|---|
说明 | 允许为生成的图像的背景设置透明度。 仅 gpt-image-1 支持此参数。 |
类型 | 字符串 |
默认 | 汽车 |
价值观 | transparent opaque auto |
图像生成请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
后台的 | imageBackground | 允许为生成的图像的背景设置透明度。 仅 gpt-image-1 支持此参数。 | 否 | 汽车 |
n | 整数 | 要生成的图像数。 对于 dall-e-3,仅支持 n=1。 | 否 | 1 |
输出压缩 | 整数 | 生成的图像的压缩级别(0-100%)。 此参数仅在 gpt-image-1 的 jpeg 输出格式下受到支持。 | 否 | 100 |
输出格式 | imagesOutputFormat | 返回生成的图像的文件格式。 仅支持 gpt-image-1。 | 否 | png |
提示 | 字符串 | 所需图像的文本说明。 gpt-image-1 的最大长度为 32000 个字符,dall-e-3 的最大长度为 4000 个字符 | 是的 | |
quality | imageQuality | 将生成的图像的质量。 | 否 | 汽车 |
响应格式 | imagesResponseFormat | 返回生成图像的格式。 | 否 | url |
大小 | imageSize | 生成的图像的大小。 | 否 | 汽车 |
样式 | imageStyle | 生成的图像的样式。 仅支持 dall-e-3。 | 否 | vivid |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 | 否 |
图片编辑请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
图像 | 字符串或数组 | 待编辑的图片。 必须是受支持的图像文件或图像数组。 每个图像应为小于 25MB 的 png 或 jpg 文件。 | 是的 | |
过滤 | 字符串 | 另一个图像,其完全透明区域(例如 alpha 为零)指示应编辑图像的位置。 如果提供了多个映像,掩码将应用于第一个图像。 必须是有效的 PNG 文件,小于 4MB,并且具有与图像相同的尺寸。 | 否 | |
n | 整数 | 要生成的图像数。 | 否 | 1 |
提示 | 字符串 | 所需图像的文本说明。 最大长度为 32000 个字符。 | 是的 | |
quality | imageQuality | 将生成的图像的质量。 | 否 | 汽车 |
响应格式 | imagesResponseFormat | 返回生成图像的格式。 | 否 | url |
大小 | imageSize | 生成的图像的大小。 | 否 | 汽车 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助监视和检测滥用行为。 | 否 |
generateImagesResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
created | 整数 | 创建操作时的 UNIX 时间戳。 | 是的 | |
数据 | 数组 | 操作的结果数据(如果成功) | 是的 | |
使用情况 | imageGenerationsUsage | 表示图像生成请求中令牌使用的详细信息。 仅适用于 gpt-image-1。 | 否 |
imageResult
如果成功,则返回图像 URL 或编码图像,否则返回错误。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
b64_json | 字符串 | base64 编码的图像 | 否 | |
内容过滤结果 | dalle内容过滤结果 | 有关内容筛选结果的信息。 | 否 | |
提示过滤结果 | dalleFilterResults | 有关内容筛选类别(hate、sexual、violence、self_harm)的信息(如果检测到),及严重性级别(very_low、low、medium、high-scale,用于确定有害内容的强度和风险级别),以及内容是否已筛选。 有关越狱内容和亵渎内容的信息(如果检测到),以及是否已筛选。 以及有关客户阻止列表的信息(如果已筛选)及其 ID。 | 否 | |
修订后的提示 | 字符串 | 用于生成图像的提示(如果有对提示的任何修订)。 | 否 | |
url | 字符串 | 图像 URL。 | 否 |
imageGenerationsUsage
表示图像生成请求中令牌使用的详细信息。 仅适用于 gpt-image-1。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
input_tokens | 整数 | 输入令牌数。 | 否 | |
输入令牌详情 | 对象 | 输入令牌的明细。 | 否 | |
└─ image_tokens | 整数 | 映像令牌数。 | 否 | |
└─ text_tokens | 整数 | 文本标记数。 | 否 | |
output_tokens | 整数 | 输出标记数。 | 否 | |
总令牌数量 | 整数 | 使用的令牌总数。 | 否 |
线
内容行对象,由相邻的内容元素序列(如字词和选择标记)组成。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
spans | 数组 | 表示检测到的对象及其边界框信息的跨度数组。 | 是的 | |
文本消息 | 字符串 | 是的 |
范围
表示检测到的对象及其边界框信息的跨度对象。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
长度 | 整数 | 以字符为单位的跨度长度,以 Unicode 码位表示。 | 是的 | |
偏移 | 整数 | 文本中跨度开始处的字符偏移量。 这个偏移量定义为跨度的第一个字符的位置,从文本开头作为 Unicode 码位开计数。 | 是的 | |
多边形 | 数组 | 一个对象数组,表示多边形中包含检测到的对象中的点。 | 是的 | |
文本消息 | 字符串 | 表示检测到的对象的跨度的文本内容。 | 是的 |
runCompletionUsage
与运行相关的使用情况统计信息。 如果运行不处于终端状态(例如 in_progress
、queued
等),则此值将为 null
。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
完成令牌 | 整数 | 在运行过程中使用的补全令牌的数目。 | 是的 | |
prompt_tokens | 整数 | 在运行过程中使用的提示令牌的最大数目。 | 是的 | |
总令牌数量 | 整数 | 使用的令牌总数(提示 + 补全)。 | 是的 |
runStepCompletionUsage
与运行步骤相关的使用情况统计信息。 当运行步骤的状态为 in_progress
时,此值将为 null
。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
完成令牌 | 整数 | 在运行步骤过程中使用的补全令牌的数目。 | 是的 | |
prompt_tokens | 整数 | 在运行步骤过程中使用的提示令牌的数目。 | 是的 | |
总令牌数量 | 整数 | 使用的令牌总数(提示 + 补全)。 | 是的 |
助理API响应格式选项
指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106
起的所有 GPT-3.5 Turbo 型号兼容。
{ "type": "json_schema", "json_schema": {...} }
设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。
设置为 { "type": "json_object" }
将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。
重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length"
,则消息内容可能会部分截断,这表示生成超过了 max_tokens
,或者对话超过了最大上下文长度。
此组件可以是下列组件之一:
assistantsApiResponseFormat
描述模型的预期输出的对象。 如果为 json_object
,则只允许将 function
类型 tools
传递给 Run。 如果为 text
,则模型可以返回文本或任何所需的值。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 字符串 | 必须是 text 或 json_object 之一。 |
否 | 文本消息 |
类型枚举:AssistantsApiResponseFormat
价值 | DESCRIPTION |
---|---|
文本消息 | |
json对象 (json_object) |
助理对象
表示可以调用模型并使用工具的 assistant
。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
创建时间 | 整数 | 创建助手时的 Unix 时间戳(以秒为单位)。 | 是的 | |
description | 字符串 | 助手的说明。 最大长度为 512 个字符。 |
是的 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
instructions | 字符串 | 助手使用的系统说明。 最大长度为 256,000 个字符。 |
是的 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
是的 | |
模型 | 字符串 | 要使用的模型的 ID。 | 是的 | |
姓名 | 字符串 | 助手的名称。 最大长度为 256 个字符。 |
是的 | |
对象 | 字符串 | 始终为 assistant 的对象类型。 |
是的 | |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此助手的矢量存储 ID。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 在助手上启用的工具列表。 每个助手最多可以有 128 个工具。 工具类型可以是 code_interpreter 、file_search 或 function 。 |
是的 | [] |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
对象枚举:AssistantObjectType
价值 | DESCRIPTION |
---|---|
助手 | 对象类型,始终为 assistant。 |
创建助手请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 助手的说明。 最大长度为 512 个字符。 |
否 | |
instructions | 字符串 | 助手使用的系统说明。 最大长度为 256,000 个字符。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 是的 | ||
姓名 | 字符串 | 助手的名称。 最大长度为 256 个字符。 |
否 | |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此助手的矢量存储。 助手最多可以附加 1 个矢量存储。 |
否 | |
向量存储 | 数组 | 一个帮助程序,用于创建具有 file_ids 的矢量存储,并将其附加到此助手。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 在助手上启用的工具列表。 每个助手最多可以有 128 个工具。 工具类型可以是 code_interpreter 、retrieval 或 function 。 |
否 | [] |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
修改助手请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 助手的说明。 最大长度为 512 个字符。 |
否 | |
instructions | 字符串 | 助手使用的系统说明。 最大长度为 32768 个字符。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 否 | ||
姓名 | 字符串 | 助手的名称。 最大长度为 256 个字符。 |
否 | |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 替代可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 替代附加到此助手的矢量存储。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 在助手上启用的工具列表。 每个助手最多可以有 128 个工具。 工具类型可以是 code_interpreter 、retrieval 或 function 。 |
否 | [] |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
删除助手响应
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
已删除 | 布尔 | 是的 | ||
id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
对象枚举:DeleteAssistantResponseState
价值 | DESCRIPTION |
---|---|
助理.已删除 |
listAssistantsResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
assistantToolsCode
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 字符串 | 要定义的工具类型:code_interpreter |
是的 |
类型枚举:assistantToolsCodeType
价值 | DESCRIPTION |
---|---|
代码解释器 |
assistantToolsFileSearch
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件搜索 | 对象 | 文件搜索工具的替代。 | 否 | |
└─ max_num_results | 整数 | 文件搜索工具应输出的最大结果数。 对于 gpt-4* 模型,默认值为 20;对于 gpt-3.5-turbo,默认值为 5。 此数字应介于 1 和 50 之间(含)。 请注意,文件搜索工具输出的结果可能会少于 max_num_results 个。 |
否 | |
类型 | 字符串 | 要定义的工具类型:file_search |
是的 |
类型枚举:assistantToolsFileSearchType
价值 | DESCRIPTION |
---|---|
文件搜索 |
助手工具文件搜索类型专用
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 字符串 | 要定义的工具类型:file_search |
是的 |
类型枚举:assistantToolsFileSearchType
价值 | DESCRIPTION |
---|---|
文件搜索 |
assistantToolsFunction
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 函数定义。 | 是的 | |
└─ 说明 | 字符串 | 函数作用的描述,由模型用于选择何时以及如何调用函数。 | 否 | |
└─ 名称 | 字符串 | 要调用的函数的名称。 必须是 a-z、A-z、0-9,或包含下划线和短划线,最大长度为 64。 | 否 | |
└─ 参数 | 聊天完成功能参数 | 函数接受的参数,被描述为 JSON 架构对象。 请参阅指南/查看示例,参阅 JSON 架构参考查看有关格式的文档。 | 否 | |
类型 | 字符串 | 要定义的工具类型:function |
是的 |
类型枚举:assistantToolsFunction
价值 | DESCRIPTION |
---|---|
函数 |
truncationObject
用于指示在运行之前如何截断线程的控件。 使用此控件可控制运行的初始上下文窗口。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
最后消息 | 整数 | 构造运行上下文时线程中的最新消息数。 | 否 | |
类型 | 字符串 | 用于线程的截断策略。 默认值为 auto 。 如果设置为 last_messages ,则线程将被截断为线程中的 n 条最新消息。 设置为 auto 时,将删除线程中间的消息,以适应模型的上下文长度 max_prompt_tokens 。 |
是的 |
类型枚举:TruncationType
价值 | DESCRIPTION |
---|---|
汽车 | |
最后消息 |
助手API工具选择选项
控制模型调用哪些工具(如有)。
none
表示模型不会调用任何工具,而是生成消息。
auto
是默认值,表示模型可以在生成消息和调用工具之间进行选择。
指定特定工具(例如 {"type": "file_search"}
或 {"type": "function", "function": {"name": "my_function"}}
)将强制模型调用该工具。
此组件可以是下列组件之一:
assistantsNamedToolChoice
指定模型应使用的工具。 用于强制模型调用特定工具。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 否 | ||
└─ 名称 | 字符串 | 要调用的函数名称。 | 否 | |
类型 | 字符串 | 工具的类型。 如果类型为 function ,则必须设置函数名称 |
是的 |
类型枚举:AssistantsNamedToolChoiceType
价值 | DESCRIPTION |
---|---|
函数 | |
代码解释器 | |
文件搜索 |
runObject
表示在线程上运行的执行。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
助手ID | 字符串 | 用于执行此运行的助手的 ID。 | 是的 | |
cancelled_at | 整数 | 运行取消时的 Unix 时间戳(以秒为单位)。 | 是的 | |
完成时间 | 整数 | 运行完成时的 Unix 时间戳(以秒为单位)。 | 是的 | |
创建时间 | 整数 | 创建运行时的 Unix 时间戳(以秒为单位)。 | 是的 | |
过期时间 | 整数 | 运行过期时的 Unix 时间戳(以秒为单位)。 | 是的 | |
failed_at | 整数 | 运行失败时的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
不完整的细节 | 对象 | 有关运行为何不完整的详细信息。 如果运行不完整,则将为 null 。 |
是的 | |
~~ 原因 | 字符串 | 运行不完整的原因。 这将指出在运行过程中达到了哪个特定令牌限制。 | 否 | |
instructions | 字符串 | 助手用于此运行的指令。 | 是的 | |
最后错误 (last_error) | 对象 | 与此运行关联的最后一个错误。 如果没有错误,则为 null 。 |
是的 | |
└─ 代码 | 字符串 | server_error 或 rate_limit_exceeded 中的一项。 |
否 | |
└─ 消息 | 字符串 | 可读的错误说明。 | 否 | |
max_completion_tokens | 整数 | 指定的在运行过程中已使用完成令牌的最大数目。 |
是的 | |
max_prompt_tokens | 整数 | 指定的在运行过程中已使用提示令牌的最大数目。 |
是的 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
是的 | |
模型 | 字符串 | 助手用于此运行的模型。 | 是的 | |
对象 | 字符串 | 始终为 thread.run 的对象类型。 |
是的 | |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
所需操作 | 对象 | 有关继续运行所需的操作的详细信息。 如果不需要任何操作,则为 null 。 |
是的 | |
└─ submit_tool_outputs | 对象 | 继续此运行所需的工具输出的详细信息。 | 否 | |
└─ tool_calls | 数组 | 相关工具调用的列表。 | 否 | |
└─ 类型 | 枚举 | 目前始终为 submit_tool_outputs 。可能的值: submit_tool_outputs |
否 | |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
是的 | |
开始时间 | 整数 | 运行启动时的 Unix 时间戳(以秒为单位)。 | 是的 | |
状态 | 字符串 | 运行的状态,可以是 queued 、in_progress 、requires_action 、cancelling 、cancelled 、failed 、completed 或 expired 。 |
是的 | |
温度 | 数字 | 用于此运行的采样温度。 如果未设置,则默认值为 1。 | 否 | |
线程ID | 字符串 | 作为此运行的一部分执行的线程的 ID。 | 是的 | |
工具选择 | assistantsApiToolChoiceOption | 控制模型调用哪些工具(如有)。none 表示模型不会调用任何工具,而是生成消息。auto 是默认值,表示模型可以在生成消息和调用工具之间进行选择。指定特定工具(例如 {"type": "file_search"} 或 {"type": "function", "function": {"name": "my_function"}} )将强制模型调用该工具。 |
是的 | |
工具 | 数组 | 助手用于此运行的工具列表。 | 是的 | [] |
top_p | 数字 | 用于此运行的核心采样值。 如果未设置,则默认值为 1。 | 否 | |
截断策略 | truncationObject | 用于指示在运行之前如何截断线程的控件。 使用此控件可控制运行的初始上下文窗口。 | 是的 | |
使用情况 | runCompletionUsage | 与运行相关的使用情况统计信息。 如果运行不处于终端状态(例如 in_progress 、queued 等),则此值将为 null 。 |
是的 |
对象枚举:runObjectType
价值 | DESCRIPTION |
---|---|
thread.run | 运行对象类型,始终为 thread.run。 |
状态枚举:RunObjectStatus
价值 | DESCRIPTION |
---|---|
queued | queued 状态 |
进行中 | in_progress 状态 |
requires_action | required_action 状态 |
cancelling | cancelling 状态 |
cancelled | cancelled 状态 |
“失败” | failed 状态 |
已完成 | completed 状态 |
expired | expired 状态 |
创建运行请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
附加说明 | 字符串 | 在运行指令的末尾追加其他指令。 这对不替代其他指令的情况下按运行修改行为很有用。 | 否 | |
附加消息 | 数组 | 在创建运行之前,将其他消息添加到线程。 | 否 | |
助手ID | 字符串 | 用于执行此运行的助手的 ID。 | 是的 | |
instructions | 字符串 | 替代助手的默认系统消息。 这对按运行修改行为很有用。 | 否 | |
max_completion_tokens | 整数 | 在运行过程中可能会使用的完成令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的补全令牌数。 如果运行超过指定的补全令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
max_prompt_tokens | 整数 | 在运行过程中可能会使用的提示令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的提示令牌数。 如果运行超过指定的提示令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 用于执行此运行的模型的 ID。 如果此处提供了一个值,它将替代与助手关联的模型。 否则,将使用与助手关联的模型。 | 否 | |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
数据流 | 布尔 | 如果为 true ,则返回在运行为服务器发送事件期间发生的事件流,在运行进入附带 data: [DONE] 消息的终端状态时终止。 |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
工具选择 | assistantsApiToolChoiceOption | 控制模型调用哪些工具(如有)。none 表示模型不会调用任何工具,而是生成消息。auto 是默认值,表示模型可以在生成消息和调用工具之间进行选择。指定特定工具(例如 {"type": "file_search"} 或 {"type": "function", "function": {"name": "my_function"}} )将强制模型调用该工具。 |
否 | |
工具 | 数组 | 替代助手可用于此运行的工具。 这对按运行修改行为很有用。 | 否 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
截断策略 | truncationObject | 用于指示在运行之前如何截断线程的控件。 使用此控件可控制运行的初始上下文窗口。 | 否 |
listRunsResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
修改运行请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 |
提交工具输出运行请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据流 | 布尔 | 如果为 true ,则返回在运行为服务器发送事件期间发生的事件流,在运行进入附带 data: [DONE] 消息的终端状态时终止。 |
否 | |
工具输出 | 数组 | 其输出正在提交的工具列表。 | 是的 |
runToolCallObject
工具调用对象
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 函数定义。 | 是的 | |
└─ arguments | 字符串 | 模型期望传递给函数的参数。 | 否 | |
└─ 名称 | 字符串 | 函数的名称。 | 否 | |
id | 字符串 | 工具调用的 ID。 使用提交工具输出以运行终结点时,必须引用此 ID。 | 是的 | |
类型 | 字符串 | 需要输出的工具调用的类型。 目前始终为 function 。 |
是的 |
类型枚举:RunToolCallObjectType
价值 | DESCRIPTION |
---|---|
函数 |
创建线程并运行请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
助手ID | 字符串 | 用于执行此运行的助手的 ID。 | 是的 | |
instructions | 字符串 | 替代助手的默认系统消息。 这对按运行修改行为很有用。 | 否 | |
max_completion_tokens | 整数 | 在运行过程中可能会使用的完成令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的补全令牌数。 如果运行超过指定的补全令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
max_prompt_tokens | 整数 | 在运行过程中可能会使用的提示令牌的最大数目。 在多轮运行中,运行将尽最大可能地只使用指定的提示令牌数。 如果运行超过指定的提示令牌数,则运行将以状态 incomplete 结束。 有关详细信息,请参阅 incomplete_details 。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
模型 | 字符串 | 要用于执行此运行的模型的 ID。 如果此处提供了一个值,它将替代与助手关联的模型。 否则,将使用与助手关联的模型。 | 否 | |
并行工具调用 | ParallelToolCalls | 是否在工具使用期间启用并行函数调用。 | 否 | True |
响应格式 | assistantsApiResponseFormatOption | 指定模型必须输出的格式。 与 GPT-4o、GPT-4 Turbo 和自 gpt-3.5-turbo-1106 起的所有 GPT-3.5 Turbo 型号兼容。{ "type": "json_schema", "json_schema": {...} } 设置为启用结构化输出,以确保模型与提供的 JSON 架构匹配。 在“结构化输出”指南中了解详细信息。设置为 { "type": "json_object" } 将启用 JSON 模式,这可以确保模型生成的消息是有效的 JSON。重要提示:使用 JSON 模式时,还必须使用系统或用户消息指示模型自行生成 JSON。 如果没有此项,则模型可能会生成一个无限的空白流,直到生成达到令牌限制,从而生成长期运行且似乎“卡滞”的请求。 另请注意,如果使用 finish_reason="length" ,则消息内容可能会部分截断,这表示生成超过了 max_tokens ,或者对话超过了最大上下文长度。 |
否 | |
数据流 | 布尔 | 如果为 true ,则返回在运行为服务器发送事件期间发生的事件流,在运行进入附带 data: [DONE] 消息的终端状态时终止。 |
否 | |
stream_options | chatCompletionStreamOptions | 用于流式处理响应的选项。 仅在设置 stream: true 时设置此项。 |
否 | 没有 |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 |
否 | 1 |
会话 | createThreadRequest | 否 | ||
工具选择 | assistantsApiToolChoiceOption | 控制模型调用哪些工具(如有)。none 表示模型不会调用任何工具,而是生成消息。auto 是默认值,表示模型可以在生成消息和调用工具之间进行选择。指定特定工具(例如 {"type": "file_search"} 或 {"type": "function", "function": {"name": "my_function"}} )将强制模型调用该工具。 |
否 | |
工具资源 | 对象 | 助手工具使用的一组资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此助手的矢量存储 ID。 助手最多可以附加 1 个矢量存储。 |
否 | |
工具 | 数组 | 替代助手可用于此运行的工具。 这对按运行修改行为很有用。 | 否 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或温度,但不要同时更改这两者。 |
否 | 1 |
截断策略 | truncationObject | 用于指示在运行之前如何截断线程的控件。 使用此控件可控制运行的初始上下文窗口。 | 否 |
threadObject
表示包含消息的线程。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
创建时间 | 整数 | 创建线程时的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
是的 | |
对象 | 字符串 | 始终为 thread 的对象类型。 |
是的 | |
工具资源 | 对象 | 一组可供此线程中的助手工具使用的资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
是的 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此线程的矢量存储。 线程最多可以附加 1 个矢量存储。 |
否 |
对象枚举:ThreadObjectType
价值 | DESCRIPTION |
---|---|
会话 | 始终为 thread 的线程对象的类型 |
创建线程请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
消息 | 数组 | 用于启动线程的消息列表。 | 否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
工具资源 | 对象 | 一组可供此线程中的助手工具使用的资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此线程的矢量存储。 线程最多可以附加 1 个矢量存储。 |
否 | |
向量存储 | 数组 | 一个帮助程序,用于创建具有 file_ids 的矢量存储,并将其附加到此线程。 线程最多可以附加 1 个矢量存储。 |
否 |
modifyThreadRequest
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
工具资源 | 对象 | 一组可供此线程中的助手工具使用的资源。 资源特定于工具类型。 例如,code_interpreter 工具需要文件 ID 列表,而 file_search 工具需要矢量存储 ID 列表。 |
否 | |
代码解释器 | 对象 | 否 | ||
└─ file_ids | 数组 | 可供 code_interpreter 工具使用的文件 ID 列表。 最多可以有 20 个与该工具关联的文件。 |
否 | [] |
文件搜索 | 对象 | 否 | ||
└─ vector_store_ids | 数组 | 附加到此线程的矢量存储。 线程最多可以附加 1 个矢量存储。 |
否 |
删除线程响应
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
已删除 | 布尔 | 是的 | ||
id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
对象枚举:DeleteThreadResponseObjectState
价值 | DESCRIPTION |
---|---|
线程.已删除 | 删除线程响应对象状态,为 thread.deleted |
listThreadsResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
消息对象
表示线程中的消息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
助手ID | 字符串 | 如果适用,则为创作此消息的助手的 ID。 | 是的 | |
attachments | 数组 | 附加到消息的文件列表及其添加到的工具。 | 是的 | |
完成时间 | 整数 | 消息补全时的 Unix 时间戳(以秒为单位)。 | 是的 | |
内容 | 数组 | 文本和/或图像数组中消息的内容。 | 是的 | |
创建时间 | 整数 | 创建消息时的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
incomplete_at | 整数 | 消息标记为未补全时的 Unix 时间戳(以秒为单位)。 | 是的 | |
不完整的细节 | 对象 | 对于未补全的消息,详细说明消息未补全的原因。 | 是的 | |
~~ 原因 | 字符串 | 消息未补全的原因。 | 否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
是的 | |
对象 | 字符串 | 始终为 thread.message 的对象类型。 |
是的 | |
角色 | 字符串 | 生成消息的实体。 user 或 assistant 中的一项。 |
是的 | |
run_id | 字符串 | 如果适用,则为与此消息的创作关联的运行的 ID。 | 是的 | |
状态 | 字符串 | 运行的状态,可以是 in_progress 、incomplete 或 completed 。 |
是的 | |
线程ID | 字符串 | 此消息所属的线程 ID。 | 是的 |
对象枚举:MessageObjectType
价值 | DESCRIPTION |
---|---|
线程消息 | 消息对象类型(为 thread.message ) |
状态枚举:MessageObjectStatus
价值 | DESCRIPTION |
---|---|
进行中 | |
不完全的 | |
已完成 |
角色枚举:MessageObjectRole
价值 | DESCRIPTION |
---|---|
用户 | |
助手 |
messageDeltaObject
表示消息增量,例如,流式传输期间任何消息字段的更改。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
delta | 对象 | 增量包含消息中有所更改的字段。 | 是的 | |
└─ 内容 | 数组 | 文本和/或图像数组中消息的内容。 | 否 | |
└─角色 | 字符串 | 生成消息的实体。 user 或 assistant 中的一项。 |
否 | |
id | 字符串 | 消息标识符,可在 API 终结点中引用。 | 是的 | |
对象 | 字符串 | 始终为 thread.message.delta 的对象类型。 |
是的 |
对象枚举:MessageDeltaObjectType
价值 | DESCRIPTION |
---|---|
thread.message.delta |
创建消息请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
attachments | 数组 | 附加到消息的文件列表及其应添加到的工具。 | 否 | |
内容 | 字符串 | 消息的内容。 | 是的 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
角色 | 字符串 | 正在创建消息的实体的角色。 允许的值包括: - user :指示消息是由实际用户发送的,应在大多数情况下用于表示用户生成的消息。- assistant :指示消息由助手生成。 使用此值将来自助手的消息插入对话。 |
是的 |
角色枚举:CreateMessageRequestRole
价值 | DESCRIPTION |
---|---|
用户 | |
助手 |
修改消息请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 |
deleteMessageResponse(删除消息响应)
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
已删除 | 布尔 | 是的 | ||
id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
对象枚举:DeleteMessageResponseObject
价值 | DESCRIPTION |
---|---|
线程.消息.已删除 | 删除消息响应对象状态 |
listMessagesResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
消息内容图像文件对象
引用消息内容中的图像文件。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
image_file | 对象 | 是的 | ||
└─ file_id | 字符串 | 消息内容中图像的文件 ID。 | 否 | |
类型 | 字符串 | 始终为 image_file 。 |
是的 |
类型枚举:MessageContentImageFileObjectType
价值 | DESCRIPTION |
---|---|
image_file | 消息内容图像文件类型 |
消息内容文本对象
作为消息一部分的文本内容。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文本消息 | 对象 | 是的 | ||
~~ 批注 | 数组 | 否 | ||
└─ value | 字符串 | 构成文本的数据。 | 否 | |
类型 | 字符串 | 始终为 text 。 |
是的 |
类型枚举:messageContentTextObjectType
价值 | DESCRIPTION |
---|---|
文本消息 | 消息内容文本对象类型 |
消息内容文本注释文件引用对象
消息中的引文,指向与助手或消息关联的特定文件中的特定引文。 当助手使用“检索”工具搜索文件时生成。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
end_index | 整数 | 是的 | ||
文件引用 | 对象 | 是的 | ||
└─ file_id | 字符串 | 引文来源的特定文件的 ID。 | 否 | |
start_index | 整数 | 是的 | ||
文本消息 | 字符串 | 需要替换的消息内容中的文本。 | 是的 | |
类型 | 字符串 | 始终为 file_citation 。 |
是的 |
类型枚举:FileCitationObjectType
价值 | DESCRIPTION |
---|---|
file_citation | 文件引文对象类型 |
信息内容文本注释文件路径对象
助手使用 code_interpreter
工具生成文件时生成的文件的 URL。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
end_index | 整数 | 是的 | ||
文件路径 | 对象 | 是的 | ||
└─ file_id | 字符串 | 生成的文件的 ID。 | 否 | |
start_index | 整数 | 是的 | ||
文本消息 | 字符串 | 需要替换的消息内容中的文本。 | 是的 | |
类型 | 字符串 | 始终为 file_path 。 |
是的 |
类型枚举:FilePathObjectType
价值 | DESCRIPTION |
---|---|
文件路径 | 文件路径对象类型 |
messageDeltaContentImageFileObject
引用消息内容中的图像文件。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
image_file | 对象 | 否 | ||
└─ file_id | 字符串 | 消息内容中图像的文件 ID。 | 否 | |
索引 | 整数 | 消息中内容部件的索引。 | 是的 | |
类型 | 字符串 | 始终为 image_file 。 |
是的 |
类型枚举:MessageDeltaContentImageFileObjectType
价值 | DESCRIPTION |
---|---|
image_file |
消息Delta内容文本对象
作为消息一部分的文本内容。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
索引 | 整数 | 消息中内容部件的索引。 | 是的 | |
文本消息 | 对象 | 否 | ||
~~ 批注 | 数组 | 否 | ||
└─ 值 | 字符串 | 构成文本的数据。 | 否 | |
类型 | 字符串 | 始终为 text 。 |
是的 |
类型枚举:MessageDeltaContentTextObjectType
价值 | DESCRIPTION |
---|---|
文本消息 |
messageDeltaContentTextAnnotationsFileCitationObject
消息中的引文,指向与助手或消息关联的特定文件中的特定引文。 当助手使用“file_search”工具搜索文件时生成。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
end_index | 整数 | 否 | ||
文件引用 | 对象 | 否 | ||
└─ file_id | 字符串 | 引文来源的特定文件的 ID。 | 否 | |
└─ 引用 | 字符串 | 文件中的特定引文。 | 否 | |
索引 | 整数 | 文本内容部件中批注的索引。 | 是的 | |
start_index | 整数 | 否 | ||
文本消息 | 字符串 | 需要替换的消息内容中的文本。 | 否 | |
类型 | 字符串 | 始终为 file_citation 。 |
是的 |
类型枚举:MessageDeltaContentTextAnnotationsFileCitationObjectType
价值 | DESCRIPTION |
---|---|
文件引用 |
messageDeltaContentTextAnnotationsFilePathObject
助手使用 code_interpreter
工具生成文件时生成的文件的 URL。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
end_index | 整数 | 否 | ||
文件路径 | 对象 | 否 | ||
└─ file_id | 字符串 | 生成的文件的 ID。 | 否 | |
索引 | 整数 | 文本内容部件中批注的索引。 | 是的 | |
start_index | 整数 | 否 | ||
文本消息 | 字符串 | 需要替换的消息内容中的文本。 | 否 | |
类型 | 字符串 | 始终为 file_path 。 |
是的 |
类型枚举:MessageDeltaContentTextAnnotationsFilePathObjectType
价值 | DESCRIPTION |
---|---|
文件路径 |
runStepObject
表示运行执行过程中的一个步骤。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
助手ID | 字符串 | 与运行步骤关联的助手的 ID。 | 是的 | |
cancelled_at | 整数 | 取消运行步骤时的 Unix 时间戳(以秒为单位)。 | 是的 | |
完成时间 | 整数 | 运行步骤完成时的 Unix 时间戳(以秒为单位)。 | 是的 | |
创建时间 | 整数 | 创建运行步骤时的 Unix 时间戳(以秒为单位)。 | 是的 | |
过期时间 | 整数 | 运行步骤过期时的 Unix 时间戳(以秒为单位)。 如果父运行已过期,则认为步骤已过期。 | 是的 | |
failed_at | 整数 | 运行步骤失败时的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 可在 API 终结点中引用的运行步骤标识符。 | 是的 | |
最后错误 (last_error) | 对象 | 与此运行步骤关联的最后一个错误。 如果没有错误,则为 null 。 |
是的 | |
└─ 代码 | 字符串 | server_error 或 rate_limit_exceeded 中的一项。 |
否 | |
└─ 消息 | 字符串 | 可读的错误说明。 | 否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
是的 | |
对象 | 字符串 | 始终为 assistant.run.step 的对象类型。 |
是的 | |
run_id | 字符串 | 此运行步骤所属的运行的 ID。 | 是的 | |
状态 | 字符串 | 运行的状态,可以是 in_progress 、cancelled 、failed 、completed 或 expired 。 |
是的 | |
步骤详情 | runStepDetailsMessageCreationObject 或 runStepDetailsToolCallsObject | 运行步骤的详细信息。 | 是的 | |
线程ID | 字符串 | 运行的线程的 ID。 | 是的 | |
类型 | 字符串 | 运行步骤的状态,可以是 message_creation 或 tool_calls 。 |
是的 |
对象枚举:RunStepObjectType
价值 | DESCRIPTION |
---|---|
assistant.run.step | 对象类型,始终为 assistant.run.step |
类型枚举:RunStepObjectType
价值 | DESCRIPTION |
---|---|
消息创建 | message_creation 运行步骤 |
工具调用 | tool_calls 运行步骤 |
状态枚举:RunStepObjectStatus
价值 | DESCRIPTION |
---|---|
进行中 | in_progress 运行状态 |
cancelled | cancelled 运行状态 |
“失败” | cancelled 运行状态 |
已完成 | cancelled 运行状态 |
expired | cancelled 运行状态 |
runStepDeltaObject
表示运行步骤增量,例如,流式传输期间任何运行步骤字段的更改。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
delta | 对象 | 增量包含运行步骤中有所更改的字段。 | 是的 | |
步骤详情 | runStepDeltaStepDetailsMessageCreationObject 或 runStepDeltaStepDetailsToolCallsObject | 运行步骤的详细信息。 | 否 | |
id | 字符串 | 可在 API 终结点中引用的运行步骤标识符。 | 是的 | |
对象 | 字符串 | 始终为 thread.run.step.delta 的对象类型。 |
是的 |
对象枚举:RunStepDeltaObjectType
价值 | DESCRIPTION |
---|---|
thread.run.step.delta |
列出运行步骤响应 (listRunStepsResponse)
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
runStepDetailsMessageCreationObject
运行步骤创建消息的详细信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
消息创建 | 对象 | 是的 | ||
└─ message_id | 字符串 | 此运行步骤创建的消息的 ID。 | 否 | |
类型 | 字符串 | 始终为 message_creation 。 |
是的 |
类型枚举:RunStepDetailsMessageCreationObjectType
价值 | DESCRIPTION |
---|---|
消息创建 |
runStepDeltaStepDetailsMessageCreationObject
运行步骤创建消息的详细信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
消息创建 | 对象 | 否 | ||
消息ID | 字符串 | 此运行步骤创建的消息的 ID。 | 否 | |
类型 | 字符串 | 始终为 message_creation 。 |
是的 |
类型枚举:RunStepDeltaStepDetailsMessageCreationObjectType
价值 | DESCRIPTION |
---|---|
消息创建 |
runStepDetailsToolCallsObject
工具调用的详细信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
工具调用 | 数组 | 涉及运行步骤的工具调用数组。 这可以与以下三种类型的工具之一相关联:code_interpreter 、retrieval 或 function 。 |
是的 | |
类型 | 字符串 | 始终为 tool_calls 。 |
是的 |
类型枚举:RunStepDetailsToolCallsObjectType
价值 | DESCRIPTION |
---|---|
工具调用 |
runStepDeltaStepDetailsToolCallsObject
工具调用的详细信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
工具调用 | 数组 | 涉及运行步骤的工具调用数组。 这可以与以下三种类型的工具之一相关联:code_interpreter 、file_search 或 function 。 |
否 | |
类型 | 字符串 | 始终为 tool_calls 。 |
是的 |
类型枚举:RunStepDeltaStepDetailsToolCallsObjectType
价值 | DESCRIPTION |
---|---|
工具调用 |
运行步骤详情工具调用代码对象
运行步骤所涉及的代码解释器工具调用的详细信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码解释器 | 对象 | 代码解释器工具调用定义。 | 是的 | |
└─ 输入 | 字符串 | 代码解释器工具调用的输入。 | 否 | |
├─ 输出 | 数组 | 代码解释器工具调用的输出。 代码解释器可以输出一个或多个项目,包括文本 (logs ) 或图像 (image )。 每个项目都由不同的对象类型表示。 |
否 | |
id | 字符串 | 工具调用的 ID。 | 是的 | |
类型 | 字符串 | 工具调用的类型。 这种类型的工具调用始终为 code_interpreter 。 |
是的 |
类型枚举:RunStepDetailsToolCallsCodeObjectType
价值 | DESCRIPTION |
---|---|
代码解释器 |
runStepDeltaStepDetailsToolCallsCodeObject
运行步骤所涉及的代码解释器工具调用的详细信息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码解释器 | 对象 | 代码解释器工具调用定义。 | 否 | |
└─ 输入 | 字符串 | 代码解释器工具调用的输入。 | 否 | |
└─ outputs | 数组 | 代码解释器工具调用的输出。 代码解释器可以输出一个或多个项目,包括文本 (logs ) 或图像 (image )。 每个项目都由不同的对象类型表示。 |
否 | |
id | 字符串 | 工具调用的 ID。 | 否 | |
索引 | 整数 | 工具调用数组中工具调用的索引。 | 是的 | |
类型 | 字符串 | 工具调用的类型。 这种类型的工具调用始终为 code_interpreter 。 |
是的 |
类型枚举:RunStepDeltaStepDetailsToolCallsCodeObjectType
价值 | DESCRIPTION |
---|---|
代码解释器 |
运行步骤细节工具调用代码输出日志对象
作为运行步骤一部分的代码解释器工具调用的文本输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
日志 | 字符串 | 代码解释器工具调用的文本输出。 | 是的 | |
类型 | 字符串 | 始终为 logs 。 |
是的 |
类型枚举:RunStepDetailsToolCallsCodeOutputLogsObjectType
价值 | DESCRIPTION |
---|---|
日志 |
runStepDeltaStepDetailsToolCallsCodeOutputLogsObject
作为运行步骤一部分的代码解释器工具调用的文本输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
索引 | 整数 | 输出数组中输出的索引。 | 是的 | |
日志 | 字符串 | 代码解释器工具调用的文本输出。 | 否 | |
类型 | 字符串 | 始终为 logs 。 |
是的 |
类型枚举:RunStepDeltaStepDetailsToolCallsCodeOutputLogsObjectType
价值 | DESCRIPTION |
---|---|
日志 |
runStepDetailsToolCallsCodeOutputImageObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
图像 | 对象 | 是的 | ||
└─ file_id | 字符串 | 图像的文件 ID。 | 否 | |
类型 | 字符串 | 始终为 image 。 |
是的 |
类型枚举:RunStepDetailsToolCallsCodeOutputImageObjectType
价值 | DESCRIPTION |
---|---|
图像 |
runStepDeltaStepDetailsToolCallsCodeOutputImageObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
图像 | 对象 | 否 | ||
└─ file_id | 字符串 | 图像的文件 ID。 | 否 | |
索引 | 整数 | 输出数组中输出的索引。 | 是的 | |
类型 | 字符串 | 始终为 image 。 |
是的 |
类型枚举:RunStepDeltaStepDetailsToolCallsCodeOutputImageObject
价值 | DESCRIPTION |
---|---|
图像 |
运行步骤详细信息工具调用文件搜索对象
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件搜索 | 对象 | 目前,这始终是一个空对象。 | 是的 | |
- 结果 | 数组 | 文件搜索的结果。 | 否 | |
id | 字符串 | 工具调用对话的 ID。 | 是的 | |
类型 | 字符串 | 工具调用的类型。 这种类型的工具调用始终为 file_search 。 |
是的 |
类型枚举:RunStepDetailsToolCallsFileSearchObjectType
价值 | DESCRIPTION |
---|---|
文件搜索 |
runStepDetailsToolCallsFileSearchResultObject
文件搜索的结果实例。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 数组 | 找到的结果的内容。 只有通过 include 查询参数请求时,才会包含该内容。 | 否 | |
file_id | 字符串 | 找到结果的文件的 ID。 | 是的 | |
文件名 | 字符串 | 找到结果的文件的名称。 | 是的 | |
分数 | 数字 | 结果的分数。 所有值都必须是介于 0 与 1 之间的浮点数。 | 是的 |
runStepDeltaStepDetailsToolCallsFileSearchObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文件搜索 | 对象 | 目前,这始终是一个空对象。 | 是的 | |
id | 字符串 | 工具调用对话的 ID。 | 否 | |
索引 | 整数 | 工具调用数组中工具调用的索引。 | 是的 | |
类型 | 字符串 | 工具调用的类型。 这种类型的工具调用始终为 retrieval 。 |
是的 |
类型枚举:RunStepDeltaStepDetailsToolCallsFileSearchObjectType
价值 | DESCRIPTION |
---|---|
文件搜索 |
runStepDetailsToolCallsFunctionObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 调用的函数的定义。 | 是的 | |
└─ arguments | 字符串 | 传递给函数的参数。 | 否 | |
└─ 名称 | 字符串 | 函数的名称。 | 否 | |
└─ 输出 | 字符串 | 函数的输出。 如果尚未提交输出,则为 null 。 |
否 | |
id | 字符串 | 工具调用对话的 ID。 | 是的 | |
类型 | 字符串 | 工具调用的类型。 这种类型的工具调用始终为 function 。 |
是的 |
类型枚举:RunStepDetailsToolCallsFunctionObjectType
价值 | DESCRIPTION |
---|---|
函数 |
runStepDeltaStepDetailsToolCallsFunctionObject
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
函数 | 对象 | 调用的函数的定义。 | 否 | |
└─ arguments | 字符串 | 传递给函数的参数。 | 否 | |
└─ 名称 | 字符串 | 函数的名称。 | 否 | |
└─ 输出 | 字符串 | 函数的输出。 如果尚未提交输出,则为 null 。 |
否 | |
id | 字符串 | 工具调用对话的 ID。 | 否 | |
索引 | 整数 | 工具调用数组中工具调用的索引。 | 是的 | |
类型 | 字符串 | 工具调用的类型。 这种类型的工具调用始终为 function 。 |
是的 |
类型枚举:RunStepDetailsToolCallsFunctionObjectType
价值 | DESCRIPTION |
---|---|
函数 |
vectorStoreExpirationAfter
矢量存储过期策略。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
定位标记 | 字符串 | 定位点时间戳,在此时间之后会应用过期策略。 支持的定位点:last_active_at 。 |
是的 | |
days | 整数 | 在定位点时间之后,矢量存储将过期的天数。 | 是的 |
定位点枚举:VectorStoreExpirationAfterAnchor
价值 | DESCRIPTION |
---|---|
最后活动时间 | 定位点时间戳,在此时间之后会应用过期策略。 |
vectorStoreObject
矢量存储是 file_search
工具可以使用已处理文件的集合。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
创建时间 | 整数 | 创建矢量存储时的 Unix 时间戳(以秒为单位)。 | 是的 | |
过期时间 | vectorStoreExpirationAfter | 矢量存储过期策略。 | 否 | |
过期时间 | 整数 | 矢量存储将过期时的 Unix 时间戳(以秒为单位)。 | 否 | |
文件数 | 对象 | 是的 | ||
~~ 已取消 | 整数 | 已取消的文件数。 | 否 | |
~~ 已完成 | 整数 | 已成功处理的文件数。 | 否 | |
~~ 失败 | 整数 | 未能处理的文件数。 | 否 | |
进行中 | 整数 | 当前正在处理的文件数。 | 否 | |
~~ 总计 | 整数 | 文件总数。 | 否 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
最后活动时间 | 整数 | 矢量存储上次活动时的 Unix 时间戳(以秒为单位)。 | 是的 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
是的 | |
姓名 | 字符串 | 矢量存储的名称。 | 是的 | |
对象 | 枚举 | 始终为 vector_store 的对象类型。可能的值: vector_store |
是的 | |
状态 | 字符串 | 矢量存储的状态,可以是 expired 、in_progress 或 completed 。 状态 completed 指示矢量存储可供使用。 |
是的 | |
usage_bytes | 整数 | 矢量存储区中文件使用的总字节数。 | 是的 |
状态枚举:VectorStoreObjectStatus
价值 | DESCRIPTION |
---|---|
expired | |
进行中 | |
已完成 |
createVectorStoreRequest(创建矢量存储请求)
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | autoChunkingStrategyRequestParam 或 staticChunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 仅当 file_ids 非空时适用。 |
否 | |
过期时间 | vectorStoreExpirationAfter | 矢量存储过期策略。 | 否 | |
file_ids | 数组 | 矢量存储应使用的文件 ID 列表。 适用于可以访问文件的 file_search 等工具。 |
否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
姓名 | 字符串 | 矢量存储的名称。 | 否 |
更新向量存储请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
过期时间 | vectorStoreExpirationAfter | 矢量存储过期策略。 | 否 | |
元数据 | 对象 | 按 16 个成组的可附加到对象的键值对。 这对以结构化格式存储对象相关的附加信息很有用。 键的最大长度为 64 个字符,值的最大长度为 512 个字符。 |
否 | |
姓名 | 字符串 | 矢量存储的名称。 | 否 |
listVectorStoresResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
deleteVectorStoreResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
已删除 | 布尔 | 是的 | ||
id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
对象枚举:DeleteVectorStoreResponseObject
价值 | DESCRIPTION |
---|---|
vector_store.deleted | 删除矢量存储响应对象状态 |
vectorStoreFileObject
附加到矢量存储的文件列表。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | autoChunkingStrategyRequestParam 或 staticChunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 仅当 file_ids 非空时适用。 |
否 | |
创建时间 | 整数 | 创建矢量存储文件时的 Unix 时间戳(以秒为单位)。 | 是的 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
最后错误 (last_error) | 对象 | 与此矢量存储文件关联的最后一个错误。 如果没有错误,则为 null 。 |
是的 | |
└─ 代码 | 字符串 | server_error 或 invalid_file 或 unsupported_file 之一。 |
否 | |
└─ 消息 | 字符串 | 可读的错误说明。 | 否 | |
对象 | 字符串 | 始终为 vector_store.file 的对象类型。 |
是的 | |
状态 | 字符串 | 矢量存储文件的状态,可以是 in_progress 、completed 、cancelled 或 failed 。 状态 completed 指示矢量存储文件可供使用。 |
是的 | |
usage_bytes | 整数 | 总矢量存储使用量(以字节为单位)。 请注意,这可能不同于原始文件大小。 | 是的 | |
vector_store_id | 字符串 | 附加文件的矢量存储的 ID。 | 是的 |
对象枚举:VectorStoreFileObjectType
价值 | DESCRIPTION |
---|---|
向量存储.文件 |
状态枚举:VectorStoreFileObjectStatus
价值 | DESCRIPTION |
---|---|
进行中 | |
已完成 | |
cancelled | |
“失败” |
otherChunkingStrategyResponseParam
当分块策略未知时,将返回此值。 通常,这是因为文件是在 API 中引入 chunking_strategy
概念之前编制索引的。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 字符串 | 始终为 other 。 |
是的 |
type Enum: OtherChunkingStrategyResponseParamType
价值 | DESCRIPTION |
---|---|
其他 |
静态分块策略响应参数
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
静态的 | 静态分块策略 | 是的 | ||
类型 | 字符串 | 始终为 static 。 |
是的 |
类型枚举:静态分块策略响应参数类型
价值 | DESCRIPTION |
---|---|
静态的 |
staticChunkingStrategy
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
chunk_overlap_tokens | 整数 | 区块之间重叠的标记数。 默认值是 400 。请注意,重叠不得超过 max_chunk_size_tokens 的一半。 |
是的 | |
max_chunk_size_tokens | 整数 | 每个区块中的最大标记数。 默认值是 800 。 最小值为 100 ,最大值为 4096 。 |
是的 |
自动分块策略请求参数
默认策略。 此策略目前使用 800
的 max_chunk_size_tokens
和 400
的 chunk_overlap_tokens
。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 始终为 auto 。可能的值: auto |
是的 |
静态分块策略请求参数
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
静态的 | 静态分块策略 | 是的 | ||
类型 | 枚举 | 始终为 static 。可能的值: static |
是的 |
分块策略请求参数
用于对文件进行分块的分块策略。 如果未设置,则将使用 auto
策略。
此组件可以是下列组件之一:
createVectorStoreFileRequest
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | chunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 |
否 | |
file_id | 字符串 | 矢量存储应使用的文件 ID。 适用于可以访问文件的 file_search 等工具。 |
是的 |
listVectorStoreFilesResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 是的 | ||
first_id | 字符串 | 是的 | ||
has_more | 布尔 | 是的 | ||
last_id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
deleteVectorStoreFileResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
已删除 | 布尔 | 是的 | ||
id | 字符串 | 是的 | ||
对象 | 字符串 | 是的 |
对象枚举:DeleteVectorStoreFileResponseObject
价值 | DESCRIPTION |
---|---|
向量存储.文件.已删除 |
vectorStoreFileBatchObject
附加到矢量存储的批量文件。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
创建时间 | 整数 | 创建矢量存储文件批处理时的 Unix 时间戳(以秒为单位)。 | 是的 | |
文件数 | 对象 | 是的 | ||
~~ 已取消 | 整数 | 已取消的文件数。 | 否 | |
~~ 已完成 | 整数 | 已处理的文件数。 | 否 | |
~~ 失败 | 整数 | 未能处理的文件数。 | 否 | |
进行中 | 整数 | 当前正在处理的文件数。 | 否 | |
~~ 总计 | 整数 | 文件总数。 | 否 | |
id | 字符串 | 可以在 API 终结点中引用的标识符。 | 是的 | |
对象 | 字符串 | 始终为 vector_store.file_batch 的对象类型。 |
是的 | |
状态 | 字符串 | 矢量存储文件批处理的状态,可以是 in_progress 、completed 、cancelled 或 failed 。 |
是的 | |
vector_store_id | 字符串 | 附加文件的矢量存储的 ID。 | 是的 |
对象枚举:VectorStoreFileBatchObjectType
价值 | DESCRIPTION |
---|---|
矢量存储.文件批处理 |
状态枚举:VectorStoreFileBatchObjectStatus
价值 | DESCRIPTION |
---|---|
进行中 | |
已完成 | |
cancelled | |
“失败” |
createVectorStoreFileBatchRequest
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
分块策略 | chunkingStrategyRequestParam | 用于对文件进行分块的分块策略。 如果未设置,则将使用 auto 策略。 |
否 | |
file_ids | 数组 | 矢量存储应使用的文件 ID 列表。 适用于可以访问文件的 file_search 等工具。 |
是的 |
assistantStreamEvent
表示流式传输运行时发出的事件。
服务器发送事件流中的每个事件都有一个 event
和 data
属性:
event: thread.created
data: {"id": "thread_123", "object": "thread", ...}
每当创建新对象、转换为新状态或部分流式传输(增量)时,就会发出事件。 例如,创建新运行时发出 thread.run.created
,运行完成后发出 thread.run.completed
等。 当助手选择在运行期间创建消息时,将发出 thread.message.created event
事件、thread.message.in_progress
事件、多个 thread.message.delta
事件以及最终的 thread.message.completed
事件。
随着时间的推移,我们可能会添加其他事件,因此我们建议在代码中妥善处理未知事件。
此组件可以是下列组件之一:
threadStreamEvent
此组件可以是下列组件之一:
thread.created(线程.创建)
创建新线程时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | threadObject | 表示包含消息的线程。 | 是的 | |
事件 | 字符串 | 是的 |
数据:threadObject
事件枚举:ThreadStreamEventEnum
价值 | DESCRIPTION |
---|---|
thread.created | 线程创建事件 |
runStreamEvent
此组件可以是下列组件之一:
thread.run.created
创建新运行时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventCreated
价值 | DESCRIPTION |
---|---|
thread.run.created |
thread.run.queued
当运行变为 queued
状态时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventQueued
价值 | DESCRIPTION |
---|---|
thread.run.queued |
线程运行中
当运行变为 in_progress
状态时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventInProgress
价值 | DESCRIPTION |
---|---|
线程.运行.进行中 |
线程.运行.需要操作
当运行变为 requires_action
状态时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventRequiresAction
价值 | DESCRIPTION |
---|---|
thread.run.requires_action |
线程运行已完成
当运行完成时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventCompleted
价值 | DESCRIPTION |
---|---|
线程运行已完成 |
线程运行失败
当运行失败时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventFailed
价值 | DESCRIPTION |
---|---|
线程运行失败 |
thread.run.cancelling
当运行变为 cancelling
状态时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventCancelling
价值 | DESCRIPTION |
---|---|
thread.run.cancelling |
线程运行已取消
当运行取消时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventCancelled
价值 | DESCRIPTION |
---|---|
线程运行已取消 |
线程运行已过期
当运行过期时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runObject | 表示在线程上运行的执行。 | 是的 | |
事件 | 字符串 | 是的 |
数据:runObject
事件枚举:RunStreamEventExpired
价值 | DESCRIPTION |
---|---|
线程运行已过期 |
runStepStreamEvent
此组件可以是下列组件之一:
thread.run.step.created
当创建运行步骤时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepObject | 表示运行执行过程中的一个步骤。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventCreated
价值 | DESCRIPTION |
---|---|
thread.run.step.created |
thread.run.step.in_progress
当运行步骤变为 in_progress
状态时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepObject | 表示运行执行过程中的一个步骤。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventInProgress
价值 | DESCRIPTION |
---|---|
thread.run.step.in_progress |
thread.run.step.delta
在流式传输部分运行步骤时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepDeltaObject | 表示运行步骤增量,例如,流式传输期间任何运行步骤字段的更改。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventDelta
价值 | DESCRIPTION |
---|---|
thread.run.step.delta |
线程运行步骤已完成
当运行步骤完成时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepObject | 表示运行执行过程中的一个步骤。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventCompleted
价值 | DESCRIPTION |
---|---|
thread.run.step.completed |
线程运行步骤失败
当运行步骤失败时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepObject | 表示运行执行过程中的一个步骤。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventFailed
价值 | DESCRIPTION |
---|---|
线程运行步骤失败 |
thread.run.step.cancelled
当运行步骤取消时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepObject | 表示运行执行过程中的一个步骤。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventCancelled
价值 | DESCRIPTION |
---|---|
线程运行步骤已取消 |
thread.run.step.expired
当运行步骤过期时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | runStepObject | 表示运行执行过程中的一个步骤。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:RunStepStreamEventExpired
价值 | DESCRIPTION |
---|---|
thread.run.step.expired |
messageStreamEvent
此组件可以是下列组件之一:
thread.message.created
当创建消息时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | messageObject | 表示线程中的消息。 | 是的 | |
事件 | 字符串 | 是的 |
事件枚举:MessageStreamEventCreated
价值 | DESCRIPTION |
---|---|
thread.message.created |
thread.message.in_progress
当消息变为 in_progress
状态时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | messageObject | 表示线程中的消息。 | 是的 | |
事件 | 字符串 | 是的 |
事件枚举:MessageStreamEventInProgress
价值 | DESCRIPTION |
---|---|
thread.message.in_progress |
thread.message.delta
当流式传输部分消息时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | messageDeltaObject | 表示消息增量,例如,流式传输期间任何消息字段的更改。 |
是的 | |
事件 | 字符串 | 是的 |
事件枚举:MessageStreamEventDelta
价值 | DESCRIPTION |
---|---|
thread.message.delta |
thread.message.completed
当消息完成时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | messageObject | 表示线程中的消息。 | 是的 | |
事件 | 字符串 | 是的 |
事件枚举:MessageStreamEventCompleted
价值 | DESCRIPTION |
---|---|
thread.message.completed |
thread.message.incomplete
当消息在完成前结束时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | messageObject | 表示线程中的消息。 | 是的 | |
事件 | 字符串 | 是的 |
事件枚举:MessageStreamEventIncomplete
价值 | DESCRIPTION |
---|---|
线程消息不完整 |
注释
此组件可以是下列组件之一:
单击
单击操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
button | 枚举 | 指示单击期间按下了哪个鼠标按钮。 left 、right 、wheel 、back 或 forward 中的一个。可能的值: left 、、right wheel 、back 、forward |
是的 | |
类型 | 枚举 | 指定事件类型。 对于单击操作,此属性始终设置为 click 。可能的值: click |
是的 | |
x | 整数 | 单击位置的 x 坐标。 |
是的 | |
y | 整数 | 发生单击的位置的 y 坐标。 |
是的 |
代码解释器文件输出
文件形式的代码解释器工具调用的输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
files | 数组 | 是的 | ||
类型 | 枚举 | 代码解释器文件输出的类型。 始终为 files 。可能的值: files |
是的 |
代码解释器文本输出
代码解释器工具调用的输出,即文本。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
日志 | 字符串 | 代码解释器工具调用的日志。 |
是的 | |
类型 | 枚举 | 代码解释器文本输出的类型。 始终为 logs 。可能的值: logs |
是的 |
CodeInterpreterTool
运行代码的工具。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
file_ids | 数组 | 要运行代码的文件 ID。 |
是的 | |
类型 | 枚举 | 代码解释器工具的类型。 始终为 code_interpreter 。可能的值: code_interpreter |
是的 |
代码解释器工具调用 (CodeInterpreterToolCall)
用于运行代码的工具调用。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | 字符串 | 要运行的代码。 |
是的 | |
id | 字符串 | 代码解释器工具调用的唯一 ID。 |
是的 | |
结果 | 数组 | 代码解释器工具调用的结果。 |
是的 | |
状态 | 枚举 | 代码解释器工具调用的状态。 可能的值: in_progress 、、 interpreting completed |
是的 | |
类型 | 枚举 | 代码解释器工具调用的类型。 始终为 code_interpreter_call 。可能的值: code_interpreter_call |
是的 |
代码解释器工具输出
此组件可以是下列组件之一:
比较过滤器
用于使用定义的比较操作来比较指定属性键与给定值的筛选器。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
关键值 | 字符串 | 要与值进行比较的键。 | 是的 | |
类型 | 枚举 | 指定比较运算符:eq 、、ne gt 、gte 、lt lte 。- eq :等于- ne :不等于- gt :大于- gte :大于或等于- lt :小于- lte :小于或等于可能的值: eq 、、ne 、gt gte 、lt 、lte |
是的 | |
价值 | 字符串或数字或布尔值 | 要与属性键进行比较的值;支持字符串、数字或布尔类型。 | 是的 |
复合过滤器
使用 and
或 or
. 合并多个筛选器。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
筛选器 | 数组 | 要组合的筛选器数组。 项可以是 ComparisonFilter 或 CompoundFilter 。 |
是的 | |
类型 | 枚举 | 操作类型:and 或 or 。可能的值: and or |
是的 |
ComputerAction
此组件可以是下列组件之一:
计算机屏幕截图图像
与计算机使用工具一起使用的计算机屏幕截图图像。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
file_id | 字符串 | 包含屏幕截图的上传文件的标识符。 | 否 | |
image_url | 字符串 | 屏幕截图图像的 URL。 | 否 | |
类型 | 枚举 | 指定事件类型。 对于计算机屏幕截图,此属性始终设置为 computer_screenshot 。可能的值: computer_screenshot |
是的 |
ComputerTool
控制虚拟计算机的工具。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
显示高度 | 数字 | 计算机显示的高度。 |
是的 | |
显示宽度 | 数字 | 计算机的显示宽度。 |
是的 | |
环境 | 枚举 | 要控制的计算机环境的类型。 可能的值: mac 、windows 、ubuntu 、browser |
是的 | |
类型 | 枚举 | 计算机使用工具的类型。 始终为 computer_use_preview 。可能的值: computer-use-preview |
是的 |
ComputerToolCall
对计算机使用工具的工具调用。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
操作 | ComputerAction | 是的 | ||
通话编号 | 字符串 | 用输出来响应工具调用时使用的标识符。 |
是的 | |
id | 字符串 | 计算机调用的唯一 ID。 | 是的 | |
待处理的安全检查 | 数组 | 计算机调用的挂起安全检查。 |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
是的 | |
类型 | 枚举 | 计算机调用的类型。 始终为 computer_call 。可能的值: computer_call |
是的 |
ComputerToolCallOutput
计算机工具调用的输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
认可的安全检查 | 数组 | 已由开发人员确认的 API 报告的安全检查。 |
否 | |
通话编号 | 字符串 | 生成输出的计算机工具调用的 ID。 |
是的 | |
id | 字符串 | 计算机工具调用输出的 ID。 |
否 | |
输出 | ComputerScreenshotImage | 与计算机使用工具一起使用的计算机屏幕截图图像。 |
是的 | |
状态 | 枚举 | 消息输入的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回输入项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 计算机工具调用结果的类型。 始终为 computer_call_output 。可能的值: computer_call_output |
是的 |
ComputerToolCallOutputResource
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
认可的安全检查 | 数组 | 已由开发人员确认的 API 报告的安全检查。 |
否 | |
通话编号 | 字符串 | 生成输出的计算机工具调用的 ID。 |
是的 | |
id | 字符串 | 计算机调用工具输出的唯一 ID。 |
是的 | |
输出 | ComputerScreenshotImage | 与计算机使用工具一起使用的计算机屏幕截图图像。 |
是的 | |
状态 | 枚举 | 消息输入的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回输入项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 计算机工具调用结果的类型。 始终为 computer_call_output 。可能的值: computer_call_output |
是的 |
ComputerToolCallSafetyCheck
计算机调用的挂起安全检查。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | 字符串 | 挂起的安全检查的类型。 | 是的 | |
id | 字符串 | 挂起的安全检查的 ID。 | 是的 | |
消息 | 字符串 | 有关挂起的安全检查的详细信息。 | 是的 |
内容
多模态输入和输出内容。
此组件可以是下列组件之一:
坐标
x/y 坐标对,例如 { x: 100, y: 200 }
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
x | 整数 | X 坐标。 |
是的 | |
y | 整数 | Y 坐标。 |
是的 |
CreateModelResponseProperties
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 元数据 | 按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符的字符串。 |
否 | |
模型 | 字符串 | 用于生成响应的模型。 | 否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助 OpenAI 监视和检测滥用行为。 . |
否 |
createResponse
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
include | 数组 | {“$ref”: “#/components/schemas/includable/description”} | 否 | |
输入 | 字符串或数组 | 用于生成响应的模型的文本、图像或文件输入。 | 是的 | |
instructions | 字符串 | 将系统(或开发人员)消息作为模型上下文中的第一项插入。 与之前响应一起使用 previous_response_id 时,不会将上一个响应中的说明转交给下一个响应。 这样就可以轻松地在新响应中交换系统(或开发人员)消息。 |
否 | |
最大输出标记数量 (max_output_tokens) | 整数 | 可为响应生成的令牌数上限,包括可见输出令牌和推理令牌。 |
否 | |
并行工具调用 | 布尔 | 是否允许模型并行运行工具调用。 |
否 | True |
previous_response_id | 字符串 | 对模型的上一个响应的唯一 ID。 使用此方法可创建多轮次对话。 | 否 | |
推理 | 推理 | 仅适用于 O 系列模型 推理模型的配置选项。 |
否 | |
存储 | 布尔 | 是否存储生成的模型响应,以便以后通过 API 进行检索。 |
否 | True |
数据流 | 布尔 | 如果设置为 true,模型响应数据将通过服务器发送的事件实时生成并流式传送到客户端。 | 否 | 假 |
文本消息 | 对象 | 来自模型的文本响应的配置选项。 可以是纯文本或结构化 JSON 数据。 了解详细信息: - 文本输入和输出 - 结构化输出 |
否 | |
└─ 格式 | TextResponseFormatConfiguration | 一个对象,指定模型必须输出的格式。 配置 { "type": "json_schema" } 启用结构化输出,这可确保模型与提供的 JSON 架构匹配。 默认格式 { "type": "text" } 没有其他选项。不建议用于 gpt-4o 和较新的模型: { "type": "json_object" } 设置为启用较旧的 JSON 模式,这可确保模型生成的消息是有效的 JSON。 对于支持它的模型,首选使用 json_schema 。 |
否 | |
工具选择 | ToolChoiceOptions 或 ToolChoiceTypes 或 ToolChoiceFunction | 模型在生成响应时应如何选择要使用的工具(或工具)。 请参阅参数 tools ,了解如何指定模型可以调用的工具。 |
否 | |
工具 | 数组 | 生成响应时,模型可能会调用的工具数组。 可以通过设置 tool_choice 参数来指定要使用的工具。可以提供模型的两类工具包括: - 内置工具 |
否 | |
truncation | 枚举 | 要用于模型响应的截断策略。 - auto :如果此响应的上下文和以前的上下文超过模型的上下文窗口大小,则模型将截断 响应以适应上下文窗口,方法是在对话中间删除输入项。 - disabled (默认值):如果模型响应将超过模型的上下文窗口大小,则请求将失败并出现 400 错误。可能的值: auto disabled |
否 |
DoubleClick
双击操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 指定事件类型。 对于双击操作,此属性始终设置为 double_click 。可能的值: double_click |
是的 | |
x | 整数 | 双击发生时的 x 坐标。 |
是的 | |
y | 整数 | 发生双击的 y 坐标。 |
是的 |
Drag
拖动操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
路径 | 数组 | 表示拖动作路径的坐标数组。 坐标将显示为对象数组,例如[{ x: 100, y: 200 }, { x: 200, y: 300 }] |
是的 | |
类型 | 枚举 | 指定事件类型。 对于拖动作,此属性始终设置为 drag 。可能的值: drag |
是的 |
EasyInputMessage
模型的消息输入,具有指示以下层次结构的说明的角色。 使用 developer
或 system
角色提供的说明优先于角色 user
提供的说明。 假定具有 assistant
角色的消息是由模型在以前的交互中生成的。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | string 或 InputMessageContentList | 对模型的文本、图像或音频输入,用于生成响应。 还可以包含以前的助手回复。 |
是的 | |
角色 | 枚举 | 消息输入的角色。 user 、assistant 、system 或 developer 之一。可能的值: user 、assistant 、system 、developer |
是的 | |
类型 | 枚举 | 消息输入的类型。 始终为 message 。可能的值: message |
否 |
FileCitation
文件的引文。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
file_id | 字符串 | 文件的 ID。 |
是的 | |
索引 | 整数 | 文件列表中的文件的索引。 |
是的 | |
类型 | 枚举 | 文件引文的类型。 始终为 file_citation 。可能的值: file_citation |
是的 |
FilePath
文件路径。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
file_id | 字符串 | 文件的 ID。 |
是的 | |
索引 | 整数 | 文件列表中的文件的索引。 |
是的 | |
类型 | 枚举 | 文件路径的类型。 始终为 file_path 。可能的值: file_path |
是的 |
FileSearchRanker
用于文件搜索的排序算法。 如果未指定,将使用 auto
排名器。
资产 | 价值 |
---|---|
说明 | 用于文件搜索的排序算法。 如果未指定,将使用 auto 排名器。 |
类型 | 字符串 |
价值观 | auto default_2024_08_21 |
文件搜索工具
一个工具,用于搜索已上传文件中的相关内容。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
筛选器 | ComparisonFilter 或 CompoundFilter | 基于文件属性应用的筛选器。 | 否 | |
max_num_results(最大结果数) | 整数 | 要返回的最大结果数。 此数字应介于 1 和 50 之间(含)。 |
否 | |
排名选项 | 对象 | 用于搜索的排名选项。 | 否 | |
└─ ranker | 枚举 | 用于文件搜索的排序算法。 可能的值: auto default-2024-11-15 |
否 | |
分数阈值 | 数字 | 文件搜索的分数阈值,介于 0 和 1 之间。 接近 1 的数字将尝试仅返回最相关的结果,但可能会返回更少的结果。 |
否 | 0 |
类型 | 枚举 | 文件搜索工具的类型。 始终为 file_search 。可能的值: file_search |
是的 | |
vector_store_ids | 数组 | 要搜索的矢量存储的 ID。 |
是的 |
文件搜索工具调用
文件搜索工具调用的结果。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
id | 字符串 | 文件搜索工具调用的唯一 ID。 |
是的 | |
查询 | 数组 | 用于搜索文件的查询。 |
是的 | |
结果 | 数组 | 文件搜索工具调用的结果。 |
否 | |
状态 | 枚举 | 文件搜索工具调用的状态。 in_progress 、searching 、incomplete 或 failed 之一。可能的值: in_progress 、、searching completed 、incomplete 、failed |
是的 | |
类型 | 枚举 | 文件搜索工具调用的类型。 始终为 file_search_call 。可能的值: file_search_call |
是的 |
FunctionTool
在自己的代码中定义模型可以选择调用的函数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 函数的说明。 该模型用于判断是否调用函数。 |
否 | |
姓名 | 字符串 | 要调用的函数名称。 |
是的 | |
参数 | 对象 | 描述函数参数的 JSON 架构对象。 |
是的 | |
strict | 布尔 | 是否强制实施严格的参数验证。 默认 true 。 |
是的 | |
类型 | 枚举 | 函数工具的类型。 始终为 function 。可能的值: function |
是的 |
FunctionToolCall
用于运行函数的工具调用。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
论点 | 字符串 | 要传递给函数的参数的 JSON 字符串。 |
是的 | |
通话编号 | 字符串 | 模型生成的函数工具调用的唯一 ID。 |
是的 | |
id | 字符串 | 函数工具调用的唯一 ID。 |
是的 | |
姓名 | 字符串 | 要运行的函数的名称。 |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 函数工具调用的类型。 始终为 function_call 。可能的值: function_call |
是的 |
FunctionToolCallOutput
函数工具调用的输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
通话编号 | 字符串 | 模型生成的函数工具调用的唯一 ID。 |
是的 | |
id | 字符串 | 函数工具调用输出的唯一 ID。 通过 API 返回此项时进行填充。 |
否 | |
输出 | 字符串 | 函数工具调用输出的 JSON 字符串。 |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 函数工具调用输出的类型。 始终为 function_call_output 。可能的值: function_call_output |
是的 |
函数工具调用输出资源
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
通话编号 | 字符串 | 模型生成的函数工具调用的唯一 ID。 |
是的 | |
id | 字符串 | 函数调用工具输出的唯一 ID。 |
是的 | |
输出 | 字符串 | 函数工具调用输出的 JSON 字符串。 |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 函数工具调用输出的类型。 始终为 function_call_output 。可能的值: function_call_output |
是的 |
includable
指定要包含在模型响应中的其他输出数据。 当前支持的值包括:
file_search_call.results
:包括通过调用文件搜索工具而获得的搜索结果。message.input_image.image_url
:包括输入消息中的图像 URL。computer_call_output.output.image_url
:包括计算机调用输出中的图像 URL。
资产 | 价值 |
---|---|
说明 | 指定要包含在模型响应中的其他输出数据。 当前支持的值包括: - file_search_call.results :包括文件搜索工具调用的搜索结果。- message.input_image.image_url :包括输入消息中的图像链接。- computer_call_output.output.image_url :包括计算机调用输出中的图像 URL。 |
类型 | 字符串 |
价值观 | file_search_call.results message.input_image.image_url computer_call_output.output.image_url |
音频输入
模型的音频输入。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 字符串 | Base64 编码的音频数据。 |
是的 | |
格式 | 枚举 | 音频数据的格式。 当前支持的格式为 mp3 和 wav 。可能的值: mp3 wav |
是的 | |
类型 | 枚举 | 输入项的类型。 始终为 input_audio 。可能的值: input_audio |
是的 |
InputContent
此组件可以是下列组件之一:
InputFile
模型的文件输入。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
file_data | 字符串 | 要发送到模型的文件的内容。 |
否 | |
file_id | 字符串 | 要发送到模型的文件的 ID。 |
否 | |
文件名 | 字符串 | 要发送到模型的文件的名称。 |
否 | |
类型 | 枚举 | 输入项的类型。 始终为 input_file 。可能的值: input_file |
是的 |
输入图像
输入到模型中的图像
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
详细信息 | 枚举 | 要发送到模型的图像的细节级别。 high 、low 或 auto 之一。 默认为 auto 。可能的值: high 、、 low auto |
是的 | |
file_id | 字符串 | 要发送到模型的文件的 ID。 |
否 | |
image_url | 字符串 | 图像的 URL 要发送到模型。 数据 URL 中的完全限定 URL 或 base64 编码图像。 |
否 | |
类型 | 枚举 | 输入项的类型。 始终为 input_image 。可能的值: input_image |
是的 |
输入项
此组件可以是下列组件之一:
InputMessage
模型的消息输入,具有指示以下层次结构的说明的角色。 使用 developer
或 system
角色提供的说明优先于角色 user
提供的说明。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 输入消息内容列表 | 包含一个或多个输入项的列表,这些输入项是提供给模型的,其中包含不同的内容。 类型。 |
是的 | |
角色 | 枚举 | 消息输入的角色。 user 、system 或 developer 之一。可能的值: user 、、 system developer |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 消息输入的类型。 始终将其设置为 message 。可能的值: message |
否 |
输入消息内容列表 (InputMessageContentList)
模型中包含一个或多个输入项的列表,其中包含不同的内容类型。
未为此组件定义任何属性。
InputMessageResource
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 输入消息内容列表 | 包含一个或多个输入项的列表,这些输入项是提供给模型的,其中包含不同的内容。 类型。 |
是的 | |
id | 字符串 | 消息输入的唯一 ID。 |
是的 | |
角色 | 枚举 | 消息输入的角色。 user 、system 或 developer 之一。可能的值: user 、、 system developer |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 消息输入的类型。 始终将其设置为 message 。可能的值: message |
否 |
InputText
模型的文本输入。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文本消息 | 字符串 | 模型的文本输入。 |
是的 | |
类型 | 枚举 | 输入项的类型。 始终为 input_text 。可能的值: input_text |
是的 |
Item
用于生成响应的内容项。
此组件可以是下列组件之一:
- InputMessage
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutput
- FunctionToolCall
- FunctionToolCallOutput
- ReasoningItem
ItemReference
要引用的项的内部标识符。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
id | 字符串 | 要引用的项的 ID。 |
是的 | |
类型 | 枚举 | 要引用的项的类型。 始终为 item_reference 。可能的值: item_reference |
是的 |
ItemResource
用于生成响应的内容项。
此组件可以是下列组件之一:
- InputMessageResource
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutputResource
- FunctionToolCall
- FunctionToolCallOutputResource
KeyPress
模型要执行的按键集合。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
钥匙 | 数组 | 模型请求按下的键的组合。 这是一个字符串数组,每个字符串表示一个键。 |
是的 | |
类型 | 枚举 | 指定事件类型。 对于按键操作,此属性始终设置为 keypress 。可能的值: keypress |
是的 |
元数据
按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。
键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符的字符串。
未为此组件定义任何属性。
模型响应属性
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
元数据 | 元数据 | 按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符的字符串。 |
否 | |
模型 | 字符串 | 用于生成响应的模型。 | 否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
否 | 1 |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
否 | 1 |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助 OpenAI 监视和检测滥用行为。 . |
否 |
移动
鼠标移动操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 指定事件类型。 对于移动动作,此属性始终设置为 move 。可能的值: move |
是的 | |
x | 整数 | 要移动到的 X 坐标。 |
是的 | |
y | 整数 | 要移动到的 Y 坐标。 |
是的 |
音频输出
模型的音频输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 字符串 | 来自模型的 Base64 编码音频数据。 |
是的 | |
脚本 | 字符串 | 来自模型的音频数据转录。 |
是的 | |
类型 | 枚举 | 输出音频的类型。 始终为 output_audio 。可能的值: output_audio |
是的 |
输出内容
此组件可以是下列组件之一:
输出项
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
操作 | ComputerAction | 是的 | ||
论点 | 字符串 | 要传递给函数的参数的 JSON 字符串。 |
是的 | |
通话编号 | 字符串 | 用输出来响应工具调用时使用的标识符。 |
是的 | |
内容 | 数组 | 推理文本内容。 |
是的 | |
id | 字符串 | 推理内容的唯一标识符。 |
是的 | |
姓名 | 字符串 | 要运行的函数的名称。 |
是的 | |
待处理的安全检查 | 数组 | 计算机调用的挂起安全检查。 |
是的 | |
查询 | 数组 | 用于搜索文件的查询。 |
是的 | |
结果 | 数组 | 文件搜索工具调用的结果。 |
否 | |
角色 | 枚举 | 输出消息的作用。 始终为 assistant 。可能的值: assistant |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
是的 | |
类型 | 枚举 | 对象的类型。 始终为 reasoning 。可能的值: reasoning |
是的 |
输出消息
模型的输出消息。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 数组 | 输出消息的内容。 |
是的 | |
id | 字符串 | 输出消息的唯一 ID。 |
是的 | |
角色 | 枚举 | 输出消息的作用。 始终为 assistant 。可能的值: assistant |
是的 | |
状态 | 枚举 | 消息输入的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回输入项时填充。可能的值: in_progress 、、 completed incomplete |
是的 | |
类型 | 枚举 | 输出消息的类型。 始终为 message 。可能的值: message |
是的 |
输出文本
模型的文本输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
注释 | 数组 | 文本输出的注释。 |
是的 | |
文本消息 | 字符串 | 模型的文本输出。 |
是的 | |
类型 | 枚举 | 输出文本的类型。 始终为 output_text 。可能的值: output_text |
是的 |
实时会话创建请求
实时会话对象配置。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
输入音频格式 | 枚举 | 输入音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。对于 pcm16 ,输入音频必须是采样率为 24kHz、单声道(mono)、小端字节顺序的 16 位 PCM。可能的值: pcm16 、、 g711_ulaw g711_alaw |
否 | |
输入音频降噪 | 对象 | 输入音频降噪的配置。 可以将其设置为 null 以关闭功能。降噪会筛选添加到输入音频缓冲区的音频,然后再将其发送到 VAD 和模型。 筛选音频可以通过改进输入音频的感知来提高 VAD 和轮次检测准确性(减少误报)和模型性能。 |
否 | |
└─ 类型 | 枚举 | 降噪类型。 near_field 用于近距离麦克风(如耳机), far_field 适用于远场麦克风,例如笔记本电脑或会议室麦克风。可能的值: near_field far_field |
否 | |
输入音频转录 | 对象 | 输入音频转录的配置,默认是关闭状态,可以设置为null 在开启后关闭。 输入音频转录不是模型本身的功能,因为模型可以直接处理音频。 听录通过听录终结点异步运行,应被视为输入音频内容的参考,而不是模型听到的精确内容。 客户端可以选择设置语言和转录提示,它们为转录服务提供额外的指导。 |
否 | |
└─ 语言 | 字符串 | 输入音频的语言。 以 ISO-639-1(例如 en )格式提供输入语言将提高准确性并减少延迟。 |
否 | |
└─ 模型 | 字符串 | 用于转录的模型,当前的选项有gpt-4o-transcribe 、gpt-4o-mini-transcribe 、和whisper-1 。 |
否 | |
└─ 提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 对于 whisper-1 ,提示是关键字列表。对于 gpt-4o-transcribe 模型,提示是一个自由文本字符串,例如“预期与技术相关的字词”。 |
否 | |
instructions | 字符串 | 附加到模型调用前的默认系统指令(即系统消息)。 此字段允许客户端指导模型处理所需的响应。 可以指示模型响应内容和格式(例如“非常简洁”、“行为友好”、“下面是良好响应的示例”)和音频行为(例如“快速说话”、“将情感注入语音”、“经常笑”)。 这些说明不保证遵循模型,但它们为模型提供有关所需行为的指南。 请注意,如果未设置此字段,服务器将设置默认说明,并在会话开始时的 session.created 事件中可见。 |
否 | |
最大响应输出标记数 | 整数或字符串 | 单个助手响应(包括工具调用)的最大输出令牌数。 提供介于 1 和 4096 之间的整数来限制输出令牌,或者 inf 提供给定模型的最大可用令牌。 默认为 inf 。 |
否 | |
方式 | 模型可以响应的一组模态。 若要禁用音频,请将此项设置为 [“text”]。 |
否 | ||
模型 | 字符串 | 用于此会话的部署的名称。 |
否 | |
输出音频格式 | 枚举 | 输出音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。对于 pcm16 ,输出音频的采样速率为 24kHz。可能的值: pcm16 、、 g711_ulaw g711_alaw |
否 | |
温度 | 数字 | 模型的采样温度限制为 [0.6, 1.2]。 对于音频模型,强烈建议将温度为 0.8,以获得最佳性能。 |
否 | 0.8 |
工具选择 | 字符串 | 模型如何选择工具。 选项为 auto 、 none 或 required 指定函数。 |
否 | 汽车 |
工具 | 数组 | 可用于模型的工具(函数)。 | 否 | |
turn_detection | 对象 | 用于轮次检测、以太网服务器 VAD 或语义 VAD 的配置。 这可以设置为 null 关闭,在这种情况下,客户端必须手动触发模型响应。服务器 VAD 表示模型将基于音频音量检测语音的开始和结束,并在用户语音结束时做出响应。 语义 VAD 更高级,使用轮次检测模型(与 VAD 结合使用)以语义方式估计用户是否已完成说话,然后根据此概率动态设置超时。 例如,如果用户的语音以 uhhm 结尾,模型将判定轮次结束的概率较低,并等待更长时间,以便用户继续说话。 这对于更自然的对话非常有用,但延迟可能更高。 |
否 | |
└─ 创建响应 | 布尔 | 是否在发生 VAD 停止事件时自动生成响应。 |
否 | True |
└─ eagerness | 枚举 | 仅用于 semantic_vad 模式。 模型做出响应的积极性。 low 将等待更长的时间让用户继续说话,而 high 会更快地响应。 auto 是默认值,等效于 medium 。可能的值: low 、medium 、high 、auto |
否 | |
└─ interrupt_response | 布尔 | 当 VAD 启动事件发生时,是否自动中断输出到默认会话(例如 conversation 的 auto )的任何进行中的响应。 |
否 | True |
└─ prefix_padding_ms | 整数 | 仅用于 server_vad 模式。 VAD 检测到语音之前要包括的音频量(以毫秒为单位)。 默认为 300 毫秒。 |
否 | |
silence_duration_ms(静音时长毫秒) | 整数 | 仅用于 server_vad 模式。 用于检测语音停止的沉默持续时间(以毫秒为单位)。 默认值为 500 毫秒。 使用较短的值,模型将更快地响应,但可能会在用户短暂暂停时突然打断。 |
否 | |
~~ 阈值 | 数字 | 仅用于 server_vad 模式。 VAD(0.0 到 1.0)的激活阈值,默认为 0.5。 更高的阈值需要更响亮的音频来激活模型,因此在干扰环境中性能可能更好。 |
否 | |
└─ 类型 | 枚举 | 轮次检测的类型。 可能的值: server_vad semantic_vad |
否 | |
voice | VoiceIdsShared | 否 |
RealtimeSessionCreateResponse
具有临时密钥的新实时会话配置。 密钥的默认 TTL 为 1 分钟。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
客户端密钥 | 对象 | API 返回的临时密钥。 | 是的 | |
过期时间 | 整数 | 令牌过期时的时间戳。 目前,所有令牌在一分钟后过期。 |
否 | |
└─ 值 | 字符串 | 在客户端环境中可用的临时密钥,用于对与实时 API 的连接进行身份验证。 应在客户端环境中使用此令牌,而不是使用仅限服务器端的标准API令牌。 |
否 | |
输入音频格式 | 字符串 | 输入音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。 |
否 | |
输入音频转录 | 对象 | 输入音频转录的配置,默认是关闭状态,可以设置为null 在开启后关闭。 输入音频转录不是模型本身的功能,因为模型可以直接处理音频。 听录通过 Whisper 异步运行,应被视为粗略的参考,而不是模型理解的表示形式。 |
否 | |
└─ 模型 | 字符串 | 用于转录的模型 whisper-1 是目前唯一受支持的模型。 |
否 | |
instructions | 字符串 | 附加到模型调用前的默认系统指令(即系统消息)。 此字段允许客户端指导模型处理所需的响应。 可以针对响应内容和格式(例如“非常简洁”、“行为友好”、“下面是良好响应的示例”)以及音频行为(例如“快速说话”、“将情感注入语音”、“经常笑”)进行指示。 这些说明不保证遵循模型,但它们为模型提供有关所需行为的指南。 请注意,如果未设置此字段,服务器将设置默认说明,并在会话开始时的 session.created 事件中可见。 |
否 | |
最大响应输出标记数 | 整数或字符串 | 单个助手响应(包括工具调用)的最大输出令牌数。 提供介于 1 和 4096 之间的整数来限制输出令牌,或者 inf 提供给定模型的最大可用令牌。 默认为 inf 。 |
否 | |
方式 | 模型可以响应的一组模态。 若要禁用音频,请将此项设置为 [“text”]。 |
否 | ||
输出音频格式 | 字符串 | 输出音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。 |
否 | |
温度 | 数字 | 模型的采样温度限制为 [0.6, 1.2]。 默认值为 0.8。 |
否 | |
工具选择 | 字符串 | 模型如何选择工具。 选项为 auto 、 none 或 required 指定函数。 |
否 | |
工具 | 数组 | 可用于模型的工具(函数)。 | 否 | |
turn_detection | 对象 | 轮次检测的配置。 可以设置为 null 来关闭。 服务器 VAD 表示模型将基于音频音量检测语音的开始和结束,并在用户语音结束时做出响应。 |
否 | |
└─ prefix_padding_ms | 整数 | VAD 检测到语音之前要包括的音频量(以毫秒为单位)。 默认为 300 毫秒。 |
否 | |
silence_duration_ms(静音时长毫秒) | 整数 | 用于检测语音停止的沉默持续时间(以毫秒为单位)。 默认值为 500 毫秒。 使用较短的值,模型将更快地响应,但可能会在用户短暂暂停时突然打断。 |
否 | |
~~ 阈值 | 数字 | VAD(0.0 到 1.0)的激活阈值,默认为 0.5。 更高的阈值需要更响亮的音频来激活模型,因此在干扰环境中性能可能更好。 |
否 | |
└─ 类型 | 字符串 | 轮次检测的类型,目前仅支持 server_vad 。 |
否 | |
voice | VoiceIdsShared | 否 |
实时转录会话创建请求 (RealtimeTranscriptionSessionCreateRequest)
实时听录会话对象配置。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
include | 数组 | 要包含在听录中的一组项。 当前可用的项包括: - item.input_audio_transcription.logprobs |
否 | |
输入音频格式 | 枚举 | 输入音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。对于 pcm16 ,输入音频必须是采样率为 24kHz、单声道(mono)、小端字节顺序的 16 位 PCM。可能的值: pcm16 、、 g711_ulaw g711_alaw |
否 | |
输入音频降噪 | 对象 | 输入音频降噪的配置。 可以将其设置为 null 以关闭功能。降噪会筛选添加到输入音频缓冲区的音频,然后再将其发送到 VAD 和模型。 筛选音频可以通过改进输入音频的感知来提高 VAD 和轮次检测准确性(减少误报)和模型性能。 |
否 | |
└─ 类型 | 枚举 | 降噪类型。 near_field 用于近距离麦克风(如耳机), far_field 适用于远场麦克风,例如笔记本电脑或会议室麦克风。可能的值: near_field far_field |
否 | |
输入音频转录 | 对象 | 输入音频转录的配置。 客户端可以选择设置语言和转录提示,它们为转录服务提供额外的指导。 |
否 | |
└─ 语言 | 字符串 | 输入音频的语言。 以 ISO-639-1(例如 en )格式提供输入语言将提高准确性并减少延迟。 |
否 | |
└─ 模型 | 枚举 | 用于转录的模型,当前的选项有gpt-4o-transcribe 、gpt-4o-mini-transcribe 、和whisper-1 。可能的值: gpt-4o-transcribe 、、 gpt-4o-mini-transcribe whisper-1 |
否 | |
└─ 提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 对于 whisper-1 ,提示是关键字列表。对于 gpt-4o-transcribe 模型,提示是一个自由文本字符串,例如“预期与技术相关的字词”。 |
否 | |
方式 | 模型可以响应的一组模态。 若要禁用音频,请将此项设置为 [“text”]。 |
否 | ||
turn_detection | 对象 | 用于轮次检测、以太网服务器 VAD 或语义 VAD 的配置。 这可以设置为 null 关闭,在这种情况下,客户端必须手动触发模型响应。服务器 VAD 表示模型将基于音频音量检测语音的开始和结束,并在用户语音结束时做出响应。 语义 VAD 更高级,使用轮次检测模型(与 VAD 结合使用)以语义方式估计用户是否已完成说话,然后根据此概率动态设置超时。 例如,如果用户的语音以 uhhm 结尾,模型将判定轮次结束的概率较低,并等待更长时间,以便用户继续说话。 这对于更自然的对话非常有用,但延迟可能更高。 |
否 | |
└─ 创建响应 | 布尔 | 是否在发生 VAD 停止事件时自动生成响应。 不适用于听录会话。 |
否 | True |
└─ eagerness | 枚举 | 仅用于 semantic_vad 模式。 模型做出响应的积极性。 low 将等待更长的时间让用户继续说话,而 high 会更快地响应。 auto 是默认值,等效于 medium 。可能的值: low 、medium 、high 、auto |
否 | |
└─ interrupt_response | 布尔 | 当 VAD 启动事件发生时,是否自动中断输出到默认会话(例如 conversation 的 auto )的任何进行中的响应。 不适用于听录会话。 |
否 | True |
└─ prefix_padding_ms | 整数 | 仅用于 server_vad 模式。 VAD 检测到语音之前要包括的音频量(以毫秒为单位)。 默认为 300 毫秒。 |
否 | |
silence_duration_ms(静音时长毫秒) | 整数 | 仅用于 server_vad 模式。 用于检测语音停止的沉默持续时间(以毫秒为单位)。 默认值为 500 毫秒。 使用较短的值,模型将更快地响应,但可能会在用户短暂暂停时突然打断。 |
否 | |
~~ 阈值 | 数字 | 仅用于 server_vad 模式。 VAD(0.0 到 1.0)的激活阈值,默认为 0.5。 更高的阈值需要更响亮的音频来激活模型,因此在干扰环境中性能可能更好。 |
否 | |
└─ 类型 | 枚举 | 轮次检测的类型。 可能的值: server_vad semantic_vad |
否 |
RealtimeTranscriptionSessionCreateResponse
新的实时听录会话配置。
通过 REST API 在服务器上创建会话时,会话对象还包含临时密钥。 密钥的默认 TTL 为 1 分钟。 当通过 WebSocket API 更新会话时,此属性不存在。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
客户端密钥 | 对象 | API 返回的临时密钥。 仅当通过 REST API 在服务器上创建会话时才存在。 |
是的 | |
过期时间 | 整数 | 令牌过期时的时间戳。 目前,所有令牌在一分钟后过期。 |
否 | |
└─ 值 | 字符串 | 在客户端环境中可用的临时密钥,用于对与实时 API 的连接进行身份验证。 应在客户端环境中使用此令牌,而不是使用仅限服务器端的标准API令牌。 |
否 | |
输入音频格式 | 字符串 | 输入音频的格式。 选项有 pcm16 、g711_ulaw 或 g711_alaw 。 |
否 | |
输入音频转录 | 对象 | 转录模型的配置。 |
否 | |
└─ 语言 | 字符串 | 输入音频的语言。 以 ISO-639-1(例如 en )格式提供输入语言将提高准确性并减少延迟。 |
否 | |
└─ 模型 | 枚举 | 要用于听录的模型。 可以是 gpt-4o-transcribe 、gpt-4o-mini-transcribe 或 whisper-1 。可能的值: gpt-4o-transcribe 、、 gpt-4o-mini-transcribe whisper-1 |
否 | |
└─ 提示 | 字符串 | 用于指导模型风格或继续之前的音频片段的可选文本。 提示应与音频语言匹配。 |
否 | |
方式 | 模型可以响应的一组模态。 若要禁用音频,请将此项设置为 [“text”]。 |
否 | ||
turn_detection | 对象 | 轮次检测的配置。 可以设置为 null 来关闭。 服务器 VAD 表示模型将基于音频音量检测语音的开始和结束,并在用户语音结束时做出响应。 |
否 | |
└─ prefix_padding_ms | 整数 | VAD 检测到语音之前要包括的音频量(以毫秒为单位)。 默认为 300 毫秒。 |
否 | |
silence_duration_ms(静音时长毫秒) | 整数 | 用于检测语音停止的沉默持续时间(以毫秒为单位)。 默认值为 500 毫秒。 使用较短的值,模型将更快地响应,但可能会在用户短暂暂停时突然打断。 |
否 | |
~~ 阈值 | 数字 | VAD(0.0 到 1.0)的激活阈值,默认为 0.5。 更高的阈值需要更响亮的音频来激活模型,因此在干扰环境中性能可能更好。 |
否 | |
└─ 类型 | 字符串 | 轮次检测的类型,目前仅支持 server_vad 。 |
否 |
推理
仅适用于 O 系列模型
推理模型的配置选项。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
工作量 | ReasoningEffort | 仅适用于 O 系列模型 限制推理模型的推理力度。 当前支持的值为 low 、medium 和 high 。 减少推理工作量可以加快回复速度,减少回复中用于推理的标记。 |
是的 | 中 |
摘要 | 枚举 | 仅适用于 O 系列模型 模型执行的推理摘要。 这对于调试和了解模型的推理过程非常有用。 concise 或 detailed 中的一项。可能的值: concise detailed |
否 |
推理项
描述推理模型在生成响应时使用的想法链。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容 | 数组 | 推理文本内容。 |
是的 | |
id | 字符串 | 推理内容的唯一标识符。 |
是的 | |
状态 | 枚举 | 项目的状态。 in_progress 、completed 或 incomplete 之一。 通过 API 返回项时填充。可能的值: in_progress 、、 completed incomplete |
否 | |
类型 | 枚举 | 对象的类型。 始终为 reasoning 。可能的值: reasoning |
是的 |
拒绝
模型的拒绝。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
拒绝 | 字符串 | 模型的拒绝的解释。 |
是的 | |
类型 | 枚举 | 拒绝的类型。 始终为 refusal 。可能的值: refusal |
是的 |
响应
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
创建时间 | 数字 | 创建此响应时的 Unix 时间戳(以秒为单位)。 |
是的 | |
错误 | ResponseError | 当模型无法生成响应时返回的错误对象。 |
是的 | |
id | 字符串 | 此响应的唯一标识符。 |
是的 | |
不完整的细节 | 对象 | 有关响应不完整的原因的详细信息。 |
是的 | |
~~ 原因 | 枚举 | 响应不够详尽的原因。 可能的值: max_output_tokens content_filter |
否 | |
instructions | 字符串 | 将系统(或开发人员)消息作为模型上下文中的第一项插入。 与之前响应一起使用 previous_response_id 时,不会将上一个响应中的说明转交给下一个响应。 这样就可以轻松地在新响应中交换系统(或开发人员)消息。 |
是的 | |
最大输出标记数量 (max_output_tokens) | 整数 | 可为响应生成的令牌数上限,包括可见输出令牌和会话状态。 |
否 | |
元数据 | 元数据 | 按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符的字符串。 |
是的 | |
模型 | 字符串 | 用于生成响应的模型。 | 是的 | |
对象 | 枚举 | 此资源的对象类型 - 始终设置为 response 。可能的值: response |
是的 | |
输出 | 数组 | 模型生成的内容项数组。 - 数组中 output 项的长度和顺序取决于模型的响应。- 可以考虑使用 SDK 支持的 output_text 属性,而不是访问 output 数组中的第一个项并假设它是包含模型生成的内容的 assistant 消息。 |
是的 | |
输出文本 | 字符串 | 专属于 SDK 的便利属性,该属性包含数组中所有 output_text 项的 output 合并文本输出(如果存在)。 Python 和 JavaScript SDK 中受支持。 |
否 | |
并行工具调用 | 布尔 | 是否允许模型并行运行工具调用。 |
是的 | True |
previous_response_id | 字符串 | 对模型的上一个响应的唯一 ID。 使用此方法可创建多轮次对话。 | 否 | |
推理 | 推理 | 仅适用于 O 系列模型 推理模型的配置选项。 |
否 | |
状态 | 枚举 | 响应生成的状态。 completed 、failed 、in_progress 或 incomplete 之一。可能的值: completed 、failed 、in_progress 、incomplete |
否 | |
温度 | 数字 | 要使用的采样温度,介于 0 和 2 之间。 较高的值(如 0.8)将使输出更随机,而较小的值(如 0.2)将使输出更集中且更具确定性 我们通常建议更改此设置或 top_p ,但不要同时更改两者。 |
是的 | 1 |
文本消息 | 对象 | 来自模型的文本响应的配置选项。 可以是纯文本或结构化 JSON 数据。 了解详细信息: - 文本输入和输出 - 结构化输出 |
否 | |
└─ 格式 | TextResponseFormatConfiguration | 一个对象,指定模型必须输出的格式。 配置 { "type": "json_schema" } 启用结构化输出,这可确保模型与提供的 JSON 架构匹配。 默认格式 { "type": "text" } 没有其他选项。不建议用于 gpt-4o 和较新的模型: { "type": "json_object" } 设置为启用较旧的 JSON 模式,这可确保模型生成的消息是有效的 JSON。 对于支持它的模型,首选使用 json_schema 。 |
否 | |
工具选择 | ToolChoiceOptions 或 ToolChoiceTypes 或 ToolChoiceFunction | 模型在生成响应时应如何选择要使用的工具(或工具)。 请参阅参数 tools ,了解如何指定模型可以调用的工具。 |
是的 | |
工具 | 数组 | 生成响应时,模型可能会调用的工具数组。 可以通过设置 tool_choice 参数来指定要使用的工具。可以提供模型的两类工具包括: - 内置工具 |
是的 | |
top_p | 数字 | 温度采样的替代方法,称为核采样,其中模型考虑具有 top_p 概率质量的令牌的结果。 所以 0.1 意味着只考虑包含前 10% 概率质量的令牌。 我们通常建议更改此设置或 temperature ,但不要同时更改两者。 |
是的 | 1 |
truncation | 枚举 | 要用于模型响应的截断策略。 - auto :如果此响应的上下文和以前的上下文超出模型的上下文窗口大小,则模型将通过删除会话中间的输入项来截断响应以适应上下文窗口。 - disabled (默认值):如果模型响应将超过模型的上下文窗口大小,则请求将失败并出现 400 错误。可能的值: auto disabled |
否 | |
使用情况 | 响应使用情况 | 表示令牌使用情况详细信息,包括输入令牌、输出令牌、输出令牌细分以及所使用的令牌总数。 |
否 | |
用户 | 字符串 | 表示最终用户的唯一标识符,可帮助 OpenAI 监视和检测滥用行为。 . |
否 |
ResponseAudioDeltaEvent
当有部分音频响应时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
delta | 字符串 | Base64 编码的音频字节块。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.audio.delta 。可能的值: response.audio.delta |
是的 |
ResponseAudioDoneEvent
当音频响应完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 事件类型。 始终为 response.audio.done 。可能的值: response.audio.done |
是的 |
ResponseAudioTranscriptDeltaEvent
当有音频的部分转录时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
delta | 字符串 | 音频响应的部分转录。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.audio.transcript.delta 。可能的值: response.audio.transcript.delta |
是的 |
ResponseAudioTranscriptDoneEvent
完成全部音频转录时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 事件类型。 始终为 response.audio.transcript.done 。可能的值: response.audio.transcript.done |
是的 |
ResponseCodeInterpreterCallCodeDeltaEvent
由代码解释器添加部分代码片段时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
delta | 字符串 | 代码解释器添加的部分代码片段。 |
是的 | |
输出索引 | 整数 | 代码解释器调用正在处理的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.code_interpreter_call.code.delta 。可能的值: response.code_interpreter_call.code.delta |
是的 |
ResponseCodeInterpreterCallCodeDoneEvent
当代码片段输出由代码解释器完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | 字符串 | 代码解释器输出的最终代码片段。 |
是的 | |
输出索引 | 整数 | 代码解释器调用正在处理的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.code_interpreter_call.code.done 。可能的值: response.code_interpreter_call.code.done |
是的 |
响应代码解释器调用完成事件 (ResponseCodeInterpreterCallCompletedEvent)
在代码解释器调用完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码解释器调用 | CodeInterpreterToolCall | 用于运行代码的工具调用。 |
是的 | |
输出索引 | 整数 | 代码解释器调用正在处理的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.code_interpreter_call.completed 。可能的值: response.code_interpreter_call.completed |
是的 |
ResponseCodeInterpreterCallInProgressEvent
代码解释器调用正在进行时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码解释器调用 | CodeInterpreterToolCall | 用于运行代码的工具调用。 |
是的 | |
输出索引 | 整数 | 代码解释器调用正在处理的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.code_interpreter_call.in_progress 。可能的值: response.code_interpreter_call.in_progress |
是的 |
响应代码解释器调用事件
当代码解释器主动解释代码片段时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码解释器调用 | CodeInterpreterToolCall | 用于运行代码的工具调用。 |
是的 | |
输出索引 | 整数 | 代码解释器调用正在处理的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.code_interpreter_call.interpreting 。可能的值: response.code_interpreter_call.interpreting |
是的 |
ResponseCompletedEvent
模型响应完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
响应 | response | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.completed 。可能的值: response.completed |
是的 |
ResponseContentPartAddedEvent
添加新内容部分时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容索引 | 整数 | 已添加的内容部分的索引。 |
是的 | |
项目编号 | 字符串 | 将内容部分添加到的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 将内容部分添加到的输出项的索引。 |
是的 | |
部件 | OutputContent | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.content_part.added 。可能的值: response.content_part.added |
是的 |
ResponseContentPartDoneEvent
完成内容部分时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容索引 | 整数 | 完成的内容部分的索引。 |
是的 | |
项目编号 | 字符串 | 将内容部分添加到的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 将内容部分添加到的输出项的索引。 |
是的 | |
部件 | OutputContent | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.content_part.done 。可能的值: response.content_part.done |
是的 |
ResponseCreatedEvent
创建响应时发出的事件。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
响应 | response | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.created 。可能的值: response.created |
是的 |
响应错误
当模型无法生成响应时返回的错误对象。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | ResponseErrorCode | 响应的错误代码。 |
是的 | |
消息 | 字符串 | 可读的错误说明。 |
是的 |
响应错误代码
响应的错误代码。
资产 | 价值 |
---|---|
说明 | 响应的错误代码。 |
类型 | 字符串 |
价值观 | server_error rate_limit_exceeded invalid_prompt vector_store_timeout invalid_image invalid_image_format invalid_base64_image invalid_image_url image_too_large image_too_small image_parse_error image_content_policy_violation invalid_image_mode image_file_too_large unsupported_image_media_type empty_image_file failed_to_download_image image_file_not_found |
响应错误事件
在发生错误时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
代码 | 字符串 | 错误代码。 |
是的 | |
消息 | 字符串 | 错误消息。 |
是的 | |
param | 字符串 | 错误参数。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 error 。可能的值: error |
是的 |
响应失败事件
响应失败时发出的事件。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
响应 | response | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.failed 。可能的值: response.failed |
是的 |
ResponseFileSearchCallCompletedEvent
在文件搜索调用完成时发出(找到结果)。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
项目编号 | 字符串 | 启动文件搜索调用的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 启动文件搜索调用的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.file_search_call.completed 。可能的值: response.file_search_call.completed |
是的 |
ResponseFileSearchCallInProgressEvent
在启动文件搜索调用时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
项目编号 | 字符串 | 启动文件搜索调用的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 启动文件搜索调用的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.file_search_call.in_progress 。可能的值: response.file_search_call.in_progress |
是的 |
ResponseFileSearchCallSearchingEvent
当文件搜索当前正在搜索时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
项目编号 | 字符串 | 启动文件搜索调用的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 文件搜索调用正在搜索的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.file_search_call.searching 。可能的值: response.file_search_call.searching |
是的 |
ResponseFunctionCallArgumentsDeltaEvent
当存在部分函数调用参数增量时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
delta | 字符串 | 添加的函数调用参数增量。 |
是的 | |
项目编号 | 字符串 | 函数调用参数增量添加到的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 函数调用参数增量添加到的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.function_call_arguments.delta 。可能的值: response.function_call_arguments.delta |
是的 |
ResponseFunctionCallArgumentsDoneEvent
在函数调用参数完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
论点 | 字符串 | 函数调用参数。 | 是的 | |
项目编号 | 字符串 | 项的 ID。 | 是的 | |
输出索引 | 整数 | 输出项的索引。 | 是的 | |
类型 | 枚举 | 可能的值: response.function_call_arguments.done |
是的 |
ResponseInProgressEvent
响应正在进行时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
响应 | response | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.in_progress 。可能的值: response.in_progress |
是的 |
ResponseIncompleteEvent (响应不完整事件)
响应以不完整状态结束时发出的事件。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
响应 | response | 是的 | ||
类型 | 枚举 | 事件类型。 始终为 response.incomplete 。可能的值: response.incomplete |
是的 |
响应项目列表
响应项的列表。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 用于生成此响应的项列表。 | 是的 | |
first_id | 字符串 | 列表中第一项的 ID。 | 是的 | |
has_more | 布尔 | 是否有更多可用项。 | 是的 | |
last_id | 字符串 | 列表中最后一项的 ID。 | 是的 | |
对象 | 枚举 | 返回的对象的类型必须是 list 。可能的值: list |
是的 |
响应方式
希望模型生成的输出类型。 大多数模型都能够生成文本,这是默认设置:
["text"]
gpt-4o-audio-preview
模型还可用于生成音频。 若要请求此模型生成文本和音频响应,你可以使用:
["text", "audio"]
未为此组件定义任何属性。
响应模式仅限文本
希望模型生成的输出类型。 大多数模型都能够生成文本,这是默认设置:
["text"]
此 API 将很快支持其他输出形式,包括音频和图像。
未为此组件定义任何属性。
响应输出项添加事件
添加新的输出项时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
项 | OutputItem | 是的 | ||
输出索引 | 整数 | 已添加的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.output_item.added 。可能的值: response.output_item.added |
是的 |
响应输出项目完成事件
当输出项标记为已完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
项 | OutputItem | 是的 | ||
输出索引 | 整数 | 标记为已完成的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.output_item.done 。可能的值: response.output_item.done |
是的 |
ResponseProperties
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
instructions | 字符串 | 将系统(或开发人员)消息作为模型上下文中的第一项插入。 与之前响应一起使用 previous_response_id 时,不会将上一个响应中的说明转交给下一个响应。 这样就可以轻松地在新响应中交换系统(或开发人员)消息。 |
否 | |
最大输出标记数量 (max_output_tokens) | 整数 | 可为响应生成的令牌数上限,包括可见输出令牌和会话状态。 |
否 | |
previous_response_id | 字符串 | 对模型的上一个响应的唯一 ID。 使用此方法可创建多轮次对话。 | 否 | |
推理 | 推理 | 仅适用于 O 系列模型 推理模型的配置选项。 |
否 | |
文本消息 | 对象 | 来自模型的文本响应的配置选项。 可以是纯文本或结构化 JSON 数据。 了解详细信息: - 文本输入和输出 - 结构化输出 |
否 | |
└─ 格式 | TextResponseFormatConfiguration | 一个对象,指定模型必须输出的格式。 配置 { "type": "json_schema" } 启用结构化输出,这可确保模型与提供的 JSON 架构匹配。 默认格式 { "type": "text" } 没有其他选项。不建议用于 gpt-4o 和较新的模型: { "type": "json_object" } 设置为启用较旧的 JSON 模式,这可确保模型生成的消息是有效的 JSON。 对于支持它的模型,首选使用 json_schema 。 |
否 | |
工具选择 | ToolChoiceOptions 或 ToolChoiceTypes 或 ToolChoiceFunction | 模型在生成响应时应如何选择要使用的工具(或工具)。 请参阅参数 tools ,了解如何指定模型可以调用的工具。 |
否 | |
工具 | 数组 | 生成响应时,模型可能会调用的工具数组。 可以通过设置 tool_choice 参数来指定要使用的工具。可以提供模型的两类工具包括: - 内置工具 |
否 | |
truncation | 枚举 | 要用于模型响应的截断策略。 - auto :如果此响应的上下文和以前的上下文超出模型的上下文窗口大小,则模型将通过删除会话中间的输入项来截断响应以适应上下文窗口。 - disabled (默认值):如果模型响应将超过模型的上下文窗口大小,则请求将失败并出现 400 错误。可能的值: auto disabled |
否 |
ResponseRefusalDeltaEvent
当存在部分拒绝文本时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容索引 | 整数 | 拒绝文本添加到的内容部分的索引。 |
是的 | |
delta | 字符串 | 添加的拒绝文本。 |
是的 | |
项目编号 | 字符串 | 拒绝文本添加到的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 拒绝文本添加到的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.refusal.delta 。可能的值: response.refusal.delta |
是的 |
ResponseRefusalDoneEvent
在拒绝文本完成时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容索引 | 整数 | 已完成拒绝文本的内容部分的索引。 |
是的 | |
项目编号 | 字符串 | 已完成拒绝文本的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 已完成拒绝文本的输出项的索引。 |
是的 | |
拒绝 | 字符串 | 最终完成的拒绝文本。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.refusal.done 。可能的值: response.refusal.done |
是的 |
响应流事件
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
注释 | 注释 | 是的 | ||
注释_索引 | 整数 | 已添加的批注的索引。 |
是的 | |
论点 | 字符串 | 函数调用参数。 | 是的 | |
代码 | 字符串 | 错误代码。 |
是的 | |
代码解释器调用 | CodeInterpreterToolCall | 用于运行代码的工具调用。 |
是的 | |
内容索引 | 整数 | 已完成文本内容的内容部分的索引。 |
是的 | |
delta | 字符串 | 添加的文本增量。 |
是的 | |
项 | OutputItem | 标记为已完成的输出项。 |
是的 | |
项目编号 | 字符串 | 已完成文本内容的输出项的 ID。 |
是的 | |
消息 | 字符串 | 错误消息。 |
是的 | |
输出索引 | 整数 | 已完成文本内容的输出项的索引。 |
是的 | |
param | 字符串 | 错误参数。 |
是的 | |
部件 | OutputContent | 完成的内容部分。 |
是的 | |
拒绝 | 字符串 | 最终完成的拒绝文本。 |
是的 | |
响应 | response | 不完整的响应。 |
是的 | |
文本消息 | 字符串 | 最终完成的文本内容。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.output_text.done 。可能的值: response.output_text.done |
是的 |
ResponseTextAnnotationDelta事件
添加文本批注时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
注释 | 注释 | 是的 | ||
注释索引 | 整数 | 已添加的批注的索引。 |
是的 | |
内容索引 | 整数 | 文本批注添加到的内容部分的索引。 |
是的 | |
项目编号 | 字符串 | 文本批注添加到的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 文本批注添加到的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.output_text.annotation.added 。可能的值: response.output_text.annotation.added |
是的 |
ResponseTextDeltaEvent
当有额外的文本增量时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容索引 | 整数 | 文本增量添加到的内容部分的索引。 |
是的 | |
delta | 字符串 | 添加的文本增量。 |
是的 | |
项目编号 | 字符串 | 文本增量添加到的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 文本增量添加到的输出项的索引。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.output_text.delta 。可能的值: response.output_text.delta |
是的 |
ResponseTextDoneEvent
在完成文本内容时发出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
内容索引 | 整数 | 已完成文本内容的内容部分的索引。 |
是的 | |
项目编号 | 字符串 | 已完成文本内容的输出项的 ID。 |
是的 | |
输出索引 | 整数 | 已完成文本内容的输出项的索引。 |
是的 | |
文本消息 | 字符串 | 最终完成的文本内容。 |
是的 | |
类型 | 枚举 | 事件类型。 始终为 response.output_text.done 。可能的值: response.output_text.done |
是的 |
ResponseUsage
表示令牌使用情况详细信息,包括输入令牌、输出令牌、输出令牌细分以及所使用的令牌总数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
input_tokens | 整数 | 输入令牌数。 | 是的 | |
output_tokens | 整数 | 输出标记数。 | 是的 | |
输出令牌详情 | 对象 | 输出令牌的明细。 | 是的 | |
└─ reasoning_tokens | 整数 | 推理令牌的数量。 | 否 | |
总令牌数量 | 整数 | 使用的令牌总数。 | 是的 |
屏幕截图
屏幕截图操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 指定事件类型。 对于屏幕截图操作,此属性始终设置为screenshot 。可能的值: screenshot |
是的 |
滚动
滚动操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
scroll_x | 整数 | 水平滚动距离。 |
是的 | |
scroll_y(纵向滚动) | 整数 | 垂直滚动距离。 |
是的 | |
类型 | 枚举 | 指定事件类型。 对于滚动作,此属性始终设置为 scroll 。可能的值: scroll |
是的 | |
x | 整数 | 发生滚动的 X 坐标。 |
是的 | |
y | 整数 | 发生滚动的 Y 坐标。 |
是的 |
停止配置
最多四个序列,其中 API 将停止生成更多令牌。 返回的文本将不包含停止序列。
此组件可以是下列组件之一:
文本响应格式配置
一个对象,指定模型必须输出的格式。
配置 { "type": "json_schema" }
启用结构化输出,确保模型与提供的 JSON 架构匹配。
默认格式 { "type": "text" }
没有其他选项。
不建议用于 gpt-4o 和较新的模型:
{ "type": "json_object" }
设置为启用较旧的 JSON 模式,这可确保模型生成的消息是有效的 JSON。 对于支持它的模型,首选使用 json_schema
。
此组件可以是下列组件之一:
TextResponseFormatJsonSchema
JSON 架构响应格式。 用于生成结构化 JSON 响应。 详细了解结构化输出。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
description | 字符串 | 对响应格式用途的描述,由模型用于确定如何以该格式进行响应。 |
否 | |
姓名 | 字符串 | 响应格式的名称。 必须是 a-z、A-z、0-9,或包含下划线和短划线,最大长度为 64。 |
否 | |
架构 | 响应格式Json模式Schema | 响应格式的架构,描述为 JSON 架构对象。 | 是的 | |
strict | 布尔 | 是否在生成输出时启用严格的架构遵循。 如果设置为 true,则模型将始终遵循 schema 字段中定义的确切架构。 当 strict 为 true 时仅支持 JSON 架构的子集。 |
否 | 假 |
类型 | 枚举 | 要定义的响应格式的类型。 始终为 json_schema 。可能的值: json_schema |
是的 |
工具
此组件可以是下列组件之一:
工具选择功能
使用此选项强制模型调用特定函数。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
姓名 | 字符串 | 要调用的函数名称。 | 是的 | |
类型 | 枚举 | 对于函数调用,类型始终为function 。可能的值: function |
是的 |
工具选择选项
控制模型调用哪些工具(如有)。
none
表示模型不会调用任何工具,而是生成消息。
auto
表示模型可以在生成消息和调用一个或多个工具之间进行选择。
required
表示模型必须调用一个或多个工具。
资产 | 价值 |
---|---|
说明 | 控制模型调用哪些工具(如有)。none 表示模型不会调用任何工具,而是生成消息。auto 表示模型可以在生成消息和调用一个或多个工具之间进行选择。required 表示模型必须调用一个或多个工具。 |
类型 | 字符串 |
价值观 | none auto required |
工具选择类型
指示模型应使用内置工具生成响应。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 模型应使用的托管工具的类型。 允许值包括: - file_search - computer_use_preview 可能的值: file_search computer_use_preview |
是的 |
类型
键入文本的操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文本消息 | 字符串 | 要键入的文本。 |
是的 | |
类型 | 枚举 | 指定事件类型。 类型操作时,此属性始终设置为 type 。可能的值: type |
是的 |
更新矢量存储文件属性请求
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
属性 | VectorStoreFileAttributes | 按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符、布尔值或数字的字符串。 |
是的 |
网址引用
用于生成模型响应的 Web 资源的引文。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
end_index | 整数 | 消息中 URL 引文的最后一个字符的索引。 |
是的 | |
start_index | 整数 | 消息中 URL 引文的第一个字符的索引。 |
是的 | |
title | 字符串 | Web 资源的标题。 |
是的 | |
类型 | 枚举 | URL 引文的类型。 始终为 url_citation 。可能的值: url_citation |
是的 | |
url | 字符串 | Web 资源的 URL。 |
是的 |
VectorStoreFileAttributes
按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符、布尔值或数字的字符串。
未为此组件定义任何属性。
VectorStoreFileContentResponse
表示矢量存储文件的已分析内容。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 文件的分析内容。 | 是的 | |
has_more | 布尔 | 指示是否有更多要提取的内容页。 | 是的 | |
下一页 | 字符串 | 下一页的令牌(如果有)。 | 是的 | |
对象 | 枚举 | 对象类型,始终为 vector_store.file_content.page 可能的值: vector_store.file_content.page |
是的 |
VectorStoreSearchRequest
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
筛选器 | ComparisonFilter 或 CompoundFilter | 基于文件属性应用的筛选器。 | 否 | |
max_num_results(最大结果数) | 整数 | 要返回的最大结果数。 此数字应介于 1 和 50 之间(含)。 | 否 | 10 |
查询 | 字符串或数组 | 用于搜索的查询字符串 | 是的 | |
排名选项 | 对象 | 用于搜索的排名选项。 | 否 | |
└─ ranker | 枚举 | 可能的值: auto default-2024-11-15 |
否 | |
分数阈值 | 数字 | 否 | 0 | |
rewrite_query | 布尔 | 是否重写矢量搜索的自然语言查询。 | 否 | 假 |
向量存储搜索结果内容对象
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
文本消息 | 字符串 | 从搜索返回的文本内容。 | 是的 | |
类型 | 枚举 | 内容的类型。 可能的值: text |
是的 |
VectorStoreSearchResultItem
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
属性 | VectorStoreFileAttributes | 按 16 个成组的可附加到对象的键值对。 这可用于以结构化格式存储有关对象的其他信息,以及通过 API 或仪表板查询对象。 键是最大长度为 64 个字符的字符串。 值为最大长度为 512 个字符、布尔值或数字的字符串。 |
是的 | |
内容 | 数组 | 文件中的内容区块。 | 是的 | |
file_id | 字符串 | 矢量存储文件的 ID。 | 是的 | |
文件名 | 字符串 | 矢量存储文件的名称。 | 是的 | |
分数 | 数字 | 结果的相似性分数。 | 是的 |
VectorStoreSearchResultsPage
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 数组 | 搜索结果项的列表。 | 是的 | |
has_more | 布尔 | 指示是否有更多要提取的结果。 | 是的 | |
下一页 | 字符串 | 下一页的令牌(如果有)。 | 是的 | |
对象 | 枚举 | 对象类型,始终为 vector_store.search_results.page 可能的值: vector_store.search_results.page |
是的 | |
search_query | 数组 | 是的 |
VoiceIdsShared
未为此组件定义任何属性。
等
等待操作。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
类型 | 枚举 | 指定事件类型。 对于等待动作,此属性始终设置为wait 。可能的值: wait |
是的 |
ReasoningEffort
仅适用于 O 系列模型
限制推理模型的推理力度。
当前支持的值为 low
、medium
和 high
。 减少推理工作量可以加快回复速度,减少回复中用于推理的标记。
资产 | 价值 |
---|---|
说明 | 仅适用于 O 系列模型 限制推理模型的推理力度。 当前支持的值为 low 、medium 和 high 。 减少推理工作量可以加快回复速度,减少回复中用于推理的标记。 |
类型 | 字符串 |
默认 | 中 |
价值观 | low medium high |
错误事件
当出现错误时发生。 这可能是内部服务器错误或超时导致的。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 错误 | 是的 | ||
事件 | 字符串 | 是的 |
事件枚举:ErrorEventEnum
价值 | DESCRIPTION |
---|---|
错误 |
doneEvent
当流式传输结束时发生。
名称 | 类型 | DESCRIPTION | 必选 | 违约 |
---|---|---|---|---|
数据 | 字符串 | 是的 | ||
事件 | 字符串 | 是的 |
事件枚举:DoneEventEnum
价值 | DESCRIPTION |
---|---|
完成 |
数据枚举:DoneEventDataEnum
价值 | DESCRIPTION |
---|---|
[完成] |
后续步骤
了解模型和使用 REST API 微调。 详细了解 支持 Azure OpenAI 的基础模型。