你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure OpenAI 由一组具有不同功能和价格点的不同模型提供支持。 模型可用性因区域和云而异。 有关 Azure 政府模型的可用性,请参阅 Azure 政府中的 Azure OpenAI。
Models | Description |
---|---|
GPT-5 series |
新的 、gpt-5 、gpt-5-mini 、gpt-5-nano gpt-5-chat |
gpt-oss | 新的开放权重推理模型 |
codex-mini |
微调版本的 o4-mini。 |
GPT-4.1 series |
Azure OpenAI 的最新模型版本。 |
model-router |
从一组基础聊天模型中智能选择以响应给定提示的模型。 |
computer-use-preview |
一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。 |
o-series models |
Reasoning models ,具有高级问题解决能力,且专注和能力有所提高。 |
GPT-4o, GPT-4o mini, and GPT-4 Turbo |
具有多模式版本的最新、功能强大的 Azure OpenAI 模型,可以接受文本和图像作为输入。 |
GPT-4 |
一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
GPT-3.5 |
一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
Embeddings | 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。 |
Image generation |
一系列可从自然语言生成原始图像的模型。 |
Audio |
语音转文本、翻译和文本转语音的一系列模型。 GPT-4o 音频模型支持低延迟的“语音输入、语音输出”对话交互或音频生成。 |
GPT-5
区域可用性
Model | Region |
---|---|
gpt-5 (2025-08-07) |
美国东部 2(全球标准与数据区域)、瑞典中部(全球标准与数据区域) |
gpt-5-mini (2025-08-07) |
美国东部 2(全球标准与数据区域)、瑞典中部(全球标准与数据区域) |
gpt-5-nano (2025-08-07) |
美国东部 2(全球标准与数据区域)、瑞典中部(全球标准与数据区域) |
gpt-5-chat (2025-08-07) |
美国东部 2 (全球标准), 瑞典中部 (全球标准) |
gpt-5-mini
、gpt-5-nano
和gpt-5-chat
不需要注册。
将根据 Microsoft 的资格条件授予访问权限。 之前申请并获得 o3
访问权限的客户无需重新应用,因为其已批准的订阅将在模型发布时自动获得访问权限。
模型 ID | Description | 上下文窗口 | 最大输出标记 | 训练数据(上限) |
---|---|---|---|---|
gpt-5 (2025-08-07) |
-
推理 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 功能的完整摘要。 |
272000 | 128,000 | 2024 年 10 月 24 日 |
gpt-5-mini (2025-08-07) |
-
推理 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 功能的完整摘要。 |
272000 | 128,000 | 2024 年 6 月 24 日 |
gpt-5-nano (2025-08-07) |
-
推理 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 功能的完整摘要。 |
272000 | 128,000 | 2024 年 5 月 31 日 |
gpt-5-chat (2025-08-07)预览 |
- 聊天补全 API。 - 响应 API。 - 仅文本 |
128,000 | 16,384 | 2024 年 10 月 24 日 |
gpt-oss
区域可用性
Model | Region |
---|---|
gpt-oss-120b |
所有 Azure OpenAI 区域 |
Capabilities
模型 ID | Description | 上下文窗口 | 最大输出标记 | 训练数据(上限) |
---|---|---|---|---|
gpt-oss-120b (预览版) |
- 仅限文本输入/文本输出 - 聊天补全 API - 流式处理 - 函数调用 - 结构化输出 -推理 - 可用于部署1且通过托管计算使用 |
131,072 | 131,072 | 2024 年 5 月 31 日 |
gpt-oss-20b (预览版) |
- 仅限文本输入/文本输出 - 聊天补全 API - 流式处理 - 函数调用 - 结构化输出 -推理 - 通过托管计算和Foundry Local提供 |
131,072 | 131,072 | 2024 年 5 月 31 日 |
1 与其他 Azure OpenAI 模型不同,gpt-oss-120b
需要 Azure AI Foundry 项目来部署模型。
使用代码进行部署
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
GPT-4.1 系列
区域可用性
Model | Region |
---|---|
gpt-4.1 (2025-04-14) |
请参阅模型表。 |
gpt-4.1-nano (2025-04-14) |
请参阅模型表。 |
gpt-4.1-mini (2025-04-14) |
请参阅模型表。 |
Capabilities
Important
已知问题会影响所有 GPT 4.1 系列模型。 超过 30 万个令牌的大型工具或函数调用定义将导致失败,即使未达到模型的 100 万个令牌上下文限制。
这些错误可能因 API 调用和基础有效负载特征而异。
下面是聊天补全 API 的错误消息:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}
Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
下面是响应 API 的错误消息:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
模型 ID | Description | 上下文窗口 | 最大输出令牌数 | 训练数据(上限) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- 文本和图像输入 - 文本输出 - 聊天补全 API - 响应 API - 流式处理 - 函数调用 - 结构化输出(聊天补全) |
- 1,047,576 - 128,000(预配的托管部署) - 300,000 (批量部署) |
32,768 | 2024 年 5 月 31 日 |
gpt-4.1-nano (2025-04-14) |
- 文本和图像输入 - 文本输出 - 聊天补全 API - 响应 API - 流式处理 - 函数调用 - 结构化输出(聊天补全) |
- 1,047,576 - 128,000(预配的托管部署) - 300,000 (批量部署) |
32,768 | 2024 年 5 月 31 日 |
gpt-4.1-mini (2025-04-14) |
- 文本和图像输入 - 文本输出 - 聊天补全 API - 响应 API - 流式处理 - 函数调用 - 结构化输出(聊天补全) |
- 1,047,576 - 128,000(预配的托管部署) - 300,000 (批量部署) |
32,768 | 2024 年 5 月 31 日 |
model-router
从一组基础聊天模型中智能选择以响应给定提示的模型。
Note
最新版本的模型路由器当前仅受限访问。 可以使用表单请求访问权限 gpt-5 access
: gpt-5 受限访问模型应用程序。 如果你已经有o3 access
,则无需请求。
区域可用性
Model | Region |
---|---|
model-router (2025-08-07) |
美国东部 2 (全球标准), 瑞典中部 (全球标准) |
model-router (2025-05-19) |
美国东部 2 (全球标准), 瑞典中部 (全球标准) |
Capabilities
模型 ID | Description | 上下文窗口 | 最大输出令牌数 | 训练数据(上限) |
---|---|---|---|---|
model-router (2025-08-07) |
从一组基础模型中智能选择以响应给定提示的模型。 | 200,000 | 32,768 (GPT-4.1 series ) 100,000 () o4-mini 128,000 () gpt-5 reasoning models 16,384 ( gpt-5-chat ) |
- |
model-router (2025-05-19) |
从一组基础聊天模型中智能选择以响应给定提示的模型。 | 200,000 | 32,768 (GPT-4.1 series ) 100,000 () o4-mini |
2024 年 5 月 31 日 |
较大的上下文窗口与一些基础模型兼容。 这意味着,只有当提示恰好被路由到正确的模型时,具有较大上下文的 API 调用才会成功。 否则,调用会失败。
computer-use-preview
一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。
它可与第三方库一起使用,使模型能够控制鼠标和键盘输入,同时从当前环境的屏幕截图获取上下文。
Caution
我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定正式版。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。
需要注册才能访问 computer-use-preview
。 将根据 Microsoft 的资格条件授予访问权限。 有权访问其他受限访问模型的客户仍需要请求对此模型的访问权限。
若要请求访问权限,请转到 computer-use-preview
受限访问模型应用程序。 授予访问权限后,需要为模型创建部署。
区域可用性
Model | Region |
---|---|
computer-use-preview |
请参阅模型表。 |
Capabilities
模型 ID | Description | 上下文窗口 | 最大输出令牌数 | 训练数据(上限) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
专门为 Responses API 计算机使用工具设计的模型 -工具 - 流媒体 - 文本(输入/输出) - 图像(输入) |
8,192 | 1,024 | 2023 年 10 月 |
o 系列模型
Azure OpenAI o 系列模型设计用于处理推理和问题解决任务,具有更好的针对性和功能。 这些模型将更多时间花费在处理和理解用户的请求上,与以前的更迭版本相比,它们在科学、编码和数学等领域表现得异常强大。
模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
---|---|---|---|
codex-mini (2025-05-16) |
微调版本的 o4-mini 。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o3-pro (2025-06-10) |
-
响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o4-mini (2025-04-16) |
-
新的推理模型,提供增强的推理能力。 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o3 (2025-04-16) |
-
新的推理模型,提供增强的推理能力。 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o3-mini (2025-01-31) |
-
增强推理能力。 - 结构化输出。 - 仅文本处理。 - 函数和工具。 |
输入:200,000 输出:100000 |
2023 年 10 月 |
o1 (2024-12-17) |
-
增强推理能力。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 |
输入:200,000 输出:100000 |
2023 年 10 月 |
o1-preview (2024-09-12) |
较旧的预览版。 | 输入:128,000 输出:32,768 |
2023 年 10 月 |
o1-mini (2024-09-12) |
o1 系列中速度更快、更具成本效益的选项,非常适合需要速度和更低资源消耗的编码任务。 - 全球标准部署默认可用。 - 标准(区域)部署目前仅适用于在 o1-preview 受限访问版本中接收访问权限的选择客户。 |
输入:128,000 输出:65,536 |
2023 年 10 月 |
若要详细了解高级 o 系列模型,请参阅推理模型入门。
区域可用性
Model | Region |
---|---|
codex-mini |
美国东部 2 和瑞典中部(全球标准)。 |
o3-pro |
美国东部 2 和瑞典中部(全球标准)。 |
o4-mini |
请参阅模型表。 |
o3 |
请参阅模型表。 |
o3-mini |
请参阅模型表。 |
o1 |
请参阅模型表。 |
o1-preview |
请参阅模型表。 此模型仅适用于在原始受限访问中被授予访问权限的客户。 |
o1-mini |
请参阅模型表。 |
GPT-4o 和 GPT-4 Turbo
GPT-4o 在单个模型中集成文本和图像,从而能够同时处理多个数据类型。 这种多模式方法提高了人机交互的准确性和响应能力。 GPT-4o 在英语文本和编码任务方面与 GPT-4 Turbo 相当,但在非英语语言任务和视觉任务方面具有更优越的性能,为 AI 功能设定了新的基准。
如何访问 GPT-4o 和 GPT-4o mini 模型?
GPT-4o 和 GPT-4o mini 适用于标准和全球标准模型部署。
需要在该模型可用的受支持标准或全球标准区域中创建或使用现有资源。
创建资源后,可以部署 GPT-4o 模型。 如果你要执行编程部署,则模型名称如下:
-
gpt-4o
版本2024-11-20
-
gpt-4o
版本2024-08-06
-
gpt-4o
版本2024-05-13
-
gpt-4o-mini
版本2024-07-18
GPT-4 Turbo
GPT-4 Turbo 是一个大型多模态模型(接受文本或图像输入并生成文本),它可以比 OpenAI 的任何以前的模型更准确地解决难题。 与 GPT-3.5 Turbo 和较旧的 GPT-4 模型一样,GPT-4 Turbo 针对聊天进行了优化,能够很好地完成传统的补全任务。
GPT-4
GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 模型和 GPT-4 Turbo 模型的基础模型名称均为 gpt-4
。 可以通过检查模型版本来区分 GPT-4 模型和 Turbo 模型。
GPT-4 模型和 GPT-4 Turbo 模型
这些模型只能与聊天补全 API 一起使用。
请参阅模型版本,了解 Azure OpenAI 如何处理模型版本升级。 请参阅使用模型,了解如何查看和配置 GPT-4 部署的模型版本设置。
模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
---|---|---|---|
gpt-4o (2024-11-20)GPT-4o (Omni) |
最新的大型 GA 模型。 - 结构化输出。 - 文本和图像处理。 - JSON 模式。 - 并行函数调用。 - 提高准确性和响应能力。 - 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当。 - 在非英语语言和视觉任务方面具有更优越的性能。 - 增强的创意写作能力。 |
输入:128,000 输出:16,384 |
2023 年 10 月 |
gpt-4o (2024-08-06)GPT-4o (Omni) |
- 结构化输出。 - 文本和图像处理。 - JSON 模式。 - 并行函数调用。 - 提高准确性和响应能力。 - 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当。 - 在非英语语言和视觉任务方面具有更优越的性能。 |
输入:128,000 输出:16,384 |
2023 年 10 月 |
gpt-4o-mini (2024-07-18)GPT-4o mini |
最新的小型 GA 模型。 - 速度快、价格低廉、功能强大的模型,是替代 GPT-3.5 Turbo 系列型号的理想选择。 - 文本和图像处理。 - JSON 模式。 - 并行函数调用。 |
输入:128,000 输出:16,384 |
2023 年 10 月 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
- 文本和图像处理。 - JSON 模式。 - 并行函数调用。 - 提高准确性和响应能力。 - 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当。 - 在非英语语言和视觉任务方面具有更优越的性能。 |
输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-4 (turbo-2024-04-09) 具有视觉的 GPT-4 Turbo |
新的正式版模型。 - 替代了所有以前的 GPT-4 预览版模型( vision-preview 、1106-Preview 、0125-Preview )。 - 功能可用性目前因输入的方法和部署类型而异。 |
输入:128,000 输出:4,096 |
2023 年 12 月 |
Caution
建议不要在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定正式版。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。
GPT-3.5
GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,还能够很好地完成传统的补全任务。 GPT-3.5 Turbo 可以与聊天完成 API 一起使用。 使用使用补全 API 而不是聊天补全 API 时,GPT-3.5 Turbo 指令具有与 text-davinci-003
类似的功能。 我们建议使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是使用旧版 GPT-3.5 和 GPT-3 模型。
模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
---|---|---|---|
gpt-35-turbo (0125) 新 |
最新正式版模型。 - JSON 模式。 - 并行函数调用。 - 可重现的输出(预览版)。 - 当它以请求的格式进行响应时,准确度更高。 - 提供针对导致非英语函数调用的文本编码问题的 bug 的修补程序。 |
输入:16,385 输出:4,096 |
2021 年 9 月 |
gpt-35-turbo (1106) |
较旧的正式版模型。 - JSON 模式。 - 并行函数调用。 - 可重现的输出(预览版)。 |
输入:16,385 输出:4,096 |
2021 年 9 月 |
gpt-35-turbo-instruct (0914) |
仅限补全终结点。 - 替换旧补全模型。 |
4,097 | 2021 年 9 月 |
若要详细了解如何与 GPT-3.5 Turbo 和聊天补全 API 进行交互,请查看我们的操作方法详解文章。
Embeddings
text-embedding-3-large
是最新且能力最强的嵌入模型。 不能在嵌入模型之间升级。 若要从使用 text-embedding-ada-002
移到 text-embedding-3-large
,需要生成新的嵌入。
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
OpenAI 报告称,测试表明,在 MIRACL 基准测试下,大型和小型第三代嵌入模型在多语言检索平均性能方面表现更优。 在 MTEB 基准测试中,它们仍在英语任务上保持着良好性能。
评估基准 | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL 平均值 | 31.4 | 44.0 | 54.9 |
MTEB 平均值 | 61.0 | 62.3 | 64.6 |
第三代嵌入模型支持通过新的 dimensions
参数减小嵌入的大小。 通常,从计算、内存和存储的角度来看,更大的嵌入成本更高。 当你能够调整维度数时,就能更好地控制整体成本和性能。 OpenAI 1.x Python 库的所有版本都不支持 dimensions
参数。 若要使用此参数,建议升级到最新版本:pip install openai --upgrade
。
OpenAI 的 MTEB 基准测试发现,即使第三代模型的维度减少到低于 text-embeddings-ada-002
的 1,536 维,其性能仍略胜一筹。
图像生成模型
图像生成模型从用户提供的文本提示生成图像。 GPT-image-1 目前为受限访问预览版。 DALL-E 3 可通过 REST API 供公众使用。 配备客户端 SDK 的 DALL-E 2 和 DALL-E 3 处于预览状态。
需要注册才能访问 gpt-image-1
。 将根据 Microsoft 的资格条件授予访问权限。 有权访问其他受限访问模型的客户仍需要请求对此模型的访问权限。
若要请求访问权限,请转到 gpt-image-1
受限访问模型应用程序。 授予访问权限后,需要为模型创建部署。
区域可用性
Model | Region |
---|---|
dall-e-3 |
美国东部 Australia East 瑞典中部 |
gpt-image-1 |
美国西部 3(全球标准) 美国东部 2 (全球标准) 阿联酋北部 (全球标准) 波兰中部(全球标准) |
视频生成模型
Sora 是 OpenAI 的 AI 模型,可以从文本说明创建真实而富有想象力的视频场景。 Sora 目前为预览版。
区域可用性
Model | Region |
---|---|
sora |
美国东部 2 |
音频模型
Azure OpenAI 中的音频模型通过 realtime
、completions
和 audio
API 提供。
GPT-4o 音频模型
GPT 4o 音频模型是 GPT-4o 模型系列的一部分,支持低延迟的“语音输入,语音输出”对话交互或音频生成。
Caution
我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定正式版。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。
下表提供了有关请求令牌上限和训练数据的详细信息:
模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17)GPT-4o 音频 |
用于音频和文本生成的音频模型。 | 输入:128,000 输出:16,384 |
2023年9月 |
gpt-4o-audio-preview (2024-12-17)GPT-4o 音频 |
用于音频和文本生成的音频模型。 | 输入:128,000 输出:16,384 |
2023年9月 |
gpt-4o-realtime-preview (2025-06-03) GPT-4o 音频 |
用于实时音频处理的音频模型。 | 输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-4o-realtime-preview (2024-12-17)GPT-4o 音频 |
用于实时音频处理的音频模型。 | 输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-4o-mini-realtime-preview (2024-12-17)GPT-4o 音频 |
用于实时音频处理的音频模型。 | 输入:128,000 输出:4,096 |
2023 年 10 月 |
若要比较所有区域中 GPT-4o 音频模型的可用性,请参阅模型表。
音频 API
通过 API 的 /audio
音频模型可用于语音转文本、翻译和文本转语音。
语音转文本模型
模型 ID | Description | 最大请求(音频文件大小) |
---|---|---|
whisper |
常规用途语音识别模型。 | 25 MB |
gpt-4o-transcribe |
由 GPT-4o 提供支持的语音转文本模型。 | 25 MB |
gpt-4o-mini-transcribe |
由 GPT-4o mini 提供支持的语音转文本模型。 | 25 MB |
语音翻译模型
模型 ID | Description | 最大请求(音频文件大小) |
---|---|---|
whisper |
常规用途语音识别模型。 | 25 MB |
文本转语音模型(预览版)
模型 ID | Description |
---|---|
tts |
针对速度进行了优化的文本转语音模型。 |
tts-hd |
针对质量进行了优化的文本转语音模型。 |
gpt-4o-mini-tts |
由 GPT-4o mini 提供支持的文本转语音模型。 你可使语音以一种特定风格或语调说话。 |
有关详细信息,请参阅本文后面的音频模型区域可用性。
模型摘要表和区域可用性
按部署类型划分的模型
Azure OpenAI 为客户提供了适合其业务和使用模式的托管结构选择。 该服务提供两种主要部署类型:
- 标准:具有全球部署选项,可在全球范围内路由流量以提供更高的吞吐量。
- 已预配:还有一个全球部署选项,允许客户在 Azure 全球基础结构中购买和部署预配的吞吐量单位。
所有部署都可以执行完全相同的推理操作,但计费、规模和性能却大不相同。 要详细了解 Azure OpenAI 部署,请参阅我们的部署类型指南。
全球标准模型可用性
Region | gpt-5, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | gpt-5-chat, 2025-08-07 | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | model-router, 2025-08-07 | model-router, 2025-05-19 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | 计算机使用预览,2025-03-11 | o3-mini, 2025-01-31 | o1,2024年12月17日 | o1-mini,2024-09-12 | gpt-4o,2024-05-13 | gpt-4o,2024-08-06 | gpt-4o,2024-11-20 | gpt-4o-mini,2024-07-18 | gpt-4,turbo-2024-04-09 | text-embedding-3-small,1 | text-embedding-3-large,1 | text-embedding-ada-002,2 | gpt-4o-realtime-preview,2024-12-17 | gpt-4o-realtime-preview, 2025-06-03 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview,2024-12-17 | gpt-4o-mini-audio-preview,2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 | o3-deep-research, 2025-06-26 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
eastus | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
francecentral | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
germanywestcentral | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
italynorth | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
norwayeast | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ |
polandcentral | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
spaincentral | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - |
switzerlandnorth | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
uaenorth | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
westus | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus3 | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
Note
o3-deep-research
目前仅适用于 Azure AI Foundry 代理服务。 若要了解详细信息,请参阅 深度研究工具指南。
此表未包括微调区域可用性信息。 有关此信息,请参阅微调部分。
按终结点的标准部署(区域)模型
聊天补全
Region | o1-preview, 2024-09-12 | o1-mini,2024-09-12 | gpt-4o,2024-05-13 | gpt-4o,2024-11-20 | gpt-4o,2024-08-06 | gpt-4o-mini,2024-07-18 | gpt-4,turbo-2024-04-09 | gpt-35-turbo,1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
canadaeast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
francecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
norwayeast | - | - | - | ✅ | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
southindia | - | - | - | ✅ | - | - | - | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | - | - | - | ✅ | - | - | - | - | ✅ |
uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Note
o1-mini
目前可供所有客户用于全球标准部署。
在 o1-mini
有限访问版本中,选择客户被授予对 o1-preview
的标准(区域)部署访问权限。 目前,不会扩展对 o1-mini
标准(区域)部署的访问。
GPT-4 和 GPT-4 Turbo 模型可用性
GPT-3.5 模型
若要了解 Azure OpenAI 如何处理模型版本升级,请参阅模型版本。 若要了解如何查看和配置 GPT-3.5 Turbo 部署的模型版本设置,请参阅使用模型。
微调模型
Note
gpt-35-turbo
:此模型的微调仅限于一小部分区域,并且基础模型在可用的每个区域中都不可用。
如果在 Azure AI Foundry 项目内部(而不是在某个项目外部)使用 Azure OpenAI 模型,则支持进行微调的区域可能会有所不同。
模型 ID | 标准训练区域 | 全球训练(预览版) | 最大请求(标记) | 训练数据(上限) | Modality |
---|---|---|---|---|---|
gpt-35-turbo (1106) |
美国东部 2 美国中北部 瑞典中部 瑞士西部 |
- | 输入:16,385 输出:4,096 |
2021 年 9 月 | 文本转文本 |
gpt-35-turbo (0125) |
美国东部 2 美国中北部 瑞典中部 瑞士西部 |
- | 16,385 | 2021 年 9 月 | 文本转文本 |
gpt-4o-mini (2024-07-18) |
美国中北部 瑞典中部 |
- | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2023 年 10 月 | 文本转文本 |
gpt-4o (2024-08-06) |
美国东部 2 美国中北部 瑞典中部 |
- | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2023 年 10 月 | 文本和视觉转文本 |
gpt-4.1 (2025-04-14) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2024 年 5 月 | 文本和视觉转文本 |
gpt-4.1-mini (2025-04-14) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2024 年 5 月 | 文本转文本 |
gpt-4.1-nano (2025-04-14) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:32,768 |
2024 年 5 月 | 文本转文本 |
o4-mini (2025-04-16) |
美国东部 2 瑞典中部 |
- | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2024 年 5 月 | 文本转文本 |
Note
全球训练(预览版)为每个令牌提供更实惠的训练,但不提供数据驻留。 它目前可用于下列区域中的 Azure OpenAI 资源,即将支持更多区域:
- Australia East
- Brazil South
- 加拿大中部
- 加拿大东部
- 美国东部
- 美国东部 2
- 法国中部
- 德国中西部
- 意大利北部
- 日本东部 (无视力支持)
- 韩国中部
- 美国中北部
- 挪威东部
- 波兰中部 (无4.1纳米支持)
- 东南亚
- 南非北部
- 美国中南部
- 印度南部
- 西班牙中部
- 瑞典中部
- 瑞士西部
- 瑞士北部
- 英国南部
- 西欧
- 美国西部
- 美国西部 3
助手(预览版)
对于助手,你需要受支持模型和受支持区域的组合。 某些工具和功能需要最新的模型。 以下模型可在助手 API、SDK 和 Azure AI Foundry 中使用。 下表适用于标准部署。 若要了解预配吞吐量单位可用性,请参阅预配吞吐量。 列出的模型和区域可用于助手 v1 和 v2。 如果下列区域支持全球标准模型,则可以使用这些模型。
Region | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4,1106-Preview | gpt-4,0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo,0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k,0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
norwayeast | - | - | - | - | ✅ | - | - | - | - | - | - | - |
southindia | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
模型停用
有关模型停用的最新信息,请参阅模型停用指南。