你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
借助 Azure AI Foundry 模型,可以访问 Azure AI Foundry 中的旗舰模型,以将其用作具有灵活部署选项的 API。 本文列出了一系列模型产品/服务及其功能,不包括 已弃用和旧模型。
根据你在 Azure AI Foundry 中使用 的项目类型 ,你可能会看到这些模型的不同选择。 具体而言,如果使用基于 Azure AI Foundry 资源构建的 Foundry 项目,则会看到可用于标准部署到 Foundry 资源的模型。 或者,如果使用由 Azure AI Foundry 中心托管的基于中心的项目,则会看到可用于部署到托管计算和无服务器 API 的模型。 许多情况下,这些模型选择确实重叠,因为许多模型支持多个 部署选项。
模型目录中的 Foundry 模型属于两个主要类别:
由 Azure 直接销售的模型
由 Azure 直接销售的模型包括所有 Azure OpenAI 模型和来自顶级提供商的特定所选模型。 若要了解有关这些模型的详细信息,请参阅 Azure 直接销售的模型。
Azure OpenAI
Azure AI Foundry Models 中的 Azure OpenAI 提供了一组具有不同功能和价位的不同模型。 在 Azure OpenAI 模型可用性中了解更多详细信息。 这些模型包括:
- 为处理推理任务和问题解决任务设计的最先进的模型,具有更好的针对性和功能
- 可以理解和生成自然语言和代码的模型
- 可以将语音听录和翻译为文本的模型
Models | Description |
---|---|
gpt-oss | 开放式权重推理模型 |
codex-mini | 微调版本的 o4-mini。 |
GPT-4.1 系列 | Azure OpenAI 的最新模型版本。 |
model-router | 从一组基础聊天模型中智能选择以响应给定提示的模型。 |
computer-use-preview | 一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。 |
o 系列模型 | 具有高级问题解决能力、增强的专注力和功能的推理模型。 |
GPT-4o、GPT-4o mini 和 GPT-4 Turbo | 具有多模式版本的最新支持 Azure OpenAI 模型,可以接受文本和图像作为输入。 |
GPT-4 | 一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
GPT-3.5 | 一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
Embeddings | 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。 |
图像生成 | 一系列可从自然语言生成原始图像的模型。 |
Audio | 语音转文本、翻译和文本转语音的一系列模型。 GPT-4o 音频模型支持低延迟 语音输入、语音输出 对话交互或音频生成。 |
请参阅 Azure AI Foundry 门户中的此模型集合。
黑森林实验室的模型由 Azure 直接销售
图像生成模型的黑林实验室集合包括用于上下文生成和编辑的 FLUX.1 Kontext [pro],以及用于文本到图像生成的 FLUX1.1 [pro]。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
FLUX.1-Kontext-pro | 图像生成 | - 输入: 文本和图像(5000 个标记和 1 个图像) - 输出: 一个图像 - 工具调用:无 - 响应格式:图像(PNG 和 JPG) |
Foundry,基于中心的 |
FLUX-1.1-pro | 图像生成 | - 输入: 文本(5000 个标记) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
DeepSeek 模型直接由 Azure 销售
DeepSeek 系列模型包括 DeepSeek-R1,它擅长使用分步训练过程(如语言、科学推理和编码任务)来推理任务。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
DeepSeek-R1-0528 | chat-completion (具有推理内容) |
- 输入: 文本(163,840 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
Foundry,基于中心的 |
DeepSeek-V3-0324 | chat-completion | - 输入:文本(131,072 个标记) - 输出: (131,072 个令牌) - 语言: en 和 zh - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
DeepSeek-R1 | chat-completion (具有推理内容) |
- 输入: 文本(163,840 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Azure 直售元模型
Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 元模型的范围经过调整以包括:
- 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
- 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
- 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
Llama-4-Maverick-17B-128E-Instruct-FP8 | chat-completion | - 输入:文本和图像(1M 个标记) - 输出: 文本(1M 词元) - 语言: ar 、、en 、fr 和 de hi id it pt es tl th vi - 工具调用:无* - 响应格式:文本 |
Foundry,基于中心的 |
Llama-3.3-70B-Instruct | chat-completion | - 输入:文本(128,000 个标记) - 输出:文本(8,192 个标记) - 语言: en 、、de 、fr 、it pt 、hi 、和 es th - 工具调用:无* - 响应格式:文本 |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。 合作伙伴 和社区也提供了多个 Meta 模型。
Azure 直售 Microsoft 模型
Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
MAI-DS-R1 | chat-completion (具有推理内容) |
- 输入: 文本(163,840 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的Microsoft模型集合。 合作伙伴 和社区还提供了多个Microsoft模型。
xAI 模型直接由 Azure 销售
xAI 的 Grok 3 和 Grok 3 微型模型设计为在各种企业领域表现出色。 Grok 3 是由 Colossus 数据中心预先训练的非推理模型,专为业务用例(如数据提取、编码和文本摘要)而定制,具有卓越的指令遵循能力。 它支持 131,072 令牌上下文窗口,允许它处理广泛的输入,同时保持一致性和深度,并且善于跨域和语言绘制连接。 另一方面,Grok 3 Mini 是一种轻型推理模型,旨在解决测试时计算的代理、编码、数学和深层科学问题。 它还支持一个 131,072 个令牌的上下文窗口,用于理解代码库和企业文档,并擅长使用工具解决新环境中的复杂逻辑问题,为思维预算可调整的用户检查提供原始推理跟踪。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
grok-31 | chat-completion | - 输入:文本(131,072 个标记) - 输出: 文本(131,072 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
Foundry,基于中心的 |
grok-3-mini1 | chat-completion | - 输入:文本(131,072 个标记) - 输出: 文本(131,072 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的 xAI 模型集合。
来自合作伙伴和社区的模型
来自合作伙伴和社区的模型构成了大多数 Azure AI Foundry 模型,并由受信任的第三方组织、合作伙伴、研究实验室和社区参与者提供。 若要了解有关这些模型的详细信息,请参阅 来自合作伙伴和社区的模型。
Cohere
Cohere 模型系列包括针对不同用例优化的各种模型,其中包括会话补全和嵌入。 Cohere 模型针对各种用例进行了优化,包括推理、总结和问答。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
Cohere-command-a | chat-completion | - 输入:文本(131,072 个标记) - 输出: 文本(8,182 个标记) - 语言: en 、、fr 、es 、it 、de pt-br 、ja 、ko 和 zh-cn ar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Cohere-command-r-plus-08-2024 | chat-completion | - 输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en 、、fr 、es 、it 、de pt-br 、ja 、ko 和 zh-cn ar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Cohere-command-r-08-2024 | chat-completion | - 输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en 、、fr 、es 、it 、de pt-br 、ja 、ko 和 zh-cn ar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
embed-v-4-0 | embeddings | - 输入: 文本(512 标记)和图像(2MM 像素) - 输出: 矢量 (256, 512, 1024, 1536 dim.) - 语言: en 、、fr 、es 、it 、de pt-br 、ja 、ko 和 zh-cn ar |
Foundry,基于中心的 |
Cohere-embed-v3-english | embeddings | - 输入: 文本和图像(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en |
Foundry,基于中心的 |
Cohere-embed-v3-multilingual | embeddings | - 输入:文本(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en 、、fr 、es 、it 、de pt-br 、ja 、ko 和 zh-cn ar |
Foundry,基于中心的 |
Cohere 重新排序
Model | 类型 | Capabilities | API 参考文档 | 项目类型 |
---|---|---|---|---|
Cohere-rerank-v3.5 | rerank 文本分类 |
- 输入: 文本 - 输出: 文本 - 语言: 英语、中文、法语、德语、印度尼西亚语、意大利语、葡萄牙语、俄语、西班牙语、阿拉伯语、荷兰语、印地语、日语、越南语 |
Cohere 的 v2/rerank API | 基于中心的 |
有关 Cohere 重新调整模型的定价的更多详细信息,请参阅 Cohere 重新调整模型的定价。
请参阅 Azure AI Foundry 门户中的 Cohere 模型集合。
Core42
Core42 包含阿拉伯语和英语的自回归双语 LLM,在阿拉伯语中具有最先进的功能。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
jais-30b-chat | chat-completion | - 输入:文本(8,192 个标记) - 输出:(4,096 个标记) - 语言:en 和 ar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Meta
Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 元模型的范围经过调整以包括:
- 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
- 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
- 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
Llama-3.2-11B-Vision-Instruct | chat-completion | - 输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言: en - 工具调用:无* - 响应格式:文本 |
Foundry,基于中心的 |
Llama-3.2-90B-Vision-Instruct | chat-completion | - 输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言: en - 工具调用:无* - 响应格式:文本 |
Foundry,基于中心的 |
Meta-Llama-3.1-405B-Instruct | chat-completion | - 输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言: en 、、de 、fr 、it pt 、hi 、和 es th - 工具调用:无* - 响应格式:文本 |
Foundry,基于中心的 |
Meta-Llama-3.1-8B-Instruct | chat-completion | - 输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言: en 、、de 、fr 、it pt 、hi 、和 es th - 工具调用:无* - 响应格式:文本 |
Foundry,基于中心的 |
Llama-4-Scout-17B-16E-Instruct | chat-completion | - 输入:文本和图像(128,000 个标记) - 输出:文本(8,192 个标记) - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。 还有几种 Meta 模型可作为产品由 Azure 直接销售。
Microsoft
Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
Phi-4-mini-instruct | chat-completion | - 输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言: ar 、zh 、cs 、da 、nl 、en 、fi 、fr 、de 、he 、hu 、it 、ja 、ko 、no 、pl 、pt 、ru 、es 、sv 、th 、tr 和uk - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
Phi-4-multimodal-instruct | chat-completion | - 输入: 文本、图像和音频(131,072 个标记) - 输出:(4,096 个标记) - 语言: ar 、zh 、cs 、da 、nl 、en 、fi 、fr 、de 、he 、hu 、it 、ja 、ko 、no 、pl 、pt 、ru 、es 、sv 、th 、tr 和uk - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
Phi-4 | chat-completion | - 输入:文本(16,384 个标记) - 输出:(16,384 个标记) - 语言: en 、ar 、bn 、cs 、da 、de 、el 、es 、fa 、fi 、fr 、gu 、ha 、he 、hi 、hu 、id 、it 、ja 、jv 、kn 、ko 、ml 、mr 、nl 、no 、or 、pa 、pl 、ps 、pt 、ro 、ru 、sv 、sw 、ta 、te 、th 、tl 、tr 、uk 、ur 、vi 、yo 、及zh - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
Phi-4-reasoning | 使用推理内容的聊天补全 | - 输入: 文本(32,768 个标记) - 输出: 文本(32,768 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
Phi-4-mini-reasoning | 使用推理内容的聊天补全 | - 输入:文本(128,000 个标记) - 输出: 文本(128,000 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的Microsoft模型集合。 还有 Microsoft 模型,作为 Azure 直售模型提供。
Mistral人工智能
Mistral AI 提供两类模型:高级模型(如 Mistral Large 2411 和 Ministral 3B),以及 Mistral Nemo 等开放模型。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
Codestral-2501 | chat-completion | - 输入:文本(262,144 个标记) - 输出:文本(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
Ministral-3B | chat-completion | - 输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Mistral-Nemo | chat-completion | - 输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en 、、fr 、de es it zh ja ko pt 、和 nl pl - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Mistral-small-2503 | chat-completion | - 输入: 文本(32,768 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Mistral-medium-2505 | chat-completion | - 输入: 文本(128,000 个标记),图像 - 输出: 文本(128,000 个标记) - 工具调用:无 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Mistral-Large-2411 | chat-completion | - 输入:文本(128,000 个标记) - 输出:文本(4,096 个标记) - 语言: en 、、fr 、de es it zh ja ko pt 、和 nl pl - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
Mistral-OCR-2503 | 图像到文本 | - 输入: 图像或 PDF 页面(1,000 页,最大 50MB PDF 文件) - 输出: 文本 - 工具调用:无 - 响应格式: 文本、JSON、Markdown |
基于枢纽的 |
mistralai-Mistral-7B-Instruct-v01 | chat-completion | - 输入: 文本 - 输出: 文本 - 语言:en - 响应格式:文本 |
基于中心的 |
mistralai-Mistral-7B-Instruct-v0-2 | chat-completion | - 输入: 文本 - 输出: 文本 - 语言:en - 响应格式:文本 |
基于中心的 |
mistralai-Mixtral-8x7B-Instruct-v01 | chat-completion | - 输入: 文本 - 输出: 文本 - 语言:en - 响应格式:文本 |
基于中心的 |
mistralai-Mixtral-8x22B-Instruct-v0-1 | chat-completion | - 输入: 文本(64,000 个标记) - 输出:文本(4,096 个标记) - 语言: fr、it、de、es、en - 响应格式:文本 |
基于集线器的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Nixtla
Nixtla 的 TimeGEN-1 是用于时序数据的生成式预训练预测模型和异常检测模型。 TimeGEN-1 可以在不训练的情况下为新的时序生成准确的预测,仅使用历史值和外生协变量作为输入。
若要执行推理,TimeGEN-1 要求使用 Nixtla 的自定义推理 API。
Model | 类型 | Capabilities | 推理 API | 项目类型 |
---|---|---|---|---|
TimeGEN-1 | Forecasting | - 输入: 时序数据作为 JSON 或数据帧(支持多变量输入) - 输出: 时序数据作为 JSON - 工具调用:无 - 响应格式: JSON |
预测客户端与 Nixtla 的 API 交互 | 基于集线器的 |
有关 Nixtla 模型的定价的更多详细信息,请参阅 Nixtla。
NTT 数据
tsuzumi 是自动回归语言优化转换器。 优化版本使用监督式微调(SFT)。 tsuzumi 可以高效地处理日语和英语。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
tsuzumi-7b | chat-completion | - 输入:文本(8,192 个标记) - 输出:文本(8,192 个标记) - 语言: en 和 jp - 工具调用:无 - 响应格式:文本 |
基于枢纽的 |
稳定性 AI
稳定性AI的图像生成模型集合包括Stable Image Core、Stable Image Ultra和Stable Diffusion 3.5 Large。 Stable Diffusion 3.5 Large 允许图像和文本输入。
Model | 类型 | Capabilities | 项目类型 |
---|---|---|---|
稳定扩散 3.5 大型版 | 图像生成 | - 输入: 文本和图像(1,000 个令牌和 1 个图像) - 输出: 一个图像 - 工具调用:无 - 响应格式:图像(PNG 和 JPG) |
基于中心的 |
稳定映像核心 | 图像生成 | - 输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
基于中心的 |
超稳图像 | 图像生成 | - 输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
中心化的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
打开和自定义模型
模型目录提供更丰富的模型选择,来自更多样的提供商。 对于这些模型,不能将选项用于 Azure AI Foundry 资源中的标准部署,其中模型以 API 的形式提供;相反,若要部署这些模型,可能需要将它们托管在基础结构上,创建 AI 中心,并提供基础计算配额来托管模型。
此外,这些模型可以开放访问或 IP 保护。 在这两种情况下,必须在 Azure AI Foundry 的托管计算产品/服务中部署它们。 若要开始,请参阅 操作指南:部署到托管计算。