你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

铸造厂模型和功能

2025-08-08

借助 Azure AI Foundry 模型，可以访问 Azure AI Foundry 中的旗舰模型，以将其用作具有灵活部署选项的 API。本文列出了一系列模型产品/服务及其功能，不包括已弃用和旧模型。

根据你在 Azure AI Foundry 中使用的项目类型，你可能会看到这些模型的不同选择。具体而言，如果使用基于 Azure AI Foundry 资源构建的 Foundry 项目，则会看到可用于标准部署到 Foundry 资源的模型。或者，如果使用由 Azure AI Foundry 中心托管的基于中心的项目，则会看到可用于部署到托管计算和无服务器 API 的模型。许多情况下，这些模型选择确实重叠，因为许多模型支持多个部署选项。

模型目录中的 Foundry 模型属于两个主要类别：

由 Azure 直接销售的模型
来自合作伙伴和社区的模型

由 Azure 直接销售的模型

由 Azure 直接销售的模型包括所有 Azure OpenAI 模型和来自顶级提供商的特定所选模型。若要了解有关这些模型的详细信息，请参阅 Azure 直接销售的模型。

Azure OpenAI

Azure AI Foundry Models 中的 Azure OpenAI 提供了一组具有不同功能和价位的不同模型。在 Azure OpenAI 模型可用性中了解更多详细信息。这些模型包括：

为处理推理任务和问题解决任务设计的最先进的模型，具有更好的针对性和功能
可以理解和生成自然语言和代码的模型
可以将语音听录和翻译为文本的模型

Models	Description
gpt-oss	开放式权重推理模型
codex-mini	微调版本的 o4-mini。
GPT-4.1 系列	Azure OpenAI 的最新模型版本。
model-router	从一组基础聊天模型中智能选择以响应给定提示的模型。
computer-use-preview	一个经过训练的实验模型，可与响应 API 计算机使用工具一起使用。
o 系列模型	具有高级问题解决能力、增强的专注力和功能的推理模型。
GPT-4o、GPT-4o mini 和 GPT-4 Turbo	具有多模式版本的最新支持 Azure OpenAI 模型，可以接受文本和图像作为输入。
GPT-4	一组在 GPT-3.5 的基础上进行了改进的模型，可以理解并生成自然语言和代码。
GPT-3.5	一组在 GPT-3 的基础上进行了改进的模型，可以理解并生成自然语言和代码。
Embeddings	一组模型，可将文本转换为数字矢量形式，以提高文本相似性。
图像生成	一系列可从自然语言生成原始图像的模型。
Audio	语音转文本、翻译和文本转语音的一系列模型。 GPT-4o 音频模型支持低延迟语音输入、语音输出对话交互或音频生成。

请参阅 Azure AI Foundry 门户中的此模型集合。

黑森林实验室的模型由 Azure 直接销售

图像生成模型的黑林实验室集合包括用于上下文生成和编辑的 FLUX.1 Kontext [pro]，以及用于文本到图像生成的 FLUX1.1 [pro]。

Model	类型	Capabilities	项目类型
FLUX.1-Kontext-pro	图像生成	- 输入：文本和图像（5000 个标记和 1 个图像） - 输出：一个图像 - 工具调用：无 - 响应格式：图像（PNG 和 JPG）	Foundry，基于中心的
FLUX-1.1-pro	图像生成	- 输入：文本（5000 个标记） - 输出：一个图像 - 工具调用：无 - 响应格式：图像（PNG 和 JPG）	基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合。

DeepSeek 模型直接由 Azure 销售

DeepSeek 系列模型包括 DeepSeek-R1，它擅长使用分步训练过程（如语言、科学推理和编码任务）来推理任务。

Model	类型	Capabilities	项目类型
DeepSeek-R1-0528	chat-completion （具有推理内容）	- 输入：文本（163,840 个标记） - 输出：（163,840 个标记） - 语言：`en` 和 `zh` - 工具调用：无 - 响应格式：文本。	Foundry，基于中心的
DeepSeek-V3-0324	chat-completion	- 输入：文本（131,072 个标记） - 输出：（131,072 个令牌） - 语言：`en` 和 `zh` - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
DeepSeek-R1	chat-completion （具有推理内容）	- 输入：文本（163,840 个标记） - 输出：（163,840 个标记） - 语言：`en` 和 `zh` - 工具调用：无 - 响应格式：文本。	Foundry，基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合。

Azure 直售元模型

Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。元模型的范围经过调整以包括：

小型语言模型 (SLM)，如 1B 和 3B Base 模型，以及用于设备和边缘推理的 Instruct 模型
中等大型语言模型 (LLM)，如 7B、8B 和 70B Base 模型和 Instruct 模型
高性能模型（如 Meta Llama 3.1-405B Instruct），用于合成数据生成和蒸馏用例。

Model	类型	Capabilities	项目类型
Llama-4-Maverick-17B-128E-Instruct-FP8	chat-completion	- 输入：文本和图像（1M 个标记） - 输出：文本（1M 词元） - 语言：`ar`、、`en`、`fr`和 `dehiiditptestlthvi` - 工具调用：无* - 响应格式：文本	Foundry，基于中心的
Llama-3.3-70B-Instruct	chat-completion	- 输入：文本（128,000 个标记） - 输出：文本（8,192 个标记） - 语言：`en`、、`de`、`fr`、`itpt`、`hi`、和 `esth` - 工具调用：无* - 响应格式：文本	Foundry，基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合。合作伙伴和社区也提供了多个 Meta 模型。

Azure 直售 Microsoft 模型

Microsoft模型包括各种模型组，例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。若要查看所有可用的Microsoft模型，请查看 Azure AI Foundry 门户中的Microsoft模型集合。

Model	类型	Capabilities	项目类型
MAI-DS-R1	chat-completion （具有推理内容）	- 输入：文本（163,840 个标记） - 输出：（163,840 个标记） - 语言：`en` 和 `zh` - 工具调用：无 - 响应格式：文本。	Foundry，基于中心的

请参阅 Azure AI Foundry 门户中的Microsoft模型集合。合作伙伴和社区还提供了多个Microsoft模型。

xAI 模型直接由 Azure 销售

xAI 的 Grok 3 和 Grok 3 微型模型设计为在各种企业领域表现出色。 Grok 3 是由 Colossus 数据中心预先训练的非推理模型，专为业务用例（如数据提取、编码和文本摘要）而定制，具有卓越的指令遵循能力。它支持 131,072 令牌上下文窗口，允许它处理广泛的输入，同时保持一致性和深度，并且善于跨域和语言绘制连接。另一方面，Grok 3 Mini 是一种轻型推理模型，旨在解决测试时计算的代理、编码、数学和深层科学问题。它还支持一个 131,072 个令牌的上下文窗口，用于理解代码库和企业文档，并擅长使用工具解决新环境中的复杂逻辑问题，为思维预算可调整的用户检查提供原始推理跟踪。

Model	类型	Capabilities	项目类型
grok-3¹	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（131,072 个标记） - 语言：`en` - 工具调用：是 - 响应格式：文本	Foundry，基于中心的
grok-3-mini¹	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（131,072 个标记） - 语言：`en` - 工具调用：是 - 响应格式：文本	Foundry，基于中心的

请参阅 Azure AI Foundry 门户中的 xAI 模型集合。

来自合作伙伴和社区的模型

来自合作伙伴和社区的模型构成了大多数 Azure AI Foundry 模型，并由受信任的第三方组织、合作伙伴、研究实验室和社区参与者提供。若要了解有关这些模型的详细信息，请参阅来自合作伙伴和社区的模型。

Cohere

Cohere 模型系列包括针对不同用例优化的各种模型，其中包括会话补全和嵌入。 Cohere 模型针对各种用例进行了优化，包括推理、总结和问答。

Model	类型	Capabilities	项目类型
Cohere-command-a	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（8,182 个标记） - 语言：`en`、、`fr`、`es`、`it`、`dept-br`、`ja`、`ko`和 `zh-cnar` - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
Cohere-command-r-plus-08-2024	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（4,096 个标记） - 语言：`en`、、`fr`、`es`、`it`、`dept-br`、`ja`、`ko`和 `zh-cnar` - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
Cohere-command-r-08-2024	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（4,096 个标记） - 语言：`en`、、`fr`、`es`、`it`、`dept-br`、`ja`、`ko`和 `zh-cnar` - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
embed-v-4-0	embeddings	- 输入：文本（512 标记）和图像（2MM 像素） - 输出：矢量（256， 512， 1024， 1536 dim.） - 语言：`en`、、`fr`、`es`、`it`、`dept-br`、`ja`、`ko`和 `zh-cnar`	Foundry，基于中心的
Cohere-embed-v3-english	embeddings	- 输入：文本和图像（512 个标记） - 输出：矢量（1024 dim.） - 语言：`en`	Foundry，基于中心的
Cohere-embed-v3-multilingual	embeddings	- 输入：文本（512 个标记） - 输出：矢量（1024 dim.） - 语言：`en`、、`fr`、`es`、`it`、`dept-br`、`ja`、`ko`和 `zh-cnar`	Foundry，基于中心的

Cohere 重新排序

Model	类型	Capabilities	API 参考文档	项目类型
Cohere-rerank-v3.5	rerank 文本分类	- 输入：文本 - 输出：文本 - 语言：英语、中文、法语、德语、印度尼西亚语、意大利语、葡萄牙语、俄语、西班牙语、阿拉伯语、荷兰语、印地语、日语、越南语	Cohere 的 v2/rerank API	基于中心的

有关 Cohere 重新调整模型的定价的更多详细信息，请参阅 Cohere 重新调整模型的定价。

请参阅 Azure AI Foundry 门户中的 Cohere 模型集合。

Core42

Core42 包含阿拉伯语和英语的自回归双语 LLM，在阿拉伯语中具有最先进的功能。

Model	类型	Capabilities	项目类型
jais-30b-chat	chat-completion	- 输入：文本（8,192 个标记） - 输出：（4,096 个标记） - 语言：en 和 ar - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合。

Model	类型	Capabilities	项目类型
Llama-3.2-11B-Vision-Instruct	chat-completion	- 输入：文本和图像（128,000 个标记） - 输出：（8,192 个标记） - 语言：`en` - 工具调用：无* - 响应格式：文本	Foundry，基于中心的
Llama-3.2-90B-Vision-Instruct	chat-completion	- 输入：文本和图像（128,000 个标记） - 输出：（8,192 个标记） - 语言：`en` - 工具调用：无* - 响应格式：文本	Foundry，基于中心的
Meta-Llama-3.1-405B-Instruct	chat-completion	- 输入：文本（131,072 个标记） - 输出：（8,192 个标记） - 语言：`en`、、`de`、`fr`、`itpt`、`hi`、和 `esth` - 工具调用：无* - 响应格式：文本	Foundry，基于中心的
Meta-Llama-3.1-8B-Instruct	chat-completion	- 输入：文本（131,072 个标记） - 输出：（8,192 个标记） - 语言：`en`、、`de`、`fr`、`itpt`、`hi`、和 `esth` - 工具调用：无* - 响应格式：文本	Foundry，基于中心的
Llama-4-Scout-17B-16E-Instruct	chat-completion	- 输入：文本和图像（128,000 个标记） - 输出：文本（8,192 个标记） - 工具调用：无 - 响应格式：文本	Foundry，基于中心的

Microsoft

Model	类型	Capabilities	项目类型
Phi-4-mini-instruct	chat-completion	- 输入：文本（131,072 个标记） - 输出：（4,096 个标记） - 语言：`ar`、`zh`、`cs`、`da`、`nl`、`en`、`fi`、`fr`、`de`、`he`、`hu`、`it`、`ja`、`ko`、`no`、`pl`、`pt`、`ru`、`es`、`sv`、`th`、`tr`和`uk` - 工具调用：无 - 响应格式：文本	Foundry，基于中心的
Phi-4-multimodal-instruct	chat-completion	- 输入：文本、图像和音频（131,072 个标记） - 输出：（4,096 个标记） - 语言：`ar`、`zh`、`cs`、`da`、`nl`、`en`、`fi`、`fr`、`de`、`he`、`hu`、`it`、`ja`、`ko`、`no`、`pl`、`pt`、`ru`、`es`、`sv`、`th`、`tr`和`uk` - 工具调用：无 - 响应格式：文本	Foundry，基于中心的
Phi-4	chat-completion	- 输入：文本（16,384 个标记） - 输出：（16,384 个标记） - 语言：`en`、`ar`、`bn`、`cs`、`da`、`de`、`el`、`es`、`fa`、`fi`、`fr`、`gu`、`ha`、`he`、`hi`、`hu`、`id`、`it`、`ja`、`jv`、`kn`、`ko`、`ml`、`mr`、`nl`、`no`、`or`、`pa`、`pl`、`ps`、`pt`、`ro`、`ru`、`sv`、`sw`、`ta`、`te`、`th`、`tl`、`tr`、`uk`、`ur`、`vi`、`yo`、及`zh` - 工具调用：无 - 响应格式：文本	Foundry，基于中心的
Phi-4-reasoning	使用推理内容的聊天补全	- 输入：文本（32,768 个标记） - 输出：文本（32,768 个标记） - 语言：`en` - 工具调用：无 - 响应格式：文本	Foundry，基于中心的
Phi-4-mini-reasoning	使用推理内容的聊天补全	- 输入：文本（128,000 个标记） - 输出：文本（128,000 个标记） - 语言：`en` - 工具调用：无 - 响应格式：文本	Foundry，基于中心的

请参阅 Azure AI Foundry 门户中的Microsoft模型集合。还有 Microsoft 模型，作为 Azure 直售模型提供。

Mistral人工智能

Mistral AI 提供两类模型：高级模型（如 Mistral Large 2411 和 Ministral 3B），以及 Mistral Nemo 等开放模型。

Model	类型	Capabilities	项目类型
Codestral-2501	chat-completion	- 输入：文本（262,144 个标记） - 输出：文本（4,096 个标记） - 语言：en - 工具调用：无 - 响应格式：文本	Foundry，基于中心的
Ministral-3B	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（4,096 个标记） - 语言：fr、de、es、it、en - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
Mistral-Nemo	chat-completion	- 输入：文本（131,072 个标记） - 输出：文本（4,096 个标记） - 语言：`en`、、`fr`、`deesitzhjakopt`、和 `nlpl` - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
Mistral-small-2503	chat-completion	- 输入：文本（32,768 个标记） - 输出：文本（4,096 个标记） - 语言：fr、de、es、it、en - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
Mistral-medium-2505	chat-completion	- 输入：文本（128,000 个标记），图像 - 输出：文本（128,000 个标记） - 工具调用：无 - 响应格式：文本、JSON	Foundry，基于中心的
Mistral-Large-2411	chat-completion	- 输入：文本（128,000 个标记） - 输出：文本（4,096 个标记） - 语言：`en`、、`fr`、`deesitzhjakopt`、和 `nlpl` - 工具调用：是的 - 响应格式：文本、JSON	Foundry，基于中心的
Mistral-OCR-2503	图像到文本	- 输入：图像或 PDF 页面（1,000 页，最大 50MB PDF 文件） - 输出：文本 - 工具调用：无 - 响应格式：文本、JSON、Markdown	基于枢纽的
mistralai-Mistral-7B-Instruct-v01	chat-completion	- 输入：文本 - 输出：文本 - 语言：en - 响应格式：文本	基于中心的
mistralai-Mistral-7B-Instruct-v0-2	chat-completion	- 输入：文本 - 输出：文本 - 语言：en - 响应格式：文本	基于中心的
mistralai-Mixtral-8x7B-Instruct-v01	chat-completion	- 输入：文本 - 输出：文本 - 语言：en - 响应格式：文本	基于中心的
mistralai-Mixtral-8x22B-Instruct-v0-1	chat-completion	- 输入：文本（64,000 个标记） - 输出：文本（4,096 个标记） - 语言： fr、it、de、es、en - 响应格式：文本	基于集线器的

请参阅 Azure AI Foundry 门户中的此模型集合。

Nixtla

Nixtla 的 TimeGEN-1 是用于时序数据的生成式预训练预测模型和异常检测模型。 TimeGEN-1 可以在不训练的情况下为新的时序生成准确的预测，仅使用历史值和外生协变量作为输入。

若要执行推理，TimeGEN-1 要求使用 Nixtla 的自定义推理 API。

Model	类型	Capabilities	推理 API	项目类型
TimeGEN-1	Forecasting	- 输入：时序数据作为 JSON 或数据帧（支持多变量输入） - 输出：时序数据作为 JSON - 工具调用：无 - 响应格式： JSON	预测客户端与 Nixtla 的 API 交互	基于集线器的

有关 Nixtla 模型的定价的更多详细信息，请参阅 Nixtla。

NTT 数据

tsuzumi 是自动回归语言优化转换器。优化版本使用监督式微调(SFT)。 tsuzumi 可以高效地处理日语和英语。

Model	类型	Capabilities	项目类型
tsuzumi-7b	chat-completion	- 输入：文本（8,192 个标记） - 输出：文本（8,192 个标记） - 语言：`en` 和 `jp` - 工具调用：无 - 响应格式：文本	基于枢纽的

稳定性 AI

稳定性AI的图像生成模型集合包括Stable Image Core、Stable Image Ultra和Stable Diffusion 3.5 Large。 Stable Diffusion 3.5 Large 允许图像和文本输入。

Model	类型	Capabilities	项目类型
稳定扩散 3.5 大型版	图像生成	- 输入：文本和图像（1,000 个令牌和 1 个图像） - 输出：一个图像 - 工具调用：无 - 响应格式：图像（PNG 和 JPG）	基于中心的
稳定映像核心	图像生成	- 输入：文本（1,000 个词元） - 输出：一个图像 - 工具调用：无 - 响应格式：图像（PNG 和 JPG）	基于中心的
超稳图像	图像生成	- 输入：文本（1,000 个词元） - 输出：一个图像 - 工具调用：无 - 响应格式：图像（PNG 和 JPG）	中心化的

请参阅 Azure AI Foundry 门户中的此模型集合。

打开和自定义模型

模型目录提供更丰富的模型选择，来自更多样的提供商。对于这些模型，不能将选项用于 Azure AI Foundry 资源中的标准部署，其中模型以 API 的形式提供;相反，若要部署这些模型，可能需要将它们托管在基础结构上，创建 AI 中心，并提供基础计算配额来托管模型。

此外，这些模型可以开放访问或 IP 保护。在这两种情况下，必须在 Azure AI Foundry 的托管计算产品/服务中部署它们。若要开始，请参阅操作指南：部署到托管计算。

通过

铸造厂模型和功能

由 Azure 直接销售的模型

Azure OpenAI

黑森林实验室的模型由 Azure 直接销售

DeepSeek 模型直接由 Azure 销售

Azure 直售元模型

Azure 直售 Microsoft 模型

xAI 模型直接由 Azure 销售

来自合作伙伴和社区的模型

Cohere

Cohere 重新排序

Core42

Meta

Microsoft

Mistral人工智能

Nixtla

NTT 数据

稳定性 AI

打开和自定义模型

相关内容

反馈

其他资源