你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

铸造厂模型和功能

借助 Azure AI Foundry 模型,可以访问 Azure AI Foundry 中的旗舰模型,以将其用作具有灵活部署选项的 API。 本文列出了一系列模型产品/服务及其功能,不包括 已弃用和旧模型

根据你在 Azure AI Foundry 中使用 的项目类型 ,你可能会看到这些模型的不同选择。 具体而言,如果使用基于 Azure AI Foundry 资源构建的 Foundry 项目,则会看到可用于标准部署到 Foundry 资源的模型。 或者,如果使用由 Azure AI Foundry 中心托管的基于中心的项目,则会看到可用于部署到托管计算和无服务器 API 的模型。 许多情况下,这些模型选择确实重叠,因为许多模型支持多个 部署选项

模型目录中的 Foundry 模型属于两个主要类别:

由 Azure 直接销售的模型

由 Azure 直接销售的模型包括所有 Azure OpenAI 模型和来自顶级提供商的特定所选模型。 若要了解有关这些模型的详细信息,请参阅 Azure 直接销售的模型

Azure OpenAI

Azure AI Foundry Models 中的 Azure OpenAI 提供了一组具有不同功能和价位的不同模型。 在 Azure OpenAI 模型可用性中了解更多详细信息。 这些模型包括:

  • 为处理推理任务和问题解决任务设计的最先进的模型,具有更好的针对性和功能
  • 可以理解和生成自然语言和代码的模型
  • 可以将语音听录和翻译为文本的模型
Models Description
gpt-oss 开放式权重推理模型
codex-mini 微调版本的 o4-mini。
GPT-4.1 系列 Azure OpenAI 的最新模型版本。
model-router 从一组基础聊天模型中智能选择以响应给定提示的模型。
computer-use-preview 一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。
o 系列模型 具有高级问题解决能力、增强的专注力和功能的推理模型
GPT-4o、GPT-4o mini 和 GPT-4 Turbo 具有多模式版本的最新支持 Azure OpenAI 模型,可以接受文本和图像作为输入。
GPT-4 一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
GPT-3.5 一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
Embeddings 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。
图像生成 一系列可从自然语言生成原始图像的模型。
Audio 语音转文本、翻译和文本转语音的一系列模型。 GPT-4o 音频模型支持低延迟 语音输入、语音输出 对话交互或音频生成。

请参阅 Azure AI Foundry 门户中的此模型集合

黑森林实验室的模型由 Azure 直接销售

图像生成模型的黑林实验室集合包括用于上下文生成和编辑的 FLUX.1 Kontext [pro],以及用于文本到图像生成的 FLUX1.1 [pro]。

Model 类型 Capabilities 项目类型
FLUX.1-Kontext-pro 图像生成 - 输入: 文本和图像(5000 个标记和 1 个图像)
- 输出: 一个图像
- 工具调用:
- 响应格式:图像(PNG 和 JPG)
Foundry,基于中心的
FLUX-1.1-pro 图像生成 - 输入: 文本(5000 个标记)
- 输出: 一个图像
- 工具调用:
- 响应格式: 图像(PNG 和 JPG)
基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合

DeepSeek 模型直接由 Azure 销售

DeepSeek 系列模型包括 DeepSeek-R1,它擅长使用分步训练过程(如语言、科学推理和编码任务)来推理任务。

Model 类型 Capabilities 项目类型
DeepSeek-R1-0528 chat-completion
(具有推理内容)
- 输入: 文本(163,840 个标记)
- 输出:(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本。
Foundry,基于中心的
DeepSeek-V3-0324 chat-completion - 输入:文本(131,072 个标记)
- 输出: (131,072 个令牌)
- 语言:enzh
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
DeepSeek-R1 chat-completion
(具有推理内容)
- 输入: 文本(163,840 个标记)
- 输出:(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本。
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合

Azure 直售元模型

Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 元模型的范围经过调整以包括:

  • 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
  • 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
  • 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
Model 类型 Capabilities 项目类型
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - 输入:文本和图像(1M 个标记)
- 输出: 文本(1M 词元)
- 语言:ar、、enfrdehiiditptestlthvi
- 工具调用:无*
- 响应格式:文本
Foundry,基于中心的
Llama-3.3-70B-Instruct chat-completion - 输入:文本(128,000 个标记)
- 输出:文本(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合。 合作伙伴 和社区也提供了多个 Meta 模型。

Azure 直售 Microsoft 模型

Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合

Model 类型 Capabilities 项目类型
MAI-DS-R1 chat-completion
(具有推理内容)
- 输入: 文本(163,840 个标记)
- 输出:(163,840 个标记)
- 语言:enzh
- 工具调用:
- 响应格式:文本。
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的Microsoft模型集合。 合作伙伴 和社区还提供了多个Microsoft模型。

xAI 模型直接由 Azure 销售

xAI 的 Grok 3 和 Grok 3 微型模型设计为在各种企业领域表现出色。 Grok 3 是由 Colossus 数据中心预先训练的非推理模型,专为业务用例(如数据提取、编码和文本摘要)而定制,具有卓越的指令遵循能力。 它支持 131,072 令牌上下文窗口,允许它处理广泛的输入,同时保持一致性和深度,并且善于跨域和语言绘制连接。 另一方面,Grok 3 Mini 是一种轻型推理模型,旨在解决测试时计算的代理、编码、数学和深层科学问题。 它还支持一个 131,072 个令牌的上下文窗口,用于理解代码库和企业文档,并擅长使用工具解决新环境中的复杂逻辑问题,为思维预算可调整的用户检查提供原始推理跟踪。

Model 类型 Capabilities 项目类型
grok-31 chat-completion - 输入:文本(131,072 个标记)
- 输出: 文本(131,072 个标记)
- 语言:en
- 工具调用:
- 响应格式: 文本
Foundry,基于中心的
grok-3-mini1 chat-completion - 输入:文本(131,072 个标记)
- 输出: 文本(131,072 个标记)
- 语言:en
- 工具调用:
- 响应格式: 文本
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的 xAI 模型集合

来自合作伙伴和社区的模型

来自合作伙伴和社区的模型构成了大多数 Azure AI Foundry 模型,并由受信任的第三方组织、合作伙伴、研究实验室和社区参与者提供。 若要了解有关这些模型的详细信息,请参阅 来自合作伙伴和社区的模型

Cohere

Cohere 模型系列包括针对不同用例优化的各种模型,其中包括会话补全和嵌入。 Cohere 模型针对各种用例进行了优化,包括推理、总结和问答。

Model 类型 Capabilities 项目类型
Cohere-command-a chat-completion - 输入:文本(131,072 个标记)
- 输出: 文本(8,182 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
Cohere-command-r-plus-08-2024 chat-completion - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
Cohere-command-r-08-2024 chat-completion - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:en、、fresitdept-brjakozh-cnar
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
embed-v-4-0 embeddings - 输入: 文本(512 标记)和图像(2MM 像素)
- 输出: 矢量 (256, 512, 1024, 1536 dim.)
- 语言:en、、fresitdept-brjakozh-cnar
Foundry,基于中心的
Cohere-embed-v3-english embeddings - 输入: 文本和图像(512 个标记)
- 输出: 矢量 (1024 dim.)
- 语言:en
Foundry,基于中心的
Cohere-embed-v3-multilingual embeddings - 输入:文本(512 个标记)
- 输出: 矢量 (1024 dim.)
- 语言:en、、fresitdept-brjakozh-cnar
Foundry,基于中心的

Cohere 重新排序

Model 类型 Capabilities API 参考文档 项目类型
Cohere-rerank-v3.5 rerank
文本分类
- 输入: 文本
- 输出: 文本
- 语言: 英语、中文、法语、德语、印度尼西亚语、意大利语、葡萄牙语、俄语、西班牙语、阿拉伯语、荷兰语、印地语、日语、越南语
Cohere 的 v2/rerank API 基于中心的

有关 Cohere 重新调整模型的定价的更多详细信息,请参阅 Cohere 重新调整模型的定价

请参阅 Azure AI Foundry 门户中的 Cohere 模型集合

Core42

Core42 包含阿拉伯语和英语的自回归双语 LLM,在阿拉伯语中具有最先进的功能。

Model 类型 Capabilities 项目类型
jais-30b-chat chat-completion - 输入:文本(8,192 个标记)
- 输出:(4,096 个标记)
- 语言:en 和 ar
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合

Meta

Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 元模型的范围经过调整以包括:

  • 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
  • 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
  • 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
Model 类型 Capabilities 项目类型
Llama-3.2-11B-Vision-Instruct chat-completion - 输入:文本和图像(128,000 个标记)
- 输出:(8,192 个标记)
- 语言:en
- 工具调用:无*
- 响应格式:文本
Foundry,基于中心的
Llama-3.2-90B-Vision-Instruct chat-completion - 输入:文本和图像(128,000 个标记)
- 输出:(8,192 个标记)
- 语言:en
- 工具调用:无*
- 响应格式:文本
Foundry,基于中心的
Meta-Llama-3.1-405B-Instruct chat-completion - 输入:文本(131,072 个标记)
- 输出:(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本
Foundry,基于中心的
Meta-Llama-3.1-8B-Instruct chat-completion - 输入:文本(131,072 个标记)
- 输出:(8,192 个标记)
- 语言:en、、defritpthi、和 esth
- 工具调用:无*
- 响应格式:文本
Foundry,基于中心的
Llama-4-Scout-17B-16E-Instruct chat-completion - 输入:文本和图像(128,000 个标记)
- 输出:文本(8,192 个标记)
- 工具调用:
- 响应格式:文本
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的此模型集合。 还有几种 Meta 模型可作为产品由 Azure 直接销售。

Microsoft

Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合

Model 类型 Capabilities 项目类型
Phi-4-mini-instruct chat-completion - 输入:文本(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:arzhcsdanlenfifrdehehuitjakonoplptruessvthtruk
- 工具调用:
- 响应格式:文本
Foundry,基于中心的
Phi-4-multimodal-instruct chat-completion - 输入: 文本、图像和音频(131,072 个标记)
- 输出:(4,096 个标记)
- 语言:arzhcsdanlenfifrdehehuitjakonoplptruessvthtruk
- 工具调用:
- 响应格式:文本
Foundry,基于中心的
Phi-4 chat-completion - 输入:文本(16,384 个标记)
- 输出:(16,384 个标记)
- 语言:enarbncsdadeelesfafifrguhahehihuiditjajvknkomlmrnlnoorpaplpsptrorusvswtatethtltrukurviyo、及zh
- 工具调用:
- 响应格式:文本
Foundry,基于中心的
Phi-4-reasoning 使用推理内容的聊天补全 - 输入: 文本(32,768 个标记)
- 输出: 文本(32,768 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Foundry,基于中心的
Phi-4-mini-reasoning 使用推理内容的聊天补全 - 输入:文本(128,000 个标记)
- 输出: 文本(128,000 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Foundry,基于中心的

请参阅 Azure AI Foundry 门户中的Microsoft模型集合。 还有 Microsoft 模型,作为 Azure 直售模型提供。

Mistral人工智能

Mistral AI 提供两类模型:高级模型(如 Mistral Large 2411 和 Ministral 3B),以及 Mistral Nemo 等开放模型。

Model 类型 Capabilities 项目类型
Codestral-2501 chat-completion - 输入:文本(262,144 个标记)
- 输出:文本(4,096 个标记)
- 语言:en
- 工具调用:
- 响应格式:文本
Foundry,基于中心的
Ministral-3B chat-completion - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:fr、de、es、it、en
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
Mistral-Nemo chat-completion - 输入:文本(131,072 个标记)
- 输出:文本(4,096 个标记)
- 语言:en、、frdeesitzhjakopt、和 nlpl
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
Mistral-small-2503 chat-completion - 输入: 文本(32,768 个标记)
- 输出:文本(4,096 个标记)
- 语言:fr、de、es、it、en
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
Mistral-medium-2505 chat-completion - 输入: 文本(128,000 个标记),图像
- 输出: 文本(128,000 个标记)
- 工具调用:
- 响应格式:文本、JSON
Foundry,基于中心的
Mistral-Large-2411 chat-completion - 输入:文本(128,000 个标记)
- 输出:文本(4,096 个标记)
- 语言:en、、frdeesitzhjakopt、和 nlpl
- 工具调用: 是的
- 响应格式:文本、JSON
Foundry,基于中心的
Mistral-OCR-2503 图像到文本 - 输入: 图像或 PDF 页面(1,000 页,最大 50MB PDF 文件)
- 输出: 文本
- 工具调用:
- 响应格式: 文本、JSON、Markdown
基于枢纽的
mistralai-Mistral-7B-Instruct-v01 chat-completion - 输入: 文本
- 输出: 文本
- 语言:en
- 响应格式:文本
基于中心的
mistralai-Mistral-7B-Instruct-v0-2 chat-completion - 输入: 文本
- 输出: 文本
- 语言:en
- 响应格式:文本
基于中心的
mistralai-Mixtral-8x7B-Instruct-v01 chat-completion - 输入: 文本
- 输出: 文本
- 语言:en
- 响应格式:文本
基于中心的
mistralai-Mixtral-8x22B-Instruct-v0-1 chat-completion - 输入: 文本(64,000 个标记)
- 输出:文本(4,096 个标记)
- 语言: fr、it、de、es、en
- 响应格式:文本
基于集线器的

请参阅 Azure AI Foundry 门户中的此模型集合

Nixtla

Nixtla 的 TimeGEN-1 是用于时序数据的生成式预训练预测模型和异常检测模型。 TimeGEN-1 可以在不训练的情况下为新的时序生成准确的预测,仅使用历史值和外生协变量作为输入。

若要执行推理,TimeGEN-1 要求使用 Nixtla 的自定义推理 API。

Model 类型 Capabilities 推理 API 项目类型
TimeGEN-1 Forecasting - 输入: 时序数据作为 JSON 或数据帧(支持多变量输入)
- 输出: 时序数据作为 JSON
- 工具调用:
- 响应格式: JSON
预测客户端与 Nixtla 的 API 交互 基于集线器的

有关 Nixtla 模型的定价的更多详细信息,请参阅 Nixtla

NTT 数据

tsuzumi 是自动回归语言优化转换器。 优化版本使用监督式微调(SFT)。 tsuzumi 可以高效地处理日语和英语。

Model 类型 Capabilities 项目类型
tsuzumi-7b chat-completion - 输入:文本(8,192 个标记)
- 输出:文本(8,192 个标记)
- 语言:enjp
- 工具调用:
- 响应格式:文本
基于枢纽的

稳定性 AI

稳定性AI的图像生成模型集合包括Stable Image Core、Stable Image Ultra和Stable Diffusion 3.5 Large。 Stable Diffusion 3.5 Large 允许图像和文本输入。

Model 类型 Capabilities 项目类型
稳定扩散 3.5 大型版 图像生成 - 输入: 文本和图像(1,000 个令牌和 1 个图像)
- 输出: 一个图像
- 工具调用:
- 响应格式:图像(PNG 和 JPG)
基于中心的
稳定映像核心 图像生成 - 输入: 文本(1,000 个词元)
- 输出: 一个图像
- 工具调用:
- 响应格式: 图像(PNG 和 JPG)
基于中心的
超稳图像 图像生成 - 输入: 文本(1,000 个词元)
- 输出: 一个图像
- 工具调用:
- 响应格式: 图像(PNG 和 JPG)
中心化的

请参阅 Azure AI Foundry 门户中的此模型集合

打开和自定义模型

模型目录提供更丰富的模型选择,来自更多样的提供商。 对于这些模型,不能将选项用于 Azure AI Foundry 资源中的标准部署,其中模型以 API 的形式提供;相反,若要部署这些模型,可能需要将它们托管在基础结构上,创建 AI 中心,并提供基础计算配额来托管模型。

此外,这些模型可以开放访问或 IP 保护。 在这两种情况下,必须在 Azure AI Foundry 的托管计算产品/服务中部署它们。 若要开始,请参阅 操作指南:部署到托管计算