你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

导入与 OpenAI 兼容的 Google Gemini API

适用于：所有 API 管理层级

本文介绍如何导入与 OpenAI 兼容的 Google Gemini API 以访问模型，例如 gemini-2.0-flash。对于这些模型，Azure API 管理可以管理与 OpenAI 兼容的聊天完成终结点。

详细了解如何在 API 管理中管理 AI API：

先决条件

API 管理创建 API 并配置以下内容：

导入 API 后，可以测试 API 的聊天完成终结点。

选择在上一步中创建的 API。
选择“测试”选项卡。
选择 POST Creates a model response for the given chat conversation 操作，这是向 /chat/completions 端点发出的 POST 请求。
在 “请求正文 ”部分中，输入以下 JSON 以指定模型和示例提示。在此示例中使用了gemini-2.0-flash模型。
```
{
    "model": "gemini-2.0-flash",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant"
        },
        {
            "role": "user",
            "content": "How are you?"
        }
    ],
    "max_tokens": 50
}
```
当测试成功时，后端会使用成功的 HTTP 响应代码和某些数据进行响应。追加到响应中是令牌使用情况数据，可帮助你监视和管理语言模型令牌消耗。