Problemas ao usar modelos de IA

Question

Problemas ao usar modelos de IA

Manzoli, Vitor 0

Olá equipe Azure,

Estamos enfrentando dificuldades ao utilizar a API Azure OpenAI (deployment gpt-4o-mini), especificamente ao realizar chamadas chat.completions.parse com para outputs estruturados. O erro retornado é:

Error code: 400 - {'error': {'message': "The response was filtered due to the prompt triggering Azure OpenAI's content management policy. Please modify your prompt and retry.", 'code': 'content_filter', 'innererror': {'code': 'ResponsibleAIPolicyViolation', 'content_filter_result': {'jailbreak': {'filtered': True, 'detected': True}}}}

Contexto:

A utilização é profissional para um agente de atendimento de consórcios (empresa real, sem uso malicioso).

Os prompts são formulados de forma ética e segura, apenas para estruturar intenções do cliente em campos como "frustrado", "quer atendimento humano", "aceita oferta" etc.

O sistema trava com erros 400 mesmo em mensagens triviais como: "Quero iniciar o processo" ou "Estou com dúvida sobre o valor".

Fluxo de uso:

Primeiro coletamos histórico de chat do usuário.

Enviamos para a função complete_with_structured_outputs para classificar a intenção.

Utilizamos estrutura validada via Pydantic (UserIntent) para resposta programática segura.

Ambiente:

Azure OpenAI Service

Model: gpt-4o-mini

API Version: 2025-01-01-preview

Perguntas:

Como podemos minimizar esse tipo de bloqueio se nossa aplicação não tem fins de jailbreak ou uso inadequado?
Há alguma recomendação para alterar o conteúdo do prompt ou técnica para diminuir falsos positivos no filtro de "jailbreak"?

Anonymous

2025-04-30T10:17:19.58+00:00

Oi @Manzoli, Vitor

Para minimizar o bloqueio causado pelo filtro de conteúdo da Azure OpenAI em sua aplicação, especialmente se não há intenção de violar políticas ou uso inadequado, você pode considerar as seguintes recomendações:

Certifique-se de que os prompts formulados sejam éticos, seguros e não violem as políticas de conteúdo da Azure OpenAI. Evite termos sensíveis, inadequados ou que possam acionar o filtro de jailbreak.

Adicione mais contexto aos prompts para garantir que a intenção do cliente seja claramente compreendida pelo modelo de IA. Quanto mais informações relevantes forem fornecidas, menor a probabilidade de acionar falsos positivos no filtro de jailbreak.

Evite prompts muito semelhantes entre si. Tente variar as frases e estruturas utilizadas nos prompts para evitar padrões que possam ser interpretados erroneamente como conteúdo inadequado.

Espero que isso ajude você

Obrigado
Anonymous

2025-05-02T01:50:22.3766667+00:00

Oi @Manzoli, Vitor

Você teve alguma chance de verificar se a resposta acima foi útil.

Obrigado!
Anonymous

2025-05-06T09:48:26.5333333+00:00

Oi@Manzoli, Vitor

Você teve alguma chance de verificar se a resposta acima foi útil.

Obrigado!

Your answer

Anonymous

2025-04-30T10:17:19.58+00:00

Oi @Manzoli, Vitor

Para minimizar o bloqueio causado pelo filtro de conteúdo da Azure OpenAI em sua aplicação, especialmente se não há intenção de violar políticas ou uso inadequado, você pode considerar as seguintes recomendações:

Certifique-se de que os prompts formulados sejam éticos, seguros e não violem as políticas de conteúdo da Azure OpenAI. Evite termos sensíveis, inadequados ou que possam acionar o filtro de jailbreak.

Adicione mais contexto aos prompts para garantir que a intenção do cliente seja claramente compreendida pelo modelo de IA. Quanto mais informações relevantes forem fornecidas, menor a probabilidade de acionar falsos positivos no filtro de jailbreak.

Evite prompts muito semelhantes entre si. Tente variar as frases e estruturas utilizadas nos prompts para evitar padrões que possam ser interpretados erroneamente como conteúdo inadequado.

Espero que isso ajude você

Obrigado
Anonymous

2025-05-02T01:50:22.3766667+00:00

Oi @Manzoli, Vitor

Você teve alguma chance de verificar se a resposta acima foi útil.

Obrigado!
Anonymous

2025-05-06T09:48:26.5333333+00:00

Oi@Manzoli, Vitor

Você teve alguma chance de verificar se a resposta acima foi útil.

Obrigado!

Share via

Problemas ao usar modelos de IA

Your answer