Desenvolvimento de guardrails para controle e marcação de mensagens na interação de usuários em sistemas baseados em grandes modelos de linguagem
Palavras-chave:
guardrails, aprendizado de máquina, grandes modelos de linguagem, inteligência artificialResumo
Esta é uma pesquisa que faz parte de um trabalho de conclusão de curso do bacharelado em Sistemas de Informação do IFSC Câmpus Caçador. As soluções baseadas em inteligência artificial estão cada vez mais presentes, impactando diversos setores e gerando avanços significativos em várias áreas. A adoção crescente desses modelos requer a implementação de mecanismos que garantam a qualidade e a segurança das interações, especialmente em contextos sensíveis como o ambiente de cobrança, onde é essencial identificar conversas que não agregam valor ao negócio para evitar custos desnecessários para a empresa. Este trabalho tem como objetivo o desenvolvimento de guardrails para controle e marcação de mensagens enviadas por usuários durante interações em sistemas de cobrança baseados em grandes modelos de linguagem, os Large Language Models (LLMs). Para isso, propõe-se a criação de uma Interface de Programação de Aplicações (API), que utiliza técnicas de processamento de linguagem natural para analisar as mensagens. A API classifica e marca interações que apresentem padrões de comportamento prejudiciais, permitindo respostas rápidas das equipes de cobrança e a criação de datasets mais precisos. A implementação dos guardrails, ao focar nas mensagens dos usuários, busca filtrar interações que possam resultar em ações indevidas, como fraudes ou disputas maliciosas.