A hybrid model for fraud detection on purchase orders based on unsupervised learning
Description
A fraude na área de compras é uma questão que afeta empresas de todo o mundo. Esse problema é tratado com auditorias. No entanto, devido ao grande volume de dados disponíveis, é impossível verificar todas as transações de uma empresa. Portanto, apenas uma pequena amostra dos dados é verificada. Devido ao pequeno número de fraudes em comparação com as transações padrão, frequentemente essas transações fraudulentas não são incluídas na amostra e, portanto, não são verificadas durante a auditoria. Este trabalho apresenta uma nova abordagem utilizando as técnicas de detecção de assinatura associadas ao clustering para aumentar a probabilidade de inclusão de documentos relacionados à fraude na amostra. Devido à inexistência de um banco de dados público para detecção de fraudes relacionadas à área de compras das empresas, este trabalho utiliza dados de aquisições reais para comparar a probabilidade de selecionar um documento fraudulento em uma amostra de dados. Nosso trabalho compara amostragem aleatória versus a amostragem obtida a partir do modelo proposto. Também exploramos qual seria o melhor algoritmo de clustering para esse problema específico. A metodologia proposta foi capaz de classificar os documentos de compras em diferentes clusters através da utilização do algortimo HDSCAN, no qual um deles contendo os documentos com o maior volume de sintomas associados a transações fraudulentas, de uma maneira completamente automática, algo que não foi encontrado nos papers relacionados ao tópico de fraudes na área de compras corporativas.Nenhuma