Cómo la inteligencia artificial nos ayuda a reducir el fraude en las ventas online
Es un hecho que el comercio electrónico está en continuo crecimiento desde hace años, y que este incremento es especialmente relevante en el sector del retail. Pero ha sido la situación de pandemia la que ha hecho disparar las ventas online hasta niveles hasta ahora desconocidos.
Ante esta situación, adquiere más relevancia que nunca la necesidad de hacer frente a uno de los mayores problemas que afrontan los retailers: el fraude en las ventas a través de internet.
Según un estudio realizado por Juniper Research, las pérdidas en las ventas online debidas al fraude en los pagos superarán los 25.000 millones de dólares en 2024, incrementándose un 52% respecto a la actualidad. Y ello a pesar de la entrada en vigor de la nueva directiva de servicios de pago en Europa (PSD2) y, especialmente, la SCA (autenticación segura al cliente).
Los retailers se enfrentan, pues, al reto de ser capaces de diferenciar aquellas transacciones fraudulentas de las que no lo son, lo cual supone tratar de encontrar un equilibrio entre las grandes pérdidas económicas que suponen estas transacciones fraudulentas y el enorme esfuerzo que supondría investigar cada transacción individual. Incluso aunque esto último fuera posible, el hecho de poner en duda a clientes honestos, con toda seguridad, acabaría teniendo un impacto negativo en muchos de ellos que acabarían marchándose a la competencia por sentirse injustamente tratados. Además, se estima que alrededor del 30% de las compras que se abandonan por algún problema relacionado con el pago online se deben a que la tarjeta del cliente fue rechazada erróneamente por sospecha de fraude, lo que conocemos como un falso positivo. Por tanto, se trata de ser muy escrupuloso a la hora de discernir entre transacciones fraudulentas y no fraudulentas.
El aprendizaje automático como solución para prevenir el fraude
Cuando hablamos de prevenir o detectar el fraude, nos planteamos básicamente tres grandes objetivos: identificar comportamientos fraudulentos conocidos, reconocer nuevos comportamientos potencialmente fraudulentos y conseguir ambos objetivos al tiempo que minimizamos los falsos positivos.
Hasta no hace mucho, lo habitual era tratar de conseguir estos objetivos, sobre todo los dos primeros, mediante reglas de negocio predefinidas que modelaban esos comportamientos fraudulentos conocidos, o bien mediante métodos estadísticos generales que podían reconocer comportamientos diferentes a los habituales y que potencialmente podían ser fraudulentos. Sin embargo, estas técnicas presentan dos problemas fundamentales. En primer lugar, tienen una alta tendencia a generar falsos positivos, es decir, a identificar erróneamente transacciones como fraudulentas,
lo que conlleva un importante esfuerzo en revisión manual si se pretendía luego tratar de minimizar este error. En segundo lugar, no son lo suficientemente flexibles para adaptarse a los nuevos patrones de consumo, por lo que de nuevo se vuelven muy imprecisas.
Es aquí donde entran en juego las técnicas de aprendizaje automático, o machine learning, una de las tecnologías de inteligencia artificial que más se está desarrollando en los últimos años y que, de manera más intensiva, se está utilizando para optimizar una gran variedad de procesos de negocio.
Cómo identificar comportamientos fraudulentos conocidos
Para ello, contamos con una base de datos histórica de las transacciones de un e-commerce y tenemos identificadas (etiquetadas) aquellas transacciones que sabemos que fueron fraudulentas. Este ejemplo se corresponde con lo que conocemos como un problema de aprendizaje supervisado, en el que se trata de construir un modelo que aprenda de esos datos históricos y sea capaz de identificar los patrones que caracterizan el hecho de que una transacción sea fraudulenta o no.
Una vez hayamos construido este modelo a base de entrenar un algoritmo con esos datos históricos y lleguemos a unas buenas métricas de precisión, lo podremos utilizar para predecir la probabilidad de que una nueva transacción sea o no fraudulenta. Concretamente, una de las métricas que más deberemos vigilar será la de tener una baja tasa de falsos positivos.
Adicionalmente, uno de los principales retos que nos encontraremos en estos problemas será un marcado desbalanceo en esos datos históricos que usaremos para entrenar nuestro modelo, donde las transacciones fraudulentas representarán con mucha seguridad menos del 5% de las muestras. Esto nos obligará a aplicar técnicas de submuestreo (downsampling) para tratar de balancear mejor los datos sin perder las propiedades estadísticas del conjunto de datos original.
¿Y si el comportamiento potencialmente fraudulento es nuevo?
En este caso, nos encontramos con una problemática diferente y es el hecho de que no tenemos conocimiento previo de que esos comportamientos puedan ser fraudulentos y, por tanto, no tenemos ese conjunto de datos etiquetados que sí teníamos en el caso anterior. Así, este problema se corresponde con lo que denominamos un problema de aprendizaje no supervisado que, concretamente en este caso, se va a tratar de un problema de detección de anomalías. Aquí buscaremos identificar, en tiempo real, transacciones con comportamientos fuera de lo habitual y proponer su revisión manual para tomar una decisión final sobre si deben ser rechazadas por alta sospecha de fraude, buscando de nuevo minimizar la tasa de falsos positivos.
Una combinación de enfoques para reducir el fraude al máximo
Será combinando ambos tipos de soluciones, supervisada y no supervisada, y monitorizando el rendimiento de nuestros modelos predictivos para asegurar que sigan aprendiendo según vayan modificándose los patrones de comportamiento, como seremos capaces de estar mejor preparados para afrontar la problemática del fraude.
Y es que, a día de hoy, según el Informe Adyen sobre el retail, solo el 13% de los retailers españoles se sienten totalmente preparados para combatir el fraude. Por tanto, es fundamental que, en momentos como el que estamos viviendo de auge del comercio electrónico, estemos preparados para proteger nuestro negocio, pero, al mismo tiempo, que evitemos tomar medidas demasiado agresivas que afecten a la satisfacción y fidelidad de nuestros clientes.