Inteligencia artificial para el trabajo de policía
159
se necesita tener un conjunto de muestra previamente etiquetado
y clasificado, del cual ya se sabe a qué categoría pertenecen los
ejemplos (Luna González, 2018).
Por ejemplo, si se quiere que el sistema aprenda a diferenciar
los correos electrónicos que son spam de los que no son spam,
inicialmente se deberá alimentar el modelo con un conjunto de
ejemplos de correos electrónicos que ya están categorizados
(spam y no spam), de modo que el sistema buscará patrones en
esos correos electrónicos en función de los cuales aprenderá a
clasificarlos y usará posteriormente en su fase operativa real los
patrones aprendidos para predecir si un correo electrónico nuevo
no categorizado es spam o no lo es.
2) Aprendizaje no supervisado. En este tipo de aprendizaje auto-
mático, el modelo no necesita que se le diga cuál es la respuesta
correcta, el sistema aprende de los propios datos de entrada sin
necesidad de que le sean clasificados o etiquetados previamente
para el entrenamiento (Luna González, 2018). Este tipo de apren-
dizaje es especialmente útil cuando se quiere entender mejor un
enorme conjunto de datos para poder tomar mejores decisiones,
porque no se le dice al sistema qué tiene que hacer con los datos,
simplemente se le pide que los analice y diga si ve algo intere-
sante en ellos (Martínez Heras, 2021).
Por ejemplo, podrían dársele a nuestro modelo los datos de todos
los tickets de la compra que se han generado en un supermercado
durante varios años. El modelo los analizaría y podría encontrar
que un porcentaje alto de los tickets que contienen cerveza tam-
bién contienen pañales. Gracias a eso, podría idearse la estrate-
gia de poner la marca blanca de pañales del supermercado justo
al lado de las cervezas, para favorecer que el cliente compre esa
marca de pañales solo por la comodidad de tenerlos a mano, y
aumentar así las ventas de dicha marca (Martínez Heras, 2021).
3) Aprendizaje por refuerzo o reinforcement learning. En este
tipo de aprendizaje, el modelo aprende por un sistema de ac-
ción-recompensa, es decir, aprende de sus éxitos y fracasos, y no
directamente de los errores concretos que los desarrolladores le
comunican (Luna González, 2018).