CIENCIA
POLICIAL
160
Es una especie de aprendizaje supervisado sin llegar a serlo, ya
que en el aprendizaje supervisado para cada dato de entrena-
miento le decimos cuál es la solución correcta; en cambio, en
el aprendizaje por refuerzo, no se le dice al sistema si acertó
o no, hasta que la inteligencia artificial haya decidido qué ha-
cer (Martínez Heras, 2021). De este modo, el sistema genera y
etiqueta los datos durante el entrenamiento mediante un pro-
cedimiento de prueba y error y, en lugar de confrontar esos
resultados, tan solo se generan impulsos que apoyan el sistema
(IONOS, 2020).
Por ejemplo, si se desea enseñar a un modelo de machine learning
a jugar al ajedrez y para ello se recurre al aprendizaje supervisa-
do, durante el entrenamiento, se le dirá al sistema cuáles son las
soluciones correctas, de modo que el sistema solo podrá llegar
a ser tan bueno como la lógica de los programadores que lo han
creado. Pero, si se pretende que el sistema llegue a jugar mejor
que sus propios creadores, podría utilizarse el aprendizaje por
refuerzo, de modo que al sistema solo se le enseñarían las reglas
del juego y se le recompensaría cada vez que gane una partida, y
él solo irá analizando y aprendiendo qué movimientos son acer-
tados y en qué circunstancias, encontrando soluciones creativas,
poco comunes y geniales (Martínez Heras, 2021).
1.2.4
Visión por ordenador (computer vision, CV)
La visión por ordenador consiste en la visión y comprensión
del contenido de imágenes y vídeos digitales por parte de ordenadores.
Es la extracción automática de información de imágenes, refiriéndonos
con información a cualquier cosa desde modelos 3D, posicionamiento
de cámaras, detección y reconocimiento de objetos hasta búsqueda y
agrupamiento del contenido de imágenes.
El objetivo de la visión por ordenador es automatizar tareas que
el sistema de visión humano realiza. A un nivel más abstracto y pos-
terior, el objetivo sería usar la imagen observada para inferir algo
sobre el entorno. Es un campo multidisciplinario considerado un
subcampo de la inteligencia artificial y el machine learning (Brown-
lee, 2019).