Delitos de odio: análisis sobre la alta tasa de infradenuncia
111
los años 2014 y 2020 (n = 9755) para establecer y comparar el perfil
de la víctima que interpone denuncia. Esta base de datos está princi-
palmente alimentada por las estadísticas de Policía Nacional y Guardia
Civil, pero también de las Policías autonómicas y municipales.
2.2
Análisis estadísticos
2.2.1
Test Chi-cuadrado
El análisis se dividió en tres secciones y se utilizaron tablas de
contingencia y pruebas de Chi-cuadrado para comparar las diferencias
entre los distintos niveles de las variables. Para homogeneizar el con-
junto de datos y mejorar la solidez estadística en la primera sección
(«Variables sociodemográficas») se eliminó a aquellos participantes
con pocos individuos de diferentes categorías dentro de las variables
sociodemográficas. Por sexo, se eliminó a los participantes no binarios
(n = 16) y a otros (n = 2). Por otro lado, se eliminó a los menores de 18
años (n = 3) y a los mayores de 65 años (n = 3), también a los parti-
cipantes procedentes de Asia (n = 4) y las personas que respondieron
estar en «otra situación laboral» (n = 3). Por lo tanto, el tamaño final
de la muestra utilizada para el análisis de variables sociodemográficas
fue de n = 407. Sin embargo, para estudiar las preguntas específicas
de la encuesta se utilizó el tamaño total de la muestra (n = 437) para
no perder información relevante.
2.2.2
Análisis de correspondencias múltiples
Se llevaron a cabo dos análisis de correspondencias múltiples
en el estudio de la infra denuncia. Este método estadístico es básica-
mente un análogo del análisis de componentes principales, pero con
variables categóricas. Se utilizó con la finalidad de comprender el gra-
do de correlación de los distintos niveles de respuesta de las diferentes
variables cualitativas estudiadas y así y obtener una visión holística de
cómo se distribuyen los datos al tener en cuenta todas las variables en
conjunto.
Por otro lado, en relación con el conjunto de datos del SEC, el ta-
maño total de la muestra utilizada fue de n = 9755 para la estadística
descriptiva y de n = 9538 para el análisis de correspondencias múl-
tiples (ACM), siendo menor en el último caso porque se eliminaron