Coeficiente c de co-ocurrencias de códigos

El coeficiente c indica la intensidad de la relación entre dos códigos.

Para activar el coeficiente c, haga clic en opciones.

Coeficiente de la tabla de co-ocurrencias de códigos

El rango del coeficiente c está entre 0 y 1:

  • 0 significa que los códigos no co-ocurren
  • 1 significa que estos dos códigos co-ocurren dondequiera que se usen

El cálculo del coeficiente c se basa en enfoques tomados del análisis de contenido cuantitativo. Se calcula de la siguiente manera:

c = n12 / (n1 + n2 - n12)

n12 = número de co-ocurrencias para los códigos n1 y n2

El coeficiente c es útil cuando se trabaja con grandes cantidades de casos y datos estructurados, como preguntas abiertas de encuestas. Si utiliza el índice c, preste atención a las indicaciones de color adicionales. Como su base de datos es cualitativa, el coeficiente c no es equivalente, por ejemplo, al coeficiente de correlación de Pearson y, por tanto, tampoco se proporcionan valores p.

Distorsión debida a frecuencias desiguales

Un problema inherente al índice c y a medidas similares es que se distorsiona cuando las frecuencias de los códigos difieren demasiado. En tales casos, el coeficiente tiende a ser mucho menor que la posible significación de la co-ocurrencia. Por ejemplo, si se han codificado 100 citas con el código «A» y 10 con el código «B», y se tienen 5 co-ocurrencias, entonces el coeficiente c es:

c = 5/(100 + 10 - 5) = 5/105 = 0,048

Un coeficiente de solo 0,048 puede pasarse por alto fácilmente, aunque el código B aparece en el 50% de todas sus aplicaciones junto con el código A.

Si uno de los códigos de un par se ha aplicado más de 5 veces más que el otro código, aparece un punto amarillo en la parte superior derecha de la celda de la tabla. Por tanto, cuando una celda muestra el marcador amarillo, es una invitación a examinar las co-ocurrencias de esa celda a pesar de que el coeficiente sea bajo.

Fuera de rango

El índice c asume entidades de texto separadas y no superpuestas. Solo entonces se puede esperar un rango correcto de valores.

El coeficiente puede superar el rango de 0 a 1 en el que se supone que debe mantenerse si existe codificación redundante. Veamos el siguiente ejemplo:

  • La cita 1 está codificada con los códigos A y B
  • Una cita 2 superpuesta está codificada con el código B.

Entonces la cita 1 cuenta como 1 evento de co-ocurrencia y la cita 2 superpuesta como otro. Esto da como resultado un valor del doble del máximo permitido:

c = 2/(1 + 2 - 2) = 2

Todas las celdas que muestran un número fuera de rango (> 1) tienen un punto rojo en la esquina superior derecha.

En caso de que el coeficiente c supere 1, es necesario realizar una limpieza y eliminar los códigos redundantes. Consulte Búsqueda de codificaciones redundantes.

Resumen de indicadores de color

Punto amarillo: Frecuencias de citas desiguales: la proporción entre las frecuencias del código de columna y del código de fila supera el umbral de 5.

Punto rojo: El índice c supera el rango de 0 a 1.

Punto naranja: El punto naranja es simplemente una combinación de las condiciones rojo y amarillo.