Tablas de Contingencia
Tablas de Contingencia
Tablas de Contingencia
1.1. Introducción
Hasta este momento has estudiado las variables unidimensionales, en las cuales calculaste las medidas
de posición central o medidas de dispersión y otros estadísticos. En dicho estudio las variables se
presentaron de forma aislada, cosa que no es habitual en la vida real, ya que al estudiar el estado físico
de una persona, por ejemplo, se realizan una gran variedad de preguntas como altura, peso, si realiza
ejercicio, etc. Todas estas, y muchas más, se realizan por la sencilla razón de que en multitud de
ocasiones las variables están interrelacionadas entre sí. Siguiendo con el ejemplo de estado físico, una
persona alta es razonable suponer que tiene mayor peso, dos variables comúnmente relacionadas.
Recuerda: En un estudio estadístico podemos encontrar variables cuantitativas (como son: edad,
peso, altura…) y variables cualitativas (como son: color de ojos, color de pelo…)
En este tema vamos a estudiar las posibles relaciones entre dos variables cualitativas, mediante una
herramienta conocida como tabla de contingencia.
En algunos casos, puede ser interesante tener las frecuencias en tanto por uno. Estos valores llamamos
frecuencias relativas doble. Si representamos mediante hij la frecuencia relativa del par de valores (xi,
yj), su valor se obtiene dividiendo cada celda por el total de pacientes n (en nuestro caso 30), es decir:
hij=fij/n
En el ejemplo: h11 = f11/n = 10/30 = 0,333; h12 = f12/n = 4/30 = 0,133 y del mismo modo se obtiene el
resto de las frecuencias relativas dobles (tabla 1.3). A partir de la tabla 1.3. es fácil calcular el
porcentaje de pacientes en cada celda respecto al total de la muestra simplemente multiplicando por
cien cada celda. En nuestro caso tenemos:
Hay 33,33% pacientes con problemas neuronales altos y se les aplica el tratamiento antiguo.
Hay 16,67% pacientes con problemas neuronales altos y se les aplica el tratamiento nuevo.
Y del mismo modo se obtiene el resto de los porcentajes.
Tabla 1.3. Frecuencias relativas dobles
Problemas neuronales (Y)
Altos(y1) Bajos(y2)
Tipo de tratamiento(X) Antiguo(x1) 0,333(h11) 0,133(h12)
Nuevo(x2) 0,167(h21) 0,367(h22)
fi,j hi,j
(10.3) h(y j|x i )
fi. hi. Podemos también obtener la frecuencia relativa de yj condicionada por
x=xi mediante la expresión:
En el ejemplo, para obtener la distribución condicional de tipo de problema neuronal dentro de los
pacientes con tratamiento nuevo (tabla 1.6) tendríamos:
h (problemas altos/ tratamiento nuevo) = h(y1/=x2) = f21/f2. = 5/16 = 0,3125
h (problemas bajos /tratamiento nuevo) = h(y2/X=x2) = f22/f2. = 11/16 = 0,6875
A partir de la tabla 1.6. podemos responder preguntas como: ¿Hay el mismo porcentaje con problemas
altos y bajos en el nuevo tratamiento? En forma similar calculamos la distribución del tipo de
tratamiento condicionada que el paciente tiene problemas neuronales bajos (ver tabla 1.7.)
Tabla 1.7. Distribución de X condicionada a Y2
Problemas neuronales (Y)
Bajos(y2)
Tipo de tratamiento(X) Antiguo(x1) 0,2667 (h(x1/Y=y2))
Nuevo(x2) 0,7333 (h(x2/Y=y2))
TOTAL 1
Siendo X e Y, las variables de interés, X1,…, Xr, los distintos valores de la variable X; Y1,…, Yc, los
distintos valores de la variable Y y f11, …, f1c,…, fr1,…, frc, las frecuencias absolutas conjuntas de los
pares.