Tablas de Contingencia

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Tema 1.

Tablas de contingencia: Lectura e interpretación


Objetivos del tema 1
En este tema aprenderás a: Primera aparición de tablas de
 Resumir datos sobre dos variables estadística en una tabla contingencia
de contingencia.
 Identificar las frecuencias que corresponde a cada par de
valores de las variables.
 Calcular las frecuencias relativas dobles e interpretarlas.
 Calculas las frecuencias marginales, e interpretarlas.
 Calcular las frecuencias condicionales e interpretarlas.
 Representar gráficamente los datos mediante diagrama de
barras adosadas, diagrama de barras apiladas y gráfico KARL PEARSON
tridimensional.
 Calcular probabilidades simples, compuestas y
condicionales a partir de datos de una tabla de contingencia.

1.1. Introducción
Hasta este momento has estudiado las variables unidimensionales, en las cuales calculaste las medidas
de posición central o medidas de dispersión y otros estadísticos. En dicho estudio las variables se
presentaron de forma aislada, cosa que no es habitual en la vida real, ya que al estudiar el estado físico
de una persona, por ejemplo, se realizan una gran variedad de preguntas como altura, peso, si realiza
ejercicio, etc. Todas estas, y muchas más, se realizan por la sencilla razón de que en multitud de
ocasiones las variables están interrelacionadas entre sí. Siguiendo con el ejemplo de estado físico, una
persona alta es razonable suponer que tiene mayor peso, dos variables comúnmente relacionadas.

Recuerda: En un estudio estadístico podemos encontrar variables cuantitativas (como son: edad,
peso, altura…) y variables cualitativas (como son: color de ojos, color de pelo…)

En este tema vamos a estudiar las posibles relaciones entre dos variables cualitativas, mediante una
herramienta conocida como tabla de contingencia.

1.2. Tablas de contingencia


La tabla de contingencia nos proporciona una forma resumida de representar datos, de dos variables
que se quieren estudiar.

Ejemplo 1.1. Problemas neuronales


En un hospital psiquiátrico se hace un estudio en el que participan 30 pacientes con dos tipos de
problemas neuronales (altos y bajos), queremos comparar un fármaco nuevo con otro antiguo. ¿Cómo
podemos representar esta situación? ¿Cómo podemos ver si el tratamiento nuevo es preferible al
anterior?
Para representar esta situación utilizaremos dos variables. La variable X representa el tratamiento, con
dos valores (x1, x2). La variable Y los problemas neuronales (y1, y2). Los datos se representan en una
tabla como la 1.1 que llamaremos tabla de contingencia. En este ejemplo mostramos el caso más
sencillo de tabla de contingencia, ya que las variables en filas y columnas solo tienen dos valores cada
uno. Se trataría de una tabla 2x2 (también llamada dicotómica).
Una posible representación de está tabla sería el diagrama de barras adosadas (Figura 1.1.), En este
diagrama usamos barras colocadas horizontalmente o verticalmente para representar la frecuencia de
cada casilla de la tabla de contingencias. Para cada valor de la variable X (tratamiento antiguo o nuevo)
representamos una al lado de otra la frecuencia con que se presenta cada valor de Y (problemas
neuronales altos o bajos) dentro de ese valor de X. También se podría dar el diagrama de barras en
porcentajes, bien absolutos (respecto al total de la tabla), bien relativos (respecto a cada valor de la
variable X).
Tabla 1.1. Tipo de tratamiento en enfermos con problemas neuronales
Problemas neuronales (Y)
Tipo de Altos(y1) Bajos(y2)
tratamiento(X)
Antiguo(x1) 10 4
Nuevo(x2) 5 11

Figura 1.1. Diagrama de barras adosadas

1.3. Frecuencias dobles absolutas y relativas.


En la tabla 1.1 tenemos dos tipos de pacientes y dos tipos de tratamientos. Por tanto se presentan cuatro
tipos de enfermos:
 Con problemas neuronales altos que usan el tratamiento antiguo (10 casos)
 Con problemas neuronales altos y que usan el tratamiento nuevo (5 casos)
 Con problemas neuronales bajos y que usan el tratamiento antiguo (4 casos)
 Con problemas neuronales bajos y que usan el tratamiento nuevo. (11 casos).
Para saber qué tipo es representado por cada valor en una celda de la tabla no hay más que seguir la fila
y columna en la que está el valor. Por ejemplo, al seguir la columna correspondiente al valor 5, vemos
que son pacientes con problemas neuronales altos, y al seguir la fila observamos que son tratados con el
tratamiento nuevo, por tanto hay 5 pacientes con problemas neuronales altos que son tratados con el
tratamiento nuevo. Llamamos frecuencias absolutas dobles a estos valores y los representamos
mediante fij indica la frecuencia absoluta con que aparece el par (xi, yj) donde el primer número
representa el valor que acompaña a la variable X y el segundo número representa el valor que
acompaña a la variable Y (Ver tabla 1.2).
Tabla 1.2. Frecuencias absolutas dobles
Tipo de tratamiento(X) Problemas neuronales (Y)
Altos(y1) Bajos(y2)
Antiguo(x1) 10(f11) 4(f12)
Nuevo(x2) 5(f21) 11(f22)

En algunos casos, puede ser interesante tener las frecuencias en tanto por uno. Estos valores llamamos
frecuencias relativas doble. Si representamos mediante hij la frecuencia relativa del par de valores (xi,
yj), su valor se obtiene dividiendo cada celda por el total de pacientes n (en nuestro caso 30), es decir:
hij=fij/n
En el ejemplo: h11 = f11/n = 10/30 = 0,333; h12 = f12/n = 4/30 = 0,133 y del mismo modo se obtiene el
resto de las frecuencias relativas dobles (tabla 1.3). A partir de la tabla 1.3. es fácil calcular el
porcentaje de pacientes en cada celda respecto al total de la muestra simplemente multiplicando por
cien cada celda. En nuestro caso tenemos:
 Hay 33,33% pacientes con problemas neuronales altos y se les aplica el tratamiento antiguo.
 Hay 16,67% pacientes con problemas neuronales altos y se les aplica el tratamiento nuevo.
Y del mismo modo se obtiene el resto de los porcentajes.
Tabla 1.3. Frecuencias relativas dobles
Problemas neuronales (Y)
Altos(y1) Bajos(y2)
Tipo de tratamiento(X) Antiguo(x1) 0,333(h11) 0,133(h12)
Nuevo(x2) 0,167(h21) 0,367(h22)

1.4. Distribuciones marginales


A partir de la tabla de contingencia (bidimensional) pueden obtenerse diferentes distribuciones de una variable
(unidimensional).
Si en la tabla de frecuencias se suman las frecuencias por columnas, obtengo en cada columna j, el número de
individuos f.j con un valor de la variable Y=yj, independientemente del valor X. A la distribución así obtenida
se le conoce como distribución marginal de la variable Y. De forma análoga podemos definir la distribución
marginal de la variable X.
Ejemplo 1.1. Problemas neuronales (continuación)
 Siguiendo el ejemplo, podemos observar en la tabla 1.4. el total por filas o distribución
marginal de X: 14 enfermos con tratamiento antiguo y 16 con tratamiento nuego representados
por f1. y f2., o sea f11+f12=f1. y f21+f22=f2..
 De la misma manera vemos como el total por columnas o distribución marginal de Y (15
enfermos con problemas altos y otros 15 con problemas bajos, representados por f.1 y f.2).
 Al sumar la columna del total por filas, o sumando el total por columnas sale el mismo
resultado: 30 enfermos, o total de la muestra (f1.+f2. = f.1+f.2 = n).
Tabla 1.4. Frecuencias absolutas de las distribuciones marginales
Problemas neuronales (Y)
Altos(y1) Bajos(y2) TOTAL
Tipo de tratamiento(X) Antiguo(x1) 10(f11) 4(f12) 14(f1.)
Nuevo(x2) 5(f21) 11(f22) 16(f2.)
TOTAL 15(f.1) 15(f.2) 30(n)
 Dividiendo todas las frecuencias marginales por n se obtienen las frecuencias relativas
marginales o también sumando por filas o columnas las frecuencias relativas dobles. Además
la suma de las frecuencias relativas marginales en las filas o columnas es igual a 1.
Tabla 1.5. Frecuencias relativas de las distribuciones marginales
Problemas neuronales (Y)
Altos(y1) Bajos(y2) TOTAL
Tipo de tratamiento(X) Antiguo(x1) 0,333(h11) 0,133(h12) 0,467(h1.)
Nuevo(x2) 0,167(h21) 0,367(h22) 0,533(h2.)
TOTAL 0,5(h.1) 0,5(h.2) 1

1.5. Frecuencias relativas condicionales


fi,j h i,j
h(x i |y j )  
f. j h. j
Es posible que queramos centrarnos en solamente una parte de los pacientes, por
ejemplo en los pacientes con el tratamiento nuevo. Para este tipo de casos se calculan distribuciones
condicionales. Si representamos por h(xi|yj) la frecuencia relativa condicional del valor xi entre los
individuos que presentan el carácter yj, obtenemos la siguiente relación:

fi,j hi,j
(10.3) h(y j|x i )  
fi. hi. Podemos también obtener la frecuencia relativa de yj condicionada por
x=xi mediante la expresión:

En el ejemplo, para obtener la distribución condicional de tipo de problema neuronal dentro de los
pacientes con tratamiento nuevo (tabla 1.6) tendríamos:
h (problemas altos/ tratamiento nuevo) = h(y1/=x2) = f21/f2. = 5/16 = 0,3125
h (problemas bajos /tratamiento nuevo) = h(y2/X=x2) = f22/f2. = 11/16 = 0,6875

Tabla 1.6. Distribución de problemas neuronales en enfermos con tratamiento nuevo


Tipo de tratamiento(X) Problemas neuronales (Y)
Altos(y1) Bajos(y2) TOTAL
Nuevo(x2) 0,3125 (h(y1/ nuevo)) 0,6875 (h(y2/ nuevo)) 1

A partir de la tabla 1.6. podemos responder preguntas como: ¿Hay el mismo porcentaje con problemas
altos y bajos en el nuevo tratamiento? En forma similar calculamos la distribución del tipo de
tratamiento condicionada que el paciente tiene problemas neuronales bajos (ver tabla 1.7.)
Tabla 1.7. Distribución de X condicionada a Y2
Problemas neuronales (Y)
Bajos(y2)
Tipo de tratamiento(X) Antiguo(x1) 0,2667 (h(x1/Y=y2))
Nuevo(x2) 0,7333 (h(x2/Y=y2))
TOTAL 1

1.6. Tablas rxc (caso generalizado)


A veces podemos tener más de dos categorías en alguna de las variables. El formato general de una
tabla rxc sería parecido al formato visto en tablas 2x2. Básicamente la diferencia es que se le van
añadiendo filas o columnas, calculándose las distintas frecuencias en la forma indicada
Tabla 1.8. Tabla de contingencia para el caso general
Variable Y
Y … Y TOTAL
1 c
Variable X X1 f11 … f1 f1.
c
… … … …
Xr fr1 … frc fr.
TOTAL f.1 … f.c N

Siendo X e Y, las variables de interés, X1,…, Xr, los distintos valores de la variable X; Y1,…, Yc, los
distintos valores de la variable Y y f11, …, f1c,…, fr1,…, frc, las frecuencias absolutas conjuntas de los
pares.

1.7. Representaciones gráficas


En el estudio de las tablas de contingencia hay una gran variedad de gráficos con los que mostrar datos.
A continuación mostraremos algunos.
Diagrama de barras adosadas. Este sistema de representación nos muestra con barras colocadas
horizontalmente o verticalmente la frecuencia de cada casilla del interior de la tabla de frecuencias
(Figura 1.1.). Para cada valor de la variable X se presentan conjuntamente la frecuencia de cada valor
de Y condicionado a este valor de X. Al estar situadas unas junto a otras permite la comparación rápida
entre las variables y dentro de cada variable. También se podría dar el diagrama de barras en
porcentajes, bien absolutos (respecto al total de la tabla), bien relativos (respecto a cada valor de la
variable X).
Diagrama de barras apilado. Este gráfico muestra una barra por cada valor que tome la variable Y, las
cuales a su vez, se dividen en distintos colores que representa a cada valor de la variable X. Representa
la frecuencia con la que aparece cada valor de X en cada valor de Y, comparando entre categorías, el
aporte de cada valor al total (Figura 1.2.).
En el ejemplo se da el diagrama de barras en porcentajes. De este modo se visualizan mejor las
frecuencias condicionales que en el diagrama de barras adosado.

Figura 1.2. Diagrama de barras apilado


Gráfico tridimensional. Este gráfico tridimensional coloca en el ancho y largo las variables X e Y, y la
altura representa la frecuencia de cada celda (Figura 1.3.). Se puede construir también utilizando
frecuencias relativas o porcentajes.
Figura 1.3. Gráfico tridimensional

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy