Problemas Unidad 5 Bricio
Problemas Unidad 5 Bricio
Problemas Unidad 5 Bricio
1 BONDAD DE AJUSTE
EJERCICIOS
Ejemplo:
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número
de caras de cada serie. El número de series en los que se presentaron 0, 1, 1, 3, 4 y 5 caras
se muestran en la siguiente tabla.
Número de series
Número de
caras (frecuencia
observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
Solución:
H0; Los datos se ajustan a una distribución binomial.
Para obtener los valores esperados se tiene que utilizar la formula de la distribución
por p(x) = .
0 0.0332 33.2 38
5 0.0294 29.4 25
Para los grados de libertad el valor de m será uno, ya que se tuvo que estimar la media de
la población para poder obtener el valor de p y así poder calcular los valores esperados.
Grados de libertad: k-1-m = 6-1-1 = 4
Regla de decisión:
Cálculos:
Justificación y decisión:
Se propone que el número de defectos en las tarjetas de circuito impreso sigue una
distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se
observa el número de defectos. Los resultados obtenidos son los siguientes:
Número de Frecuencia
defectos observada
0 32
1 15
2 9
3 ó más 4
¿Muestran estos datos suficiente evidencia para decir que provienen de una distribución
Poisson?. Haga la prueba de la bondad del ajuste con un = 0.05.
Solución:
A partir de la distribución Poisson con parámetro 0.75, pueden calcularse las probabilidades
asociadas con el valor de x. Esto es la fórmula de la Poisson es:
Con esta fórmula se calculan las probabilidades, mismas que se multiplican por 60 para
obtener los valores esperados.
0 0.472 28.32 32
1 0.354 21.24 15
2 0.133 7.98 9
Puesto que la frecuencia esperada en la última celda es menor que 5, se combinan las dos
últimas celdas.
0 28.32 32
1 21.24 15
2 ó más 10.44 13
Los grados de libertad serían 3-1-1=1, debido a que la media de la distribución Poisson fue
estimada a partir de los datos.
Regla de decisión:
Cálculos:
Justificación y decisión:
= 0.05.
Frecuencias
Límites de clase
observadas
1.45 – 1.95 2
1.95 – 2.45 1
2.45 – 2.95 4
2.95 – 3.45 15
3.45 – 3.95 10
3.95 – 4.45 5
4.45 – 4.95 3
Solución:
Como se puede observar el histograma tiene una forma que aparenta ser normal, se
probará esta hipótesis.
La razón por la cual se comienza con el límite de 1.95 y se termina con el límite de 4.45, es
porque la suma de todas las probabilidades debe ser 1, bajo la curva normal.
A continuación se muestra la curva normal con sus respectivas probabilidades, según los
limites reales. Las probabilidades que no se muestran en la tabla anterior y están en la
curva se calcularon por diferencias.
P(1.95 x 2.45) = 0.0668-0.013553 = 0.053254
Frecuencias Frecuencia
Límites de clase Probabilidad
observadas esperada
Regla de decisión:
Cálculos:
Justificación y decisión:
varianza , el estadístico:
tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de
libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada
esta dado por:
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor
(n-3) = (gl-2).
La función de densidad de la distribución X2 esta dada por:
para x>0
La tabla que se utilizará para estos apuntes es la del libro de probabilidad y estadística de
Walpole, la cual da valores críticos (gl) para veinte valores especiales de . Para
denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el
símbolo (gl); este valor crítico determina a su derecha un área de bajo la curva
X2 y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6
gl en el lado izquierdo y a o largo del lado superior de la misma tabla.
Cálculo de Probabilidad
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber
como se va a comportar la varianza o desviación estándar en una muestra que proviene de
una distribución normal.
Ejemplos:
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos
en una ciudad grande forman una distribución normal con una desviación estándar =1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.
Solución:
Solución.
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar
el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área
a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el
área de 0.95 menos 0.01 quedando 0.94.
Para poder estimar la varianza de una población normal se utilizará la distribución ji-
cuadrada.
Ejemplos:
Para obtener un intervalo de confianza de 95% se elige un = 0.05. Después con el uso
de la tabla con 9 grados de libertad se obtienen los valores de X2.
Se puede observar en la gráfica anterior que el valor de X2 corre en forma normal, esto es
de izquierda a derecha.
Graficamente:
Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. La
interpretación quedaría similar a nuestros temas anteriores referentes a estimación. Con un
nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los
paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
Solución:
Ejemplos:
Una compañía que produce una parte maquinada para un motor, afirma que tiene una
varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas
partes dio una varianza de muestra s2 = 0.0003. Si se supone que las medidas del diámetro
se distribuyen en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor?
Use = 0.05.
Solución:
Datos:
= 0.0002
n = 10
s2 = 0.0003
= 0.05
Ensayo de hipótesis:
Ho; = 0.0002
Regla de decisión:
Cálculos:
Justificación y decisión:
Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un
nivel de significancia de 0.05 que no se puede refutar la afirmación del proveedor.
Este ejercicio se puede aprovechar para calcular el valor de P. En la tabla se busca el valor
de 13.5 en el renglón de 9 grados de libertad. Interpolando entre 0.10 y 0.20 se obtiene un
valor de P de 0.1484.
El contenido de azúcar del almíbar de los duraznos enlatados tiene una distribución normal,
donde se cree que la varianza es = 18 mg2. Se toma una muestra de 10 latas dieron
una desviación estándar de 4.8 mg. ¿Muestran estos datos suficiente evidencia para decir
que la varianza ha cambiado?. Use un = 0.05 y calcule el valor de P.
Solución:
Datos:
= 18
n = 10
s = 4.8
= 0.05
Ensayo de hipótesis:
Ho; = 18
H1; 18
Regla de decisión:
Cálculos:
Justificación y decisión:
Como 11.52 está entre 2.7 y 19.023, no se rechaza Ho, y se concluye con un nivel de
significancia de 0.05 que la varianza del contenido de azúcar del almíbar no ha cambiado,
esto es es de 18 mg2.
Experiencia anterior indica que el tiempo que se requiere para que los estudiantes de último
año de preparatoria completen una prueba estandarizada es una variable aletoria normal
con una desviación estándar de seis minutos. Se toma una muestra aleatoria de 20
estudiantes de último año de preparatoria y se obtiene una desviación estándar de 4.51.
¿Muestran estos datos suficiente evidencia para decir que la desviación estándar
disminuyó?. Utilice el valor de P para su decisión.
Solución:
Datos:
=6
n = 20
s = 4.51
Ensayo de hipótesis:
Ho; =6
H1; <6
Cálculos:
Error tipo II ó
Solución:
Para poder calcular el error tipo II, primero se debe encontrar el valor de la varianza muestral
límite, esto es s2L, para poder calcular los valores de X2 y posteriormente calcular el área.
Al buscar en la tabla X2(0.05,19)=30.144, este valor se sustituirá en la formula. Al despejar
de la fórmula original de X2 se obtiene:
Encontrar el error tipo II para el ejercicio 2 de esta sección, en donde el ensayo es bilateral
pues se quiere ver si la varianza del contenido de azúcar en el almíbar de los duraznos ha
cambiado. Suponga una varianza real de 20 y 26.
Solución:
Como este es un ensayo bilateral se tendrán dos valores de s2L. Los cuales se calcularán
utilizando las ji-cuadradas límites que eran de de 2.7 y 19.023.
Estos dos valores se utilizarán para calcular las nuevas ji-cuadradas para calcular el valor
de .
4.1.2 PRUEBA DE INDEPENDENCIA
La lógica de esta regla de decisión se basa en que si se cumple la hipótesis nula Ho: P11=
P12 se deben producir escasas discrepancias entre los valores observados presentes
en la tabla de frecuencias observadas y los valores esperados estimados, produciendo un
valor del estadígrafo pequeño, que no permitiría rechazar la hipótesis nula de igualdad de
proporciones.
Sin embargo si la hipótesis nula no se cumple las discrepancias serán grandes y entonces
el valor del estadígrafo será grande también, por lo que en éste caso si rechazaría la
hipótesis nula de igualdad de proporciones, entonces en éste caso podría interpretar estos
resultados como que la proporción de fumadores es diferente en ambos grupos, o sea. que
se cumple la H1: P11¹ P12 .
Entonces como verificaría si todos los valores esperados son mayores que 5, como en éste
caso se cumple esta restricción podemos usar esta prueba.
Limitaciones de la Prueba:
Siempre que en mas del 20% de las celdas de la tabla de contingencia existan valores
esperados menores que 5 o que en una sola celda haya un valor esperados menor que 1,
no debe usarse así la prueba. En este caso deben agruparse las categorías siguiendo un
sentido lógico para así poder aumentar también los valores esperados.
En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5 , esto
representaría un 25% , en éste tipo de tabla no es posible unir categorías , entonces en
éste caso podría usarse en lugar de esta prueba la de las Probabilidades exactas de
Fisher.
HIPERTENSION TRATAMIENTOS
ARTERIAL
1 2 3
NO CONTROLADA 50 40 15
Considere a=0.05.
Debemos verificar si se cumplen las condiciones para realizar una Prueba Chi Cuadrado,
calculando los valores esperados mediante la expresión ni. x n.j/n.., obtenemos los
resultados siguientes:
HIPERTENSION TRATAMIENTOS
ARTERIAL
TOTAL
1 2 3
NO 21 42 42 105
CONTROLADA
Puede observarse que en todas las celdas las frecuencias esperadas son mayores que 5,
por lo que puede realizarse la prueba C2.
Tenemos que buscar el valor de la C2 tabulada para una confiabilidad de 5% con (C=2)-1
x (R=3)-1 grados de libertad, o sea con 1 x 2 = 2 grados de libertad que es 5.99, por lo que
como 72.78 es mayor que 5.99 rechazo la hipotesis nula
de proporciones iguales.
1 50 100 50.0
Entonces como verificaría si todos los valores esperados son mayores que 5, como en éste
caso se cumple esta restricción podemos usar esta prueba.
Ejemplo:
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número
de caras de cada serie. El número de series en los que se presentaron 0, 1, 1, 3, 4 y 5 caras
se muestra en la siguiente tabla.
Número de series
Número de
caras (frecuencia
observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
Solución:
Para obtener los valores esperados se tiene que utilizar la formula de la distribución
por p(x) = .
Al seguir esta fórmula se calcula la probabilidad de obtener caras, según el valor de la
variable aleatoria. La probabilidad multiplicada por 1000 nos dará el valor esperado. Se
resumen los resultados en la tabla siguiente:
0 0.0332 33.2 38
5 0.0294 29.4 25
Para los grados de libertad el valor de m será uno, ya que se tuvo que estimar la media de
la población para poder obtener el valor de p y así poder calcular los valores esperados.
Regla de decisión:
Cálculos:
Justificación y decisión:
Se propone que el número de defectos en las tarjetas de circuito impreso sigue una
distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se
observa el número de defectos. Los resultados obtenidos son los siguientes:
Número de Frecuencia
defectos observada
0 32
1 15
2 9
3 ó más 4
¿Muestran estos datos suficiente evidencia para decir que provienen de una distribución
Poisson?. Haga la prueba de la bondad del ajuste con un = 0.05.
Solución:
A partir de la distribución Poisson con parámetro 0.75, pueden calcularse las probabilidades
asociadas con el valor de x. Esto es la fórmula de la Poisson es:
Con esta fórmula se calculan las probabilidades, mismas que se multiplican por 60 para
obtener los valores esperados.
0 0.472 28.32 32
1 0.354 21.24 15
2 0.133 7.98 9
Puesto que la frecuencia esperada en la última celda es menor que 5, se combinan las dos
últimas celdas.
0 28.32 32
1 21.24 15
2 ó más 10.44 13
Los grados de libertad serían 3-1-1=1, debido a que la media de la distribución Poisson fue
estimada a partir de los datos.
Regla de decisión:
Cálculos:
Justificación y decisión:
Ejemplo:
Una compañía tiene que elegir entre tres planes de pensiones. La administración quiere
saber si la preferencia por los planes es independiente de la clasificación laboral y desea
usar α = 0.05.
En la siguiente tabla se muestran las opiniones de una muestra aleatoria de 500 empleados.
Plan de pensión
𝑢̂1 = (340/500) = 0.68, 𝑢̂2 = (160/500) = 0.32, 𝑣̂1 = (200/500) = 0.40 y 𝑣̂3 = (100/500 =
0.20. Ahora pueden calcularse las frecuencias esperadas con la ecuación
𝑐 𝑟
1
𝐸𝑖𝑗 = 𝑛𝑢̂𝑖 𝑣̂𝑗 = ∑ 𝑜𝑖𝑗 ∑ 𝑜𝑖𝑗
𝑛
𝑗=1 𝑖=1
Por ejemplo, el número esperado de trabajadores asalariados que prefieren el plan de
pensión 1 es
Plan de pensión
α = 0.05
el estadístico de prueba es
𝑟 𝑐
(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2
𝜒02 = ∑∑
𝐸𝑖𝑗
𝑖=1 𝑗=1
(160 − 136)2 (140 − 136)2 (40 − 68)2 (40 − 64)2 (60 − 64)2
= + + + +
136 136 68 64 64
(60 − 32)2
+ = 49.63
32
2
conclusiones: puesto que 𝜒02 = 49.63 > 𝜒0.05,2 = 5.99, se rechazará la hipótesis de
independencia y se concluye que la preferencia por los planes de pensiones no es
independiente de la clasificación laboral. El valor P para 𝜒02 = 49.63 es P = 1.671 x 10-11.
Solución: En este caso el test apropiado para decimar la hipótesis de interés es el test de
Kruskal-Wallis. Para llevar a cabo el test, tenemos que ordenar todos los datos y calcular
los rangos.