INTERVALOS
INTERVALOS
INTERVALOS
BÁSICAS
Intervalos de Confianza
CURSO DE R
Profesor: MSc. Aldo Richard Meza Rodríguez
Introducción
• Estimación Puntual, la estimación del parámetro de interés es mediante
un único valor.
➢ ¿Qué tan precisa es la estimación?
➢ ¿Cuánto es el error que se comete en la estimación?
• Estimación por Intervalo, la estimación está dada por un conjunto de
valores que conforman un intervalo, el cual se confía razonablemente que
captura el valor desconocido del parámetro. Los límites del intervalo son
calculados a partir de la muestra.
Estimación puntual
Donde:
➢ 𝑋" : Media muestral
➢𝑍 1*𝛼 : Valor crítico. Valor Z que proporciona una probabilidad acumulada
2
de (1- 𝛼/2) en la distribución normal estándar.
➢ 𝜎: Desviación estándar poblacional
➢ n: Tamaño de la muestra
➢ 1- 𝛼: Nivel de confianza
Ejemplo 1
Se registró los tiempos que utilizan 100 clientes tomados aleatoriamente en
sus distintas operaciones en un banco local. La media de la muestra fue de 10
minutos. Además, se tienen conocimiento que los tiempos utilizados en las
diferentes operaciones se distribuyen de manera normal con desviación
estándar igual a 3 minutos. Estimar un intervalo de confianza del 95% para el
verdadero tiempo promedio utilizado por los clientes.
Solución:
5 5
➢ IC al 95%: 10 − 1.96× , 10 + 1.96× = 9.412, 10.588
111 111
➢ Interpretación:
Se tiene un 95% de confianza de que el intervalo (9.412, 10.588) captura el
valor real del tiempo promedio que utilizan los clientes en sus distintas
operaciones en un banco local.
En R (Datos resumidos)
library(TeachingDemos)
z.test(10, stdev= 3, n=100, conf.level= 0.95)
##
Nivel de confianza
## One Sample z-test Tamaño de muestra
Media muestral
## Desviación estándar poblacional
## data: 10
## z = 33.333, n = 100.0, Std. Dev. = 3.0, Std. Dev. of the
sample mean =
## 0.3, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##
IC al 95%
9.412011 10.587989
## sample estimates:
## mean of 10
## 10
Ejemplo 2
Una muestra aleatoria de tamaño 9 tomada de una población con distribución
normal con una varianza poblacional de 25 registra los siguientes valores:
53 46 55 45 44 52 46 60 49
# IC al 90%
library(TeachingDemos)
z.test(x, stdev= 5, conf.level= 0.90)
##
Nivel de confianza
## One Sample z-test
Vector de datos ## Desviación estándar poblacional
## data: x
## z = 30, n = 9.0000, Std. Dev. = 5.0000, Std. Dev.
of the sample mean =
## 1.6667, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
IC al 90%
## 47.25858 52.74142
➢ Interpretación: Con 90% de confianza,
## sample estimates: se puede afirmar que el intervalo
## mean of x (47.26, 52.74) captura el valor de la
## media poblacional.
50
Caso 2: Varianza poblacional (𝜎 2 ) es desconocida
Donde:
➢ 𝑋 Media muestral
➢ 𝑡 ()𝛼, 𝑛 ) ( : Valor crítico. Valor t que proporciona una probabilidad acumulada
2
de (1- 𝛼/2) en la distribución t-student con (n-1) grados de libertad.
➢ 𝑆: Desviación estándar muestral
➢ n: Tamaño de la muestra
➢ 1- 𝛼: Nivel de confianza
Ejemplo 4
Cierta establecimiento de comida realiza delivery de sus pedidos sin cobro
alguno. Sin embargo, los clientes suelen dar una propina a la persona que
entrega el pedido. El dueño del local está interesado en estimar el ingreso
medio de propinas por entrega. Para esto, ha seleccionado una muestra
aleatoria simple de 12 entregas y ha registrado las propinas, en soles,
recibidas por la persona encargada de la entrega:
# IC al 97%
t.test(x, conf.level = 0.97)
##
## One Sample t-test Nivel de confianza
Vector de datos ##
## data: x
## t = 6.6914, df = 11, p-value = 3.415e-05
## alternative hypothesis: true mean is not equal to 0
## 97 percent confidence interval:
IC al 97%
## 3.557423 7.775910
## sample estimates:
➢ Interpretación: Con 97% de confianza, se puede
## mean of x afirmar que el intervalo (S/.3.56, S/.7.78) captura el
## 5.666667 valor real del ingreso medio de propina por entrega.
Ejemplo 5
El consumo de energía de cierta marca de lavadora está relacionado a la
duración de cada ciclo de lavado. En una muestra aleatoria de 21 lavadoras se
encontró una duración promedio de 37.8 minutos y una desviación estándar
de 5.9 minutos.
a) Asumiendo que los tiempos de lavado de cada ciclo siguen una distribución
normal, encuentre un intervalo de confianza del 99% para el tiempo medio
por ciclo de lavado.
Solución:
Parte a)
➢ 𝜇: Tiempo medio por ciclo de lavado, en minutos.
➢ Nivel de confianza: 1- 𝛼 = 99% ⇒ 1- 𝛼 = 0.99 ⇒ 𝛼 = 0.01 y (1- 𝛼/2) = 0.995
➢ 𝑡 ()𝛼, 𝑛 ) ( =𝑡 A.BBC, +( ) ( = qt(0.995,20) = 2.84534
2
4.2 4.2
➢ IC al 99%: 37.8 − 2.84534× , 37.8 + 2.84534× = (34.14, 41.46)
$1 $1
➢ En R: 37.8-qt(0.995,20)*5.9/sqrt(21); 37.8+qt(0.995,20)*5.9/sqrt(21)
Solución:
➢ 𝑝: Proporción poblacional de familias que planean viajar a Italia.
➢ Tamaño de muestra: n = 125
➢ Nivel de confianza: 1- 𝛼 = 98% ⇒ 1- 𝛼 = 0.98 ⇒ 𝛼 = 0.02 y (1- 𝛼/2) = 0.99
(C
➢ Proporción muestral: 𝑝@= = 0.12
(+C
Continúa solución:
➢ Nivel de confianza: 1- 𝛼 = 98% ⇒ 1- 𝛼 = 0.98 ⇒ 𝛼 = 0.02 y (1- 𝛼/2) = 0.99
➢ 𝑍 1*𝛼 = 𝑍 1.22 = qnorm(0.99,0,1) = 2.326348 ≈ 2.326
2
1.1$×1.EE 1.1$×1.EE
➢ IC al 98%: 0.12 − 2.326× , 10 + 2.326× = 0.0524, 0.1876
1$4 1$4
➢ En R:
0.12-qnorm(0.99,0,1)*sqrt(0.12*0.88/125);
0.12+qnorm(0.99,0,1)*sqrt(0.12*0.88/125)
➢ Interpretación:
Se tiene un 98% de confianza de que el intervalo (0.0524, 0.1876) captura el
valor real de la proporción poblacional de familias que planean viajar a Italia.
En R
Tamaño de muestra
library(binom)
binom.confint(x = 15, n = 125, conf.level = 0.98, methods = "asymptotic")
## method x n mean lower upper
Nivel de confianza
## 1 asymptotic 15 125 0.12 0.05238367 0.1876163
12 S12
LIC 2 = F ( , n -1 , n -1 )
2
2 2 1
S 22
12 S12
LSC 2 = F (1 − 2 , n 2 - 1 , n1 - 1 )
2 S 22
Intervalos de confianza para diferencia de
medias poblacionales
b) Variancias 12 , 22 desconocidas y homogéneas.
LIC(1 − 2 ) = ( X1 − X 2 ) − Ttab S X1 − X 2
LSC(1 − 2 ) = ( X1 − X 2 ) + Ttab S X1 − X 2 ,
LIC(1 − 2 ) = ( X1 − X 2 ) − Ttab S X1 − X 2
LSC(1 − 2 ) = ( X1 − X 2 ) + Ttab S X1 − X 2 ,
= X1 X2
S12 S22
= +
(S ) + (S )
2 2 2
S X1 − X 2
2 2
n1 n2 X1 X2
S12 N1 − n1 S22 N 2 − n2 n1 − 1 n2 − 1
S X2 1 − X 2 = +
n1 N1 − 1 n2 N 2 − 1
Intervalos de confianza para
la diferencia de proporciones
Para una diferencia de proporciones poblacionales,
cuando los tamaños de muestra son grandes.
p1 (1 − p1 ) p 2 (1 − p 2 )
ˆ 2p1 − p2 = +
n1 n2
Intervalos de confianza
A=305,304,308,309,310,325,280,299
B=300,304,300,309,410,325,180,299
Intervalos de confianza
Nº de artículos con
Peso promedio peso mayor de 310
Máquina n (gramos) Variancia gramos
A 31 305 25.07 4
B 36 308 35.94 7