INTERVALOS

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 27

INTRODUCCIÓN AL R PARA CIENCIAS

BÁSICAS

Intervalos de Confianza

CURSO DE R
Profesor: MSc. Aldo Richard Meza Rodríguez
Introducción
• Estimación Puntual, la estimación del parámetro de interés es mediante
un único valor.
➢ ¿Qué tan precisa es la estimación?
➢ ¿Cuánto es el error que se comete en la estimación?
• Estimación por Intervalo, la estimación está dada por un conjunto de
valores que conforman un intervalo, el cual se confía razonablemente que
captura el valor desconocido del parámetro. Los límites del intervalo son
calculados a partir de la muestra.

Estimación puntual

Estimación por intervalo 9.5 18.5


Límite inferior Límite superior
Características del IC ¿Nivel de confianza?
➢ Si el tamaño de muestra aumenta,
entonces el error de estimación
disminuye. En consecuencia, la
longitud del intervalo disminuye.
*Error de estimación (Margen de error) 𝜇
𝜎
𝑍 𝛼
()+ 𝑛

➢ Si nivel de confianza aumenta,


entonces el error de estimación
aumenta. En consecuencia, la longitud IC que no captura el valor
del intervalo aumenta. real del parámetro.
Ilustración del significado del nivel de confianza.
➢ La longitud del IC es una medida de la En los IC repetidos, la proporción de todos los intervalos de
precisión de la estimación. confianza del 95% que capturan el valor real de 𝜇 es 0.95.
Imagen adaptada de Kokoska (2015).
Intervalo de Confianza
para la Media Poblacional
Esquema General
Se considera una muestra aleatoria 𝑋1, 𝑋2, … 𝑋𝑛 seleccionada de una
población con distribución normal que posee media 𝜇 y varianza 𝜎 2 .

❑ Caso 1: Varianza poblacional (𝜎 2 ) es conocida.


❑ Caso 2: Varianza poblacional (𝜎 2 ) es desconocida.
Caso 1: Varianza poblacional (𝜎 2 ) es conocida

Donde:
➢ 𝑋" : Media muestral
➢𝑍 1*𝛼 : Valor crítico. Valor Z que proporciona una probabilidad acumulada
2
de (1- 𝛼/2) en la distribución normal estándar.
➢ 𝜎: Desviación estándar poblacional
➢ n: Tamaño de la muestra
➢ 1- 𝛼: Nivel de confianza
Ejemplo 1
Se registró los tiempos que utilizan 100 clientes tomados aleatoriamente en
sus distintas operaciones en un banco local. La media de la muestra fue de 10
minutos. Además, se tienen conocimiento que los tiempos utilizados en las
diferentes operaciones se distribuyen de manera normal con desviación
estándar igual a 3 minutos. Estimar un intervalo de confianza del 95% para el
verdadero tiempo promedio utilizado por los clientes.

Solución:

Se tiene los siguientes datos:

➢ 𝜇: Tiempo promedio utilizado por los clientes en sus distintas operaciones en


un banco local.
Continúa solución:
➢ Nivel de confianza: 1- 𝛼 = 95% ⇒ 1- 𝛼 = 0.95 ⇒ 𝛼 = 0.05 y (1- 𝛼/2) = 0.975
➢ 𝑍 1-𝛼 = 𝑍 1.234 = qnorm(0.975,0,1) = 1.959964 ≈ 1.96
2

Reemplazando en la fórmula del IC tenemos:

5 5
➢ IC al 95%: 10 − 1.96× , 10 + 1.96× = 9.412, 10.588
111 111

➢ Interpretación:
Se tiene un 95% de confianza de que el intervalo (9.412, 10.588) captura el
valor real del tiempo promedio que utilizan los clientes en sus distintas
operaciones en un banco local.
En R (Datos resumidos)
library(TeachingDemos)
z.test(10, stdev= 3, n=100, conf.level= 0.95)
##
Nivel de confianza
## One Sample z-test Tamaño de muestra
Media muestral
## Desviación estándar poblacional
## data: 10
## z = 33.333, n = 100.0, Std. Dev. = 3.0, Std. Dev. of the
sample mean =
## 0.3, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##
IC al 95%
9.412011 10.587989
## sample estimates:
## mean of 10
## 10
Ejemplo 2
Una muestra aleatoria de tamaño 9 tomada de una población con distribución
normal con una varianza poblacional de 25 registra los siguientes valores:

53 46 55 45 44 52 46 60 49

Utilice los valores de la muestra para construir un intervalo de confianza del


90% para la media de la población.
En R (Vector de datos)
# Ingreso de datos
x <- c(53,46,55,45,44,52,46,60,49)

# IC al 90%
library(TeachingDemos)
z.test(x, stdev= 5, conf.level= 0.90)
##
Nivel de confianza
## One Sample z-test
Vector de datos ## Desviación estándar poblacional
## data: x
## z = 30, n = 9.0000, Std. Dev. = 5.0000, Std. Dev.
of the sample mean =
## 1.6667, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
IC al 90%
## 47.25858 52.74142
➢ Interpretación: Con 90% de confianza,
## sample estimates: se puede afirmar que el intervalo
## mean of x (47.26, 52.74) captura el valor de la
## media poblacional.
50
Caso 2: Varianza poblacional (𝜎 2 ) es desconocida

Donde:
➢ 𝑋 Media muestral
➢ 𝑡 ()𝛼, 𝑛 ) ( : Valor crítico. Valor t que proporciona una probabilidad acumulada
2
de (1- 𝛼/2) en la distribución t-student con (n-1) grados de libertad.
➢ 𝑆: Desviación estándar muestral
➢ n: Tamaño de la muestra
➢ 1- 𝛼: Nivel de confianza
Ejemplo 4
Cierta establecimiento de comida realiza delivery de sus pedidos sin cobro
alguno. Sin embargo, los clientes suelen dar una propina a la persona que
entrega el pedido. El dueño del local está interesado en estimar el ingreso
medio de propinas por entrega. Para esto, ha seleccionado una muestra
aleatoria simple de 12 entregas y ha registrado las propinas, en soles,
recibidas por la persona encargada de la entrega:

7 7.5 5 6 8.5 2.5 10 5 4.5 0 9 3

Construir un intervalo de confianza del 97% para estimar el ingreso medio de


propinas por entrega. Asumir que la distribución de las propinas sigue una
distribución normal.
En R
# Ingreso de datos
x <- c(7,7.5,5,6,8.5,2.5,10,5,4.5,0,9,3)

# IC al 97%
t.test(x, conf.level = 0.97)
##
## One Sample t-test Nivel de confianza
Vector de datos ##
## data: x
## t = 6.6914, df = 11, p-value = 3.415e-05
## alternative hypothesis: true mean is not equal to 0
## 97 percent confidence interval:
IC al 97%
## 3.557423 7.775910
## sample estimates:
➢ Interpretación: Con 97% de confianza, se puede
## mean of x afirmar que el intervalo (S/.3.56, S/.7.78) captura el
## 5.666667 valor real del ingreso medio de propina por entrega.
Ejemplo 5
El consumo de energía de cierta marca de lavadora está relacionado a la
duración de cada ciclo de lavado. En una muestra aleatoria de 21 lavadoras se
encontró una duración promedio de 37.8 minutos y una desviación estándar
de 5.9 minutos.

a) Asumiendo que los tiempos de lavado de cada ciclo siguen una distribución
normal, encuentre un intervalo de confianza del 99% para el tiempo medio
por ciclo de lavado.
Solución:
Parte a)
➢ 𝜇: Tiempo medio por ciclo de lavado, en minutos.
➢ Nivel de confianza: 1- 𝛼 = 99% ⇒ 1- 𝛼 = 0.99 ⇒ 𝛼 = 0.01 y (1- 𝛼/2) = 0.995
➢ 𝑡 ()𝛼, 𝑛 ) ( =𝑡 A.BBC, +( ) ( = qt(0.995,20) = 2.84534
2

4.2 4.2
➢ IC al 99%: 37.8 − 2.84534× , 37.8 + 2.84534× = (34.14, 41.46)
$1 $1

➢ En R: 37.8-qt(0.995,20)*5.9/sqrt(21); 37.8+qt(0.995,20)*5.9/sqrt(21)

➢ Interpretación: Se tiene un 99% de confianza de que el intervalo (34.14, 41.46)


captura el valor real del tiempo medio por ciclo de lavado.
Intervalo de Confianza
para la Proporción Poblacional
Intervalo de Confianza para la Proporción Poblacional
• El interés es estimar p, la proporción poblacional que tiene la
característica de interés.
• La proporción muestral se denota con 𝒑H
➢ Representa la proporción de elementos que tienen dicha característica en una
muestra aleatoria de tamaño n.
Ejemplo 8
Para anunciar paquetes de vacaciones apropiados, cierta agencia desea
obtener mas informacion sobre las familias que planean viajes al extranjero.
En una muestra aleatoria de 125 familias que planean un viaje a Europa, 15
indicaron a Italia como su destino de viaje. Para aquellas familias que planean
vacaciones en Europa, encontrar un intervalo de confianza del 98% para la
verdadera proporción que viaja a Italia.

Solución:
➢ 𝑝: Proporción poblacional de familias que planean viajar a Italia.
➢ Tamaño de muestra: n = 125
➢ Nivel de confianza: 1- 𝛼 = 98% ⇒ 1- 𝛼 = 0.98 ⇒ 𝛼 = 0.02 y (1- 𝛼/2) = 0.99
(C
➢ Proporción muestral: 𝑝@= = 0.12
(+C
Continúa solución:
➢ Nivel de confianza: 1- 𝛼 = 98% ⇒ 1- 𝛼 = 0.98 ⇒ 𝛼 = 0.02 y (1- 𝛼/2) = 0.99
➢ 𝑍 1*𝛼 = 𝑍 1.22 = qnorm(0.99,0,1) = 2.326348 ≈ 2.326
2

Reemplazando en la fórmula del IC tenemos:

1.1$×1.EE 1.1$×1.EE
➢ IC al 98%: 0.12 − 2.326× , 10 + 2.326× = 0.0524, 0.1876
1$4 1$4

➢ En R:
0.12-qnorm(0.99,0,1)*sqrt(0.12*0.88/125);
0.12+qnorm(0.99,0,1)*sqrt(0.12*0.88/125)
➢ Interpretación:
Se tiene un 98% de confianza de que el intervalo (0.0524, 0.1876) captura el
valor real de la proporción poblacional de familias que planean viajar a Italia.
En R
Tamaño de muestra

library(binom)
binom.confint(x = 15, n = 125, conf.level = 0.98, methods = "asymptotic")
## method x n mean lower upper
Nivel de confianza
## 1 asymptotic 15 125 0.12 0.05238367 0.1876163

Número de observaciones IC al 98%


en la muestra que tienen la
característica de interés
Intervalos de confianza PARA LA
RAZÓN DE VARIANZAS
Para una razón de variancias de poblaciones normales e
independientes.

 12  S12
LIC  2  = F (  , n -1 , n -1 )

 2 
2 2 1
S 22
 12  S12
LSC  2  = F (1 − 2 , n 2 - 1 , n1 - 1 )
 2  S 22
Intervalos de confianza para diferencia de
medias poblacionales
b) Variancias 12 , 22 desconocidas y homogéneas.

LIC(1 −  2 ) = ( X1 − X 2 ) − Ttab S X1 − X 2
LSC(1 −  2 ) = ( X1 − X 2 ) + Ttab S X1 − X 2 ,

donde : Ttab = T(1 - 2 , n1 + n2 − 2)


( n − 1) S 2
+ ( n − 1) S 2
1 1  S p2 = 1 1 2 2
S X2 1 − X 2 = S2p  +  n1 + n2 − 2
 n1 n2 
2 1  N1 − n1  1  N 2 − n2 
S X2 1 − X 2 = Sp    +  
 n1  N1 − 1  n2  N 2 − 1 
Intervalos de confianza
Para una diferencia de medias de poblaciones normales
e independientes.
b) Variancias 12 , 22 desconocidas y heterogéneas.

LIC(1 −  2 ) = ( X1 − X 2 ) − Ttab S X1 − X 2
LSC(1 −  2 ) = ( X1 − X 2 ) + Ttab S X1 − X 2 ,

donde: Ttab =T (1- 2 ,  ) 2


S 2
+ S 
2

=  X1 X2
S12 S22
= +
(S ) + (S )
2 2 2
S X1 − X 2
2 2
n1 n2 X1 X2

S12  N1 − n1  S22  N 2 − n2  n1 − 1 n2 − 1
S X2 1 − X 2 =  +  
n1  N1 − 1  n2  N 2 − 1 
Intervalos de confianza para
la diferencia de proporciones
Para una diferencia de proporciones poblacionales,
cuando los tamaños de muestra son grandes.

LIC (1 − 2 ) = ( p1 − p2 ) − Z tab ˆ p1 − p2


LSC (1 − 2 ) = ( p1 − p2 ) + Z tab ˆ p1 − p2

donde : Z tab = Z(1 − 2 )

p1 (1 − p1 ) p 2 (1 − p 2 )
ˆ 2p1 − p2 = +
n1 n2
Intervalos de confianza

Suponga que dos máquinas A y B producen en forma


independiente un mismo artículo y que en un estudio para
analizar el sistema de producción se encontró los
siguientes resultados:

A=305,304,308,309,310,325,280,299

B=300,304,300,309,410,325,180,299
Intervalos de confianza

Suponga que dos máquinas A y B producen en forma


independiente un mismo artículo y que en un estudio para
analizar el sistema de producción se encontró los
siguientes resultados:

Nº de artículos con
Peso promedio peso mayor de 310
Máquina n (gramos) Variancia gramos
A 31 305 25.07 4

B 36 308 35.94 7

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy