Tarea Completa - Estadistica 2
Tarea Completa - Estadistica 2
Tarea Completa - Estadistica 2
Tarea
Cuando dichos eventos tienen evento dependiente , que están muy relacionados en
la misma caracter´ıstica de estudio por tanto cuando un evento en contexto es dependiente
es causa de otro. Por el contrario un evento no depende de otro y esto se debe de manera
lógica a que el contexto muestra variables independientes
La Estad´ıstica se encarga de resumir, organizar e interpretar datos de manera tal que esos
datos tienen un objeto y comportamiento.Su importancia en la práctica es sobre todo
en ciencia de datos, cuestiones financieras, medicina,negocios, entre otras disciplinas en
concreto ya que para estos casos se suele estudiar con muestras grandes y por lo cual se
realizan técnicas estadı́sticas diferentes.
(c) La diferencia entre concluir que “no hay relación” o “no hay diferencia”, contra concluir
que “no hay relación significativa” o “no hay diferencia significativa”, sobre todo al trabajar
con muestras pequeñas:
Cuando decimos que no hay diferencia, o no hay relación, negamos cualquier tipo de
concordancia entre los conjuntos que se están comparando, pero al añadir la palabra
ßignificativa”, relacionamos de una pequeña manera los conjuntos, pero de tal forma en
la que no tenga importancia alguna en la solución del problema.
(d) La idea de sesgo y sus principales fuentes de ocurrencia, tanto en encuestas y experimentos:
Esta idea la relaciono cuando se realiza un análisis exploratorio de datos ya que en este
se pretende resumir la información en tablas y gráficas y sobre todo en las medidas de
tendencia central y de dispersión. Esto se debe a que hay un criterio que establece si la
Media ¿ Mediana ¿ Moda es sesgada hacia la derecha.
Por otra parte la idea del sesgo tiene que ver o se relaciona con la estimación muestras y
tiene aplicación en el calculo de probabilidades, parámetros y estimaciones puntuales.
(e) La noción de que las coincidencias y ciertos eventos que parecen improbables son bastante
comunes, dado que en la realidad existen much´ısimas posibilidades:
Esta cuestión es muy cierta ya que a pesar de que es muy improbable se suscite cier-
ta coincidencia por ejemplo encontrarnos a un familiar en algún otro lugar o que inclusive
alguien se saque la loter´ıa a menudo sabemos que la probabilidad es m´ınimasin embargo
ocurre otro aspecto más puede ser el tener una enfermedad con muy poca probabilidad
o bien cuestiones en donde existe un grupo de 23 personas se sabe que la probabilidad
de que dos personas cumplan años el mismo dı́a es del 0.5 entonces llegamos a una
conclusión quizás que existen principios de improbabilidad.
(g) Comprender que es algo inherente a muchos fenómenos y que no son lo mismo el compor-
tamiento “normal” y el comportamiento “promedio”:
2. Introducción a LATEX
Escribe los comandos adecuados para generar las siguientes expresiones en LATEX
1
Fn = (Número de xiJ s ≤ x) (1)
n
1Σ
n
= I(−∞, x)(xi ) (2)
n i=1
(b) El gerente de una planta industrial pretende determinar si el número de empleados que
asisten al consultorio médico de la planta se encuentra distribuido en forma equitativa,
durante los cinco d´ıas de trabajo de la semana. Con base en una muestra aleatoria de
cuatro semanas completas de trabajo, se observó el siguiente número de consultas:
(c) Las concordancias y las discrepancias pueden expresarse mediante la siguiente función:
1 si X y Y son concordantes
f (n) = −1 si X y Y son discordantes
0 cualquier otro caso
3. Introduccion a R: Resuelve los ejercicios del cap´ıtulo 1 del libro A Handbook of Statistical
Analyses Using R, Segunda Edición.
(a) Ex. 1.1 Calculate the median profit for the companies in the US and the median profit for
the companies in the UK, France and Germany.
1 # i n st a l a mo s el p a q ue t e HS AU R 2
2
3 install. pa cka ges( " H SAU R 2 " )
4 library ( " H SAU R 2 " )
5
6 # g u a r d a mo s en una t a b l a los d a t o s de 20 0 0 c o m p a i a s l i d e re s p u b l i c a d o s en la
revista forbes
7
8
data( " Fo rb es2 00 0 " , package= " H SAU R 2 ")
9
levels( Fo rbes2 000$ country )
10
11
# c r e a mo s un su b d a t a se t con solo la s e mp r e sa s de EE UU y c a l c u l a mo s la me d i a n a del DS
12
13
e mp r e sa s_ E E U U <- su b se t ( F o r be s2 00 0 , c o un tr y == " U ni t e d S t a t e s " )
14 me d i a n P r o f i t sE E U U <- me d i a n ( e mp r e sa s_ E E U U$ p r o f i t s , na . rm = T RUE )
15
e mp r e sa s_ F r a n c e <- su b se t ( F o r b e s2 0 0 0 , c o u nt r y == " F ra n c e " ) me d i a n
16
P r o f i t sF r a n c e <- me d i a n ( e mp r e sa s_ F r a n c e $ p r o f i t s , na . r m = T RUE )
17
18
e mp r e sa s_ Ge r ma n y <- su b se t ( F o r be s2 00 0 , c o n tr y = " G e r m a n y " ) me d i a n
19
P r o f i t s Ge r ma n y <- me d i a n ( e mp r e sa s_ Ge r ma n y $ p r o f i t s , na . r m = T RUE )
20
21 # i mp r i mi mo s la s me d i a n a s
22
23 p r in t ( pa st e ( " m e di a n of E E U U i s " , me d i a n P r o f i t sE E U U ) , q u o t e = F AL S E )
24 p r in t ( pa st e ( " m e di a n of F ra n c e i s " , me d i a n P r o f i t sF r a n c e ) , q u o t e = F AL S E )
25 p r in t ( pa st e ( " m e di a n of G e rm a n y i s " , me d i a n P r o f i t s Ge r m a n y ) , q u o t e = F AL S E )
26
(c) Ex. 1.3 To which business category do most of the Bermuda island companies belong?
1 # i n st a l a mo s el p a q ue t e HS AU R 2
2
3 install. pa cka ges( " H SAU R 2 " )
4 library ( " H SAU R 2 " )
5
6 # g u a r d a mo s en una t a b l a los d a t o s de 20 0 0 c o m p a i a s l i d e re s p u b l i c a d o s en la
revista forbes
7
8
data( " Fo rb es2 00 0 " , package= " H SAU R 2 ")
9
levels( Fo rbes2 000$ country )
10
11
levels( Forbes2000$ country )
i sl a s Be r mu d a s Co mp a n i e s <- su b se t ( F o rb e s20 0 0 , c o un t r y == " B e r m u d a " )
12
head ( rev ( sort ( t a b l e ( i sl a s Be r mu d a s C o mp a n i e s$ c a t e g o r y ) ) ) ,1)
13
[1] Insurance 10
(d) Ex. 1.4 For the 50 companies in the Forbes data set with the highest profits, plot sales
against assets (or some suitable transformation of each variable), labelling each point with
the appropriate country name which may need to be abbreviated (using abbreviate) to
avoid making the plot look too ‘messy’.
1 # i n st a l a mo s el p a q ue t e HS AU R 2
2
3 install. pa cka ges( " H SAU R 2 " )
4 library ( " H SAU R 2 " )
5
6 # g u a r d a mo s en una t a b l a los d a t o s de 20 0 0 c o m p a i a s l i d e re s p u b l i c a d o s en la
revista forbes
7
8 data( " Fo rb es2 00 0 " , package= " H SAU R 2 ")
9
levels( Fo rbes2 000$ country )
(e) Ex. 1.5 Find the average value of sales for the companies in each country in the Forbes
data set, and find the number of companies in each country with profits above 5 billion
US dollars.
1 # i n st a l a mo s el p a q ue t e HS AU R 2
2
3 install. pa cka ges( " H SAU R 2 " )
4 library ( " H SAU R 2 " )
5
6 # g u a r d a mo s en una t a b l a los d a t o s de 20 0 0 c o m p a i a s l i d e re s p u b l i c a d o s en la
revista forbes
7
8
data( " Fo rb es2 00 0 " , package= " H SAU R 2 ")
9
levels( Fo rbes2 000$ country )
10
11 # o b t ie n e la me d i a de la s v e n t a s de ca da una de la s c i u d a d e s
12 c o l n a me s ( F o r b e s2 0 0 0 )
13 v e c t o r Co u n tr y <- t a p p l y ( F o r b e s2 0 0 0 $ sa l e s , F o r b e s2 0 0 0 $ c o u n tr y , mean , na . r m = T RUE )
14
15 # o b t ie n e los n o mb r e s de la c i u d a d e s con p r of it s a r r i b a de 5 b i l l o n e s
16 p r o f i t sAb o v e 5 B <- su b se t ( F o r b e s2 0 0 0 [ F o r b e s2 0 0 0 $ p r o fi t s >5 , c ( " n a m e " , " c o un t ry " , "
pr of i t s" )])
17 p r o f i t s Ab o v e 5 B$ c o u n t r y <- f a c t o r ( p r o f i t sAb o v e 5 B$ c o u n t r y )
18
l e ve l s ( p r o f i t s Ab o v e 5 B$ c o u n t r y )
4. Pruebas no paramétricas
(a) En un hospital, el número de nacimientos observados para cada mes de cierto año fueron
los siguientes:
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
95 105 95 105 90 95 105 110 105 100 95 100
Si α = 0,01, ¿existe alguna razón para creer que el número de nacimientos no se encuentra
distribuido en forma uniforme durante todos los meses del año?
Solución:
H0 : F = unif (0.083)
H1 : F ƒ= unif (0.083)
n= 1,200
Pi = 0.083
i=1,...,12
Σ12 (Ni −npi )2
Xi2 = i=1 npi
=
= 4.0364128
(b) A continuación tenemos los siguientes datos.
Categor´ıa 0 1 2 3 4 5 6≥
Frecuencia 3 5 6 4 3 2 2
Viernes 6 9 6 11 11 3 5
Viernes 13 13 12 14 10 4 12
n = m =6
Σ R1 = 28
R2 = 60
U1 = nm + n(n+1)
2 − R1 = 29
U2 = nm + m(m+1)
2 − R2 = −3
U = min(U1, U2) = -3
(b) Se obtuvieron datos de experimentos de choques realizados por la National Transportation
Safety Administration. Se compraron automóviles nuevos, se impactaron contra una barre-
ra fija a 35 mi/h y se registraron las mediciones en un maniqu´ı en el asiento del conductor.
Utilice los datos muestrales listados abajo para probar las diferencias en las mediciones de
heridas en la cabeza (de acuerdo con el Head Injury Criterion, HIC) en cuatro categor´ıas
de peso. ¿Existe evidencia suficiente para concluir que las mediciones de heridas en la
cabeza para las cuatro categorı́as de 3 peso de automóviles no son las mismas? ¿Sugieren
los datos que los automóviles más pesados son más seguros en un choque?
R1 = 64
R2 = 52.5
R3 = 44.5
R4 = 49
n=20
ni = 5 → i = 1, 2, 3, 4.
Σk (Ri )2
i=1 n − 3(n + 1) ∼ X k−1
H = 12
n(n+1)
2
i
(c) Abajo se listan los ganadores de la medalla de oro en la carrera de 400 metros planos para
hombres, donde E representa a Estados Unidos y O a cualquier otro pa´ıs. Al parecer, ¿los
paı́ses de los ganadores están en una secuencia aleatoria?
E E E E O E O O E E E O O
E E E E E O O E E E E E E
(d) Supóngase que los siguientes datos constituyen la secuencia de residuos para una ecuación
de regresión estimada:
r= Número de corridas = 8
α = 0.05
µR = 2nn11+n
n2
2
+ 1 = 13.307692
. 2n 1n 2(2n 1n 2−n 1 −n 2)
σ = (n1+n2)2(n1+n2−1)
= 2.35942
R
Z= r−µ R
σR
= −2.67342
⇒ H0 se rechaza.
(e) Demuestre que el coeficiente de la τ de Kendall es:
4Q
τ = 1 − n(n−1)
si P + Q = n(n−1)
2
2(P +Q)−4Q
Dem: 1−4Q
n(n−1)
= n(n−1)−4Q
n(n−1)
= n(n−1)
= PP+Q
−Q
= P −Q
= 1−4Q
=
n(n−1)
τ
n n−1
2
0.1. Laboratorio en R
29.-Leer el artı́culo 25 anos de R escrito por Arturo Erdely y
elabora una breve reseña.
Respuesta:
El articulo nos ayuda a entender el reconocimiento y aprovechamiento de R,
también explica el como fue creado el programa o más bien el lenguaje, con
un propósito general enfocado a necesidades especificas de estadı́stica
computacional, y nos da el nombre de algunas personas que aportaron algo
a el programa R.
En la ciencia de datos destaca la editorial Springer que incluye 70 t´ıtulos
distintos que abarcan las aplicaciones de R para diversas áreas como son
epidemiologı́a, análisis polı́tico, mercadotecnia, ecologı́a, genética, etc.
S´ı ponemos en una balanza R vs Python, como ya fue mencionado R fue
creado para paquetes estadı́sticos y Python fue creado más hacia el área
computacional o sea la programación como tal.
30.-De acuerdo a la información disponible en
http : //adv− r.had.co.nz/Style.html?smau=iV V W 4T 6L1HPPSPf 7
Describe las reglas de guı́a de estilo en R.
Respuesta:
Las reglas de estilo son las siguiente:
- Nombres de objetos: Se usa un guion bajo para separar las palabras dentro
del nombre y las variables y funciones deben de estar en minúsculas.
- Espaciado: Siempre se coloca un espacio después de una coma y no antes,
poner los espacios alrededor de todos los operadores que son =, +, -, ¡-.
- Llaves: Nunca debe ir en su propia l´ınea y siempre debe ir seguida de una
nueva l´ınea.
- Longitud de la lı́nea: Limite de código que son 80 caracteres por lı́nea.
- Sangrı́a: se ocupan dos espacios, no podemos mezclar pestañas y espacios.
- Asignación: Usar “¡-“para la asignación.
- Pautas para comentar: Cada lı́nea comienza con el sı́mbolo de comentario
y un único espacio “#”.
- Lı́neas Comentadas: de -y= para dividir su archivo en trozos fácilmente
legibles.
Respuesta:
El único factor que encuentro es el desayuno, ya que puede ser el
factor que afecte en verdad el resultado del examen, en cuanto a
los niveles hay cuatro, los dos grupos de conteo y los dos grupos
experimentales. Y en lo que a Tratamientos se refiere son las
combinaciones posibles entre los factores y los niveles.
38.-Un ingeniero quı́mico tiene dos catalizadores y tres tempera-
turas que desea usar en una serie de experimentos, ¿cuantos tra-
tamientos hay en este experimento? Describe cuidadosamente uno
de éstos tratamientos.
Respuesta:
Hay 6 tipos de tratamientos para este experimento. un caso
podrı́a ser el de la temperatura 1 con el catalizador 1, el cual
seguramente nos darı́a un resultado diferente al de los demás
casos.
Respuesta:
La hipótesis a probar serı́a:
H1 :Existe diferencia en el número de dı́as
H2 = H 1
Y los datos que se necesitan de cada hospital son:
1. Número de pacientes
1 2 3 4
8.25 7.31 7 6.69
6.67 8.26 7.25 7.32
7.65 6.50 8
7.86 9.42
10.40
Respuesta:
xij = θi + sij
Sustituyendo:
SC E = 2,7519
SC D = 8,1879
k− 1 = 3
n − k = 10
α = 0,05
f3,10;0,05 = 3,71 ∴ Se acepta H0.
41.-Se determino el tiempo de respuesta en milisegundos para tres
diferentes tipos de circuitos que podrı́an usarse en un mecanismo de
desconexión automática. Los resultados se muestran en la siguiente
tabla.
a) Prueba que los tres tipos de circuitos tiene el mismo tiempo de
respuesta. Utiliza α = 0, 01.
b) Si se quiere minimizar el tiempo de respuesta , ¿qué tipo de
circuito se seleccionarı́a?
Respuesta:
H0: Los circuitos tienen el mismo tipo de respuesta.
H1: Los circuitos no tienen el mismo tipo de respuesta.
SCt = SCtr + SCe
ΣΣ 2
1)SCt = x ij.T c
SCt = (9 + 12 + ... + 162 + 72) − 2856,60
2 2
Fc > Ft
16,08 > 2,81
∴ Se rechaza H0
42.-Demuestra que para un experimento con solo un factor com-
pletamente aleatorio con ”t”tratamientos y rrepeticiones
Σt
SCr − SC c = r i=1(yi − y)2
Respuesta:
Rollo
Agente Quı́mico 01 02 03 04 05
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69
Respuesta:
Rollo
Agente Quı́mico 01 02 03 04 05 Yi Y
1 73 68 74 71 67 70.6 70.6
2 73 67 75 72 70 71.7
3 75 68 78 73 68 72.4
4 73 71 75 75 69 72.6
Yi 73.5 68.5 75.5 72.75 68.5
Yij Estimada
72.35 67.35 74.35 71.6 67.35
73.15 68.15 75.15 72.4 68.15
74.15 69.15 76.15 73.4 69.15
74.35 69.35 76.35 73.6 69.35
Residuos Eij
0.65 0.65 -0.35 -0.6 -0.35
-0.15 -1.15 -0.15 -0.4 1.85
0.85 -1.15 1.85 -0.4 -1.15
-1.35 1.65 -1.35 1.4 -0.35
P (F |S)P (S)
P (S|F ) =
P (F |S)P (S) + P (F |SN )P (SN )
= (2k)(.25)
(2k)(.025) + (k)(.75)
.5k
= .25k
1
= .4
Entonces la probabilidad de que un hombre tenga un problema de circulación dado que es fumador es de .4.
57. Una compañia de seguros emite pólizas de seguro de vida en tres categorías separadas: estándar,preferente
y especial. De los asegurados de la compañia, el 50% son estándar, el 40% son preferentes, y el 10% son
especiales. Cada titular de póliza estándar tiene una probabilidad de morir de 0.010 en el próximo año,
cada titular de póliza preferente tiene una probabilidad de 0.005 de morir en el próximo año, y cada
titular de póliza especial tiene una probabilidad de 0.001 de morir en el próximo año.Supongamos que
un asegurado fallece el próximo año. Calcule la probabilidad de que el asegurado sea especial.
Definimos las siguientes probabilidades en base al enunciado anterior:
• P (X1) = .5 (la probabilidad de que un asegurado sea estándar).
• P (X2) = .4 (la probabilidad de que un asegurado sea preferente).
• P (X3) = .1 (la probabilidad de que un asegurado sea especial).
• P (M |X1) = .01 (la probabilidad morir dado que es estándar).
• P (M |X2) = .005 (la probabilidad de morir dado que es preferente).
• P (M |X3) = .001 (la probabilidad de morir dado que es epecial).
Entonces mediante Regla de Bayes tenemos que,
P (M |X3)P (X3)
P (X |M ) =
3
P (M |X1)P (X1) + P (M |X2)P (X2) + P (M |X3)P (X3)
(.001)(.1)
=
(
.5)(.01) + (.4)(.005) + (.001)(.1)
.0001
=
.0071
= .014084
Entonces la probabilidad de que un hombre tenga una póliza especial dado que ha muerto es de .014084.
58. Considera una muestra aleatoria X1, X2, ..., Xn con función masa de probabilidad Bernoulli con
parámetro desconocido θ ∈ Θ = (0, 1).
n
Σ
f (x θ)
| =h(x)c(θ)exp[ Wi(θ)ti(x)]
i=1
1−x
=θx(1 − θ) I(0,1)(x)
(1 − θ)
=θx I(0 ,1) (x)
(1 − θ)xθx
=(1 ) ( )
−θ I x x
(1 − θ)x (0,1)θ
=(1 ) [ ( )] ( )
− θ exp Ln I (0,1) x
(1 − θ)x
θ x
=(1 − θ)exp[Ln( ) ]I(0 1)(x)
(1− θ) ,
θ
=(1 − θ)exp[(x)Ln( )]I(0 1)(x)
(1 ,
− θ)
n
Σ
f (θ |x) =c(θ)α+nexp[(Wi(θ)(β + t(xi))]
i=1
θ Σ
n
=(1 − θ)α+nexp[Ln( )(β + xi)]
1
−θ i=1
θ Σn
(β+ x i)
=(1 − θ) α+n ( ) i=1
1 −θ
x)θ
Σn Σn
=(1 − θ) (α+n−β− i=1 i ( − θ )(β+ i=1 x) i
1
Σn θ (β+ Σn x )−1
=(1 − θ)(α+n−β− i=1x )−1
i
( ) i
1 −θ
i=1
n
n
Σ Σ
∼β(θ|β + n − xi , α + xi))
i=1 i=1
α+ r
θˆ =
β+n−r
59. El siguiente conjunto de datos se distribuye como una Bernoulli con parámetro θ desconocido ,
θ ∈ Θ = (0, 1) :
0 0 1 1 0 1 1 1 1 0
0 0 1 0 1 0 1 1 0 1
1 0 1 0 0 0 0 0 1 0
0 1 0 0 1 1 1 0 1 0
1 1 1 1 1 1 0 0 1 1
0 1 0 0 0 0 0 1 1 0
1 0 0 0 1 0 0 1 0 1
0 1 0 0 0 1 1 0 1 1
0 1 0 0 1 0 1 0 0 0
0 0 1 1 1 1 0 0 1 1
a) Estima los parámetros de la función de distribución a posteriori utilizando solamente información
muestral.
Haciendo uso solamente de la información muestral y conociendo la distribución a posteriori tenemos que,
n n
Σ Σ
f (θ|x) ∼ β(θ| x i, n − x i, )
i=1 i=1
Lo cual corresponde a
θ =α
β
=.48
∫ .025
f (θ|x)dθ =.025
−∞
=0.3831554
∫ ∞
f (θ|x)dθ =.975
.975
=0.57602
0.3831554 ≤ θ ≤ 0.57602
Capítulo 5. Inferencia bayesiana para variables continuas.
60. Sea X1, X2, ..., Xn una muestra aleatoria con función de distribución exponencial con parámetro λ
desconocido, λ > 0,
f (x|λ) = λe−λxI(0,∞)(x)
a) Demuestra que f (x|λ) es familia exponencial.
Tenemos que
n
Σ
f (x λ,
| θ) =h(x)c(θ)exp[ Wi(θ)ti(x)]
i=1
=λe ln(e−λx)
I(0,∞)(x)
=λe I(0,r inf ty)(x)
−λx
n
Σ
f (θ|x) =c(θ) α+nexp[(Wi(θ)(β + t(xi))]
i=1
Σn
α+n −λ(β+ x i))
=λ e i=1
Σn
=λ α+n+1−1e −λ(β+ i=1 x i)
Σ n
∼Γ(α + n + 1, β + xi)
i=1
## X x
## 1 1 23.49709
## 2 2 25.11729
## 3 3 23.07874
## 4 4 27.94056
## 5 5 25.40902
## 6 6 23.10906
b) Análisis exploratorio
summary(datos$x)
## [1] 1.796399
hist(datos1, freq = FALSE, xlab ="xi",
ylab = "densidad", col = "blue",
main = "Histograma de xi")
Histograma de xi
0.20
0.15
densidad
0.10
0.05
0.00
20 22 24 26 28 30
xi
α = 4 y β = 100
d<-seq(20,30,length=1000)
apriori<-function(x)dnorm(x,25,1)
plot(d,apriori(d),type="l",lwd=2,
xlab="xi",
ylab="f(xi)",
col="blue",
main="distribucion a priori")
distribucion a priori
0.4
0.3
f(xi)
0.2
0.1
0.0
20 22 24 26 28 30
xi
d) Graficar la función de distribución a posteriori y ahí mismo señalar la estimación puntual y por intervalo
de probabilidad del 95% del parámetro µ.
m<-(100+sum(datos1))/(4+length(datos1))
desv<-4/(4+length(datos1))
apost=function(x)dnorm(x,m,desv)
plot(d,apost(d),type="l",lwd=2,
xlab="xi",
ylab="f(xi)",
col="blue",
main="distribucion a posteriori",xlim=c(24,26))
## [1] 24.96901
rug(estim, col = "red", lwd = 8)
x1
## [1] 24.89363
x2
## [1] 25.0444
y1 <- dnorm(x1,estim,desv)
y2 <- dnorm(x1+.025,estim,desv)
y3 <- dnorm(x1+.05,estim,desv)
y4 <- dnorm(x1+.07538,estim,desv)
y5 <- dnorm(x1+.1,estim,desv)
y6 <- dnorm(x1+.125,estim,desv)
y7 <- dnorm(x1+.15,estim,desv)
y8 <- dnorm(x1+.175,estim,desv)
y9 <- dnorm(x2,estim,desv)
polygon(cord.x,cord.y,col='darkblue')
distribucion a posteriori
10
4
2
0
xi
e) Ajustar la curva de la densidad de una normal al histograma de los datos. (Utilizar como valor de µ la
estimación puntual que obtuviste en el inciso anterior y varianza σ2 = 4).
hist(datos1, freq = FALSE, xlab ="xi", ylab = "densidad", col = "blue", main = "Histograma de xi")
curve(dnorm(x,estim,2),add = TRUE, col="red", lwd=5)
Histograma de xi
0.20
0.15
densidad
0.10
0.05
0.00
20 22 24 26 28 30
xi
H0
## [1] 0.9351762
H1
## [1] 0.05888051
H2
## [1] 0.005943303
Por lo tanto se escoge H0 que es la hipótesis con mayor probabilidad de ocurrencia.