Tarea 4.

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 20

INSTITUTO TECNOLOGICO DE

CUAUTLA

ALUMNO: López Ortiz Agustín Rafael

CARRERA: Ing. Industrial

MATERIA: Estadística Inferencial II

DOCENTE: Eguia Rivas José Luis.

SEMESTRE: 4°

GRUPO: II
1. prueba de fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales.

La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es
evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de
un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro
o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.

Intuitivamente, podríamos comparar las varianzas de dos poblaciones, y , utilizando la


2 2 2 2
razón de las varianzas muestrales s 1/s 2. Si s 1/s 2 es casi igual a 1, se tendrá poca evidencia para

indicar que y no son iguales. Por otra parte, un valor muy grande o muy pequeño para
s21/s22, proporcionará evidencia de una diferencia en las varianzas de las poblaciones.

La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada


independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,

donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad y


respectivamente.

Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradas con

grados de libertad, respectivamente. Entonces la distribución de la variable aleatoria está


dada por:

y se dice que sigue la distribución F con grados de libertad en el numerador y grados de


libertad en el denominador.
La media y la varianza de la distribución F son:

para

para

La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La distribución


F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo, se encuentra centrada
respecto a 1, y los dos parámetros proporcionan una flexibilidad adicional con respecto a la
forma de la distribución.

Si s12 y s22 son las varianzas muestrales independientes de tamaño n1 y n2 tomadas de poblaciones
normales con varianzas y , respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introducción a la Inferencia Estadística del autor
Güenther, se tendrá que buscar primero los grados de libertad dos para luego localizar el área
correspondiente, relacionándola con los grados de libertad uno, para calcular el valor de F.

Las tablas tienen la siguiente estructura:

P 1 2 3 ……. ….. 500 …

6 0.0005

0.001

0.005

.
0.9995 30.4

El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de
libertad dos con un área de cero a Fisher de 0.995. Si lo vemos graficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos
variables que son los grados de libertad.

Ejemplos :

1. Encontrar el valor de F, en cada uno de los siguientes casos:

a. El área a la derecha de F, es de 0.25 con =4 y =9.

b. El área a la izquierda de F, es de 0.95 con =15 y =10.

c. El área a la derecha de F es de 0.95 con con =6 y =8.

d. El área a la izquierda de F, es de 0.10 con con =24 y

=24

Solución:

a. Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de
libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno.
b. En este caso se puede buscar el área de 0.95 directamente en la tabla con sus respectivos
grados de libertad.

c. Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la derecha de
F de 0.95.

d. Se busca directamente el área de 0.10, con sus respectivos grados de libertad.


Ejemplos:

1. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores


respecto al tiempo en minutos. Los resultados se muestran el la tabla:

Método 1 Método 2

n1 = 31 n2 = 25

s12 = 50 s22 = 24

2 2
Construya un intervalo de confianza del 90% para 1 / 2 .

Solución:

Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la


siguiente fórmula:

al despejar: .

F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este
caso los grados de libertad uno valen 30 y los grados de libertad dos 24.

Estos resultados los podemos interpretar de la siguiente manera:

2 2
Con un nivel de confianza del 90% se sabe que la relación de varianzas 1 / 2 esta entre
1.07 y 3.93. Esto supondría que la varianza de la población 1 es mayor a la varianza de la
población 2 entre 1.07 y 3.93.
2. Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de
manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene
una desviación estándar s1 = 4.7 micropulgadas, y una muestra aleatoria de n2=12 partes del
segundo proceso, la cual tiene una desviación estándar s2 = 5.1 micropulgadas. Se desea
2
encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas 1 /

2
2 .Suponga que los dos procesos son independientes y que la rugosidad de la superficie está
distribuida de manera normal.

Solución:

Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente


fórmula:

al despejar: .

En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.

Estos resultados los podemos interpretar de la siguiente manera:

Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las desviaciones
estándar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de
confianza del 90%.

3. La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos, utilizada


para un proceso en particular, depende del tiempo que tarda el proceso. Un fabricante que emplea dos
líneas de producción 1 y 2, hizo un pequeño ajuste al proceso 2, con la esperanza de reducir la
variabilidad, así como la cantidad media de impurezas en los productos químicos. Muestras de n1=25 y
n2=20 mediciones de dos lotes produjeron las siguientes medias y varianzas:

¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso son
menores para el 2? Realice una prueba con un = 0.05.

Solución:

Datos:

Población 1 Población 2

n1 = 25 n2 = 20

= 0.05

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor .

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno.
1= 25-1 = 24 y 2 = 20-1=19.
Regla de decisión:

Si Fc 2.11 No se rechaza Ho,

Si la Fc > 2.11 se rechaza Ho.

Cálculo:

Decisión y Justificación:

Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un = 0.05 que no existe
suficiente evidencia para decir que la varianza del proceso 2 es menor que la del proceso 1.

4. En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos


máquinas. Robo-fill se usa para llenar 16 tarros y da una desviación estándar de 1.9 onzas en el
llenado. Con Automat-fill se llenan 21 frascos que dan una desviación estándar de 2.1 onzas. Si la
empresa tiene que elegir uno de estos sistemas en función de la uniformidad de llenado. ¿Cual deberá
seleccionar? Use un

= 0.10.

Solución:

Datos:

Robo-Fill

sRF = 1.9

nRF = 16
= 0.10

Automat-Fill

sAF = 2.1

nAF = 21

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor .

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno.
1= 21-1 = 20 y 2 = 16-1=15.

Regla de decisión:

Si Fc 2.20 No se rechaza Ho,

Si la Fc > 2.20 se rechaza Ho.

Cálculo:
Decisión y Justificación:

Como 1.22 es menor que 2.20 no se rechaza Ho, y se concluye con un = 0.10 que la variación de
llenado de la máquina Robo-Fill no es menor a la de Automat-Fill, por lo que se selecciona cualquier
máquina.

5. Las capas de óxido en las obleas semiconductoras son depositadas en una mezcla de gases para
alcanzar el espesor apropiado. La variabilidad del espesor es una característica crítica de la oblea, y lo
deseable para los siguientes pasos de la fabricación es tener una variabilidad baja. Para ello se
estudian dos mezclas diferentes de gases con la finalidad de determinar con cuál se obtienen mejores
resultados en cuanto a la reducción en la variabilidad del espesor del óxido. Veintiún obleas son
depositadas en cada gas. Las desviaciones estándar de cada muestra del espesor del óxido son s1 =
1.96 angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las
desviaciones? Utilice

=0.05.

Solución:

Datos:

s1= 1.96

n1 = 21

s2 = 2.13

n2= 21

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor .


Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno.
1= 21-1 = 20 y 2 = 21-1=20.

Regla de decisión:

Si 0.406 Fc 2.46 No se rechaza Ho,

Si la Fc < 0.406 ó si Fc > 2.46 se rechaza Ho.

Cálculo:

Decisión y Justificación:

Como 0.85 esta entre los dos valores de Ho no se rechaza , y se concluye con un = 0.05 que
existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.

1. 6. Para el ejercicio anterior, encontrar la probabilidad de cometer error tipo II si la verdadera


relación

Solución:
Del ejercicio número 1 del ensayo de hipótesis en donde la variabilidad en la cantidad de impurezas
presentes en un lote de productos químicos dependía del tiempo que tardaba el proceso y el fabricante
empleaba dos líneas de producción 1 y 2, e hizo un pequeño ajuste al proceso 2, calcular la
probabilidad de cometer error tipo II si le relación

1.5.

Solución:

por lo tanto s12/s22 = 2.11 ya que esto fue lo que dio la tabla y al despejar nos queda
los mismo. Se calcula un nuevo valor de F con la relación de varianzas de 1.5.

Si se recuerda para este ejercicio se tienen 24 grados de libertad uno y 19 de grados de libertad dos,
por lo que se tiene que hacer una doble interpolación ya que 19 grados de libertad dos no vienen en la
tabla.

Primero se interpolará para 24 grados de libertad uno y 15 grados de libertad dos:


Area Valor de F

0.50 1.02

0.75 1.41

Al interpolar para un valor de Fisher de 1.406 se ve que este valor está muy cercano a 1.41, el cual le
corresponde un área de 0.75, por lo que queda un resultado de 0.7474

Ahora se procede a interpolar para 24 grados de libertad uno y 20 grados de libertad dos:

Area Valor de F

0.75 1.35

0.90 1.77

La interpolación para un valor de Fisher de 1.406 es de 0.77.

Teniendo los dos valores, se puede calcular el área correspondiente a 24 grados de libertad uno y 19
grados de libertad dos:

Area

15 0.7474

20 0.77

Por lo tanto al interpolar para 19 grados de libertad dos nos da un valor de 0.76548
EJEMPLO 8 Si se quiere determinar las diferencias entre dos metodologías en la educación a
pacientes: una basada en la lectura de trípticos y otra basada en el poyo profesional complementada
con trípticos.

EJEMPLO 9 Si asignamos la población 1 a todos aquellos pacientes que aprenden empleando el


método de lectura con varianza y la población 2 de los pacientes que aprenden con el método
asistencia profesional complementaria, con varianza.

EJEMPLO 10
EJEMPLO 11

EJEMPLO 12
2. COMPARACIONES DE DOS MUESTRAS PAREADAS

El procedimiento Comparación de Muestras Pareadas está diseñado para comparar datos en 2


columnas numéricas donde los valores en cada fila están pareados, i.e., corresponden al mismo sujeto
o unidad experimental. La razón principal para tal comparación típicamente es determinar si el factor
que diferencia las columnas tiene o no efecto en los datos.

El procedimiento Comparación de Muestras Pareada es análogo al procedimiento Análisis de Una


Variable en términos de salida y opciones, ya que opera sobre una sola columna de diferencias
pareadas. Unas discusiones detalladas de las bases matemáticas de los cálculos realizados pueden
encontrarse en la documentación del Análisis de Una Variable.

¿Se trata de dos muestras independientes o pareadas?

Diremos que dos muestras son independientes cuando no se establece ninguna relación previa al
análisis entre las unidades de una y otra muestra. Por ejemplo, sujetos de uno y otro curso, enfermos
de dos consultorios, hombres comparados con mujeres.

En cambio diremos que se trata de muestras pareadas si en forma previa al análisis, se forman parejas
entre los individuos de una muestra con los individuos de la otra muestra. Por ejemplo el caso con su
control, distintas dietas pueden probarse en dos animales de la misma camada. Sin embargo, cuando
queda más clara esta situación es cuando se comparan distintas medidas para los mismos individuos;
por ejemplo, al medir antes y después del tratamiento a un mismo grupo de individuos se obtienen
resultados pareados o correlacionados.

A la luz de las varianzas de las muestras, ¿podemos suponer que las varianzas son iguales?

Bueno, en esta parte y con todo derecho, podríamos reclamar en contra de las complicaciones de la
estadística, pero seguramente el cumplimiento de estas exigencias nos permitirá obtener resultados
más confiables.

Cada posible respuesta a estas interrogantes nos conducirá a ocupar una fórmula distinta para calcular
el estadístico. Por ello veremos, en primer lugar, la forma de responder a las preguntas planteadas.

Las respuestas

La respuesta a la primera pregunta es fácil, porque se encuentra incorporada dentro del mismo
problema de investigación: es una característica de los datos; forma parte del diseño de la
investigación.

La segunda pregunta tampoco es tan complicada porque será cuestión de revisar los antecedentes de
que dispone el investigador. Lo más frecuente es que este dato se desconozca y, por lo tanto, nosotros
asumiremos que la o las varianzas del universo son desconocidas.

Para responder a la tercera pregunta se hace necesario realizar una prueba de hipótesis para probar la
igualdad o diferencia de las varianzas. La realización de la misma no es difícil y es frecuente que los
programas computacionales de análisis estadístico la hagan en forma automática sin que sea
necesario solicitarla, y la entreguen como parte de los resultados. Como lo más frecuente es que las
varianzas de las muestras comparadas tengan varianzas similares, nosotros haremos los análisis bajo
este supuesto.

Hechas estas aclaraciones procederemos a describir en forma general los estadísticos que participan
en cada situación.

3. MODELO TOTALMENTE ALEATORIO: ANÁLISIS DE VARIANZA DE UN FACTOR.

El análisis de la varianza es un caso de aplicación de un contraste de hipótesis a un modelo lineal


especifico.

Tomando como referencia, un modelo, en un contraste de hipótesis se requiere la formulación de una


hipótesis nula y otra alternativa, la construcción de un estadístico (a partir de los datos muéstrales) con
una distribución conocida y el establecimiento de una región de aceptación y otra de rechazo.

El modelo teórico de referencia en el análisis de la varianza es muy sencillo y viene expresado por
cualquiera de las expresiones alternativas que se adjuntan, que son equivalentes.

En las dos formulaciones, considerando G poblaciones, cada vlor de la variable es igual a una media
teorica mas una variable aleatoria (8g)), que implicitamente tiene de medio cero.

En el modelo teórico la media de cada población es igual a un parámetro , en el modelo teórico la


media de cada poblacion se define mediante dos parámetros: una media general y un parametro que
recoge la discrepancia especifica de cada población respecto a la media general. En este caso, las
discrepancias estan sujetas a que su suma sea nula.

Hipotesis de la poblacion: para especificar un modelo se requiere establecer hiotesis acerca de los
elementos que aparecen en el mismo. Las hipotesis estadisticas que se adoptan se requiere a la
poblacion y, en consecuencia, al proceso de obtencion de la muestra.

Hipotesis estadistica sobre la poblacion: Hiotesis de homocedasticidad: las varianzas de todas las
poblaciones son identicas cada una de las poblacones tiene una distribucion normal de se desprende
que la variable aleatoria Modelos teóricos en el análisis de la varianza.

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K
>2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de
las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados
experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con
respecto a la variable dependiente o de interés.

El Anova requiere el cumplimiento los siguientes supuestos:

 Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada


factor) son normales.
 Las K muestras sobre las que se aplican los tratamientos son independientes.

 Las poblaciones tienen todas igual varianza (homoscedasticidad).

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy