Ejemplos Anova

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

 

PRUEBA DE LA VARIANZA CON UNA POBLACIÓN

A veces, los analistas investigan la variabilidad de una población, en

lugar de su media o proporción.


Esto es debido a que la uniformidad de la producción muchas veces es
crítica en la práctica industrial.
La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba
de hipótesis está diseñada para determinar si la varianza de una población es
igual a algún valor predeterminado.
La desviación
desviación estándar
estándar de una colección
colección de datos se
se usa para describir 
la variabilidad en esa colección y se puede definir como la diferencia estándar 
entre los elementos de una colección de datos y su media.

La varianza de un conjunto de datos se define como el cuadrado de su


desviación estándar; y la varianza muestral se utiliza para probar la hipótesis
nula que se refiere a la variabilidad y es útil para entender el pocedimiento de
análisis de la varianza.
La hipótesis nula; para la prueba de la varianza, es que la varianza
poblacional es igual a algún valor previamente especificado. Como el aspecto
de interés, por lo general es si la varianza de la población es mayor que este
valor, siempre se aplica una de una cola.
Para
Para pr
prob
obar
ar la hipó
hipóte
tesi
siss nula
nula,, se toma
toma un
una
a mu
mues
estr
tra
a al
alea
eato
toria
ria de

elementos de una población que se investiga; y a partir de esos datos, se


calcula el estadístico de prueba.
Para este cálculo se utiliza la siguiente ecuación:

( n – 1 ) s2
χ 2 = ----------------
2
  δ
 

Donde:

* n-1 = Grados de libertad para la prueba de tamaño n.

* s2 = Varianza muestral.

* δ 2 = Varianza poblacional si y solo si suponemos que la hipótesis nula


es cierta.

EJEMPLO

1.- Averiguar si la variabilidad de edades en una comunidad local es la


misma o mayor que la de todo el Estado. La desviación estándar de las edades

del Estado, conocida por un estudio reciente es de 12 años. Tomamos una


mues
mu estra
tra alea
aleato
tori
ria
a de 25 pers
person
onas
as de la comu
comuni
nida
dad
d y de
dete
term
rmin
inam
amos
os su
suss
edades. Calcular la varianza de la muestra y usar la ecuación anteriormente
explicada para obtener el estadístico muestral.
Las hipótesis nula y alternativas son:

• H 0 : δ 2 = 144
• H 1 : δ 2 > 144

Se toma la muestra y resulta una desviación estándar muestral de 15


Años. La varianza de la muestra es entonces 225, y el estadístico ji cuadrada
de la muestra es:

(n – 1 ) s2 (25-1)(15)2
χ 2 = --------------- = ------------------- = 37,5
  δ 2
122
 

Si la hipótesis nula es cierta, el estadístico muestral de 37,5 se obtiene


de la distribución ji cuadrada teórica, en particular, la distribución con 24 grados
de libertad ( 25 - 1 = 24 ).
Como se puede observar en la ecuación anterior, cuanto mas grande es
la varianza muestral respecto a la varianza poblacional hipotética, mas grande

es el estadístico que se obtiene. Luego deducimos que de un estadístico


muestral grande llevamos al rechazo de la hipótesis nula, y un estadístico
muestral pequeño implicará que no se rechaze. La tabla ji cuadrada se usa
para determinar si es probable o no que el valor 37,5 haya sido obtenido de la
distribución muestral ji cuadrada hipotética.
Supongamos que esta prueba debe llevarse a un nivel de significancia
de 0,02. En la columna 0,02 de la tabla de ji cuadrada y la fila 24, se encuentra
el valor critico de 40, 27. La regla de decisión es:

2
Si χ   > 40,27, se rechaza la hipótesis nula de que la varianza de la
población es 144 ( Se rechaza H 0 si χ 2 > 40,27 ).

Como estadístico de prueba calculado es 37,5, la hipótesis nula no se


rechaza (con riesgo de un error de tipo II). Si en la tabla de ji cuadrada se
hubiese elegido un alfa de 0,05, el valor crítico de la tabla sería 36,415, y la
hipótesis nula se hubiera rechazado (37,5 > 36,415). En este ejemplo se ilustra
la importancia de pensar con cuidado en el riesgo apropiado de un error de tipo
I en una prueba de hipótesis.

Se supone que la hipótesis nula es cierta, lo que conduce a la obtención


de un estadístico muestral de una distribución ji cuadrada con 2 grados de
libertad.
 

PRUEBA DE LA VARIANZA CON DOS POBLACIONES

En ocasiones es importante comparar dos poblaciones para ver si una


es mas variable que la otra en alguna medida específica. La hipótesis nula es
que las dos poblaciones tienen la misma varianza, y la hipótesis alternativa es
que una tiene mayor varianza que la otra. Se obtienen muestras aleatorias de
cada población y se calculan las varianzas muestrales. Estos valores se usan
entonces en la ecuación siguiente para calcular el estadístico de la muestra:

Cociente F 
S12
F = ---------
S22
 
Donde:

• S12 = Varianza de la muestra 1


• S22 = Varianza de la muestra 2
 

Nota: Por convivencia, para encontrar los valores de F, por lo general se


 pone en el numerador la varianza muestral mas grande.

El estadístico de prueba dado por la ecuación anteriormente nombrado,


es el cociente F . Si la hipótesis nula de varianzas poblacionales iguales es

cierta, la razón de las varianzas muestrales se obtiene de la distribución F  


teórica. Al consultar la tabla F se puede evaluar la probabilidad de este suceso.
Si parece probable que el cociente F pueda haberse obtenido de la distribución
muestral supuesta, la hipótesis nula no se rechaza. Si es poco probable que el
cociente F se haya obtenido de la distribución supuesta, la hipótesis nula se
rechaza.
La distribución F  especifica que se aplica a una prueba en particular 
qued
queda
a dete
determ
rmin
inad
ada
a por
por dos
dos pa
pará
ráme
metro
tros:
s: lo
loss grad
grados
os de lilibe
bert
rtad
ad pa
para
ra el
numerador
numerador y los grados de libe
libertad
rtad para el denominad
denominador.
or. Cada uno de estos

valores es n-1. Si se conocen estos valores y se elige un valor alfa, al valor 


crítico de F se puede encontrar en la tabla F .

EJEMPLO

1.- Averiguar si la variabilidad del salario por hora es la misma en dos


sucursale
sucursales,
s, o si la varia
variabilid
bilidad
ad de la sucursal 1 es mayor que la de la sucu
sucursal
rsal
2. La comparación de la variabilidad de las dos sucursales constituye el primer 
paso en un estudio detallado sobre ingresos.

Se toman muestras aleatorias de los salarios por hora en cada sucursal


para determinar las varianzas muestrales y elegimos un nivel de significancia
de 0,05. La hipótesis nula y alternativa son:

• H 0 : δ 1
2
-δ 2
2
 ≤ 0
2 2
• H 1 : δ 1 -δ 2 >0

Los resultados de la muestra son:

2
1 1
S = $3,79 S = 14,3641 n1 = 21 (Sucursal 1)
 

S2 = $2,48 S22 = 6,1504 n2 = 25 (Sucursal 2)

El estadí
estadísti
stico
co F  se ca
calc
lcul
ula
a me
medi
dian
ante
te la ecua
ecuaci
ción
ón an
ante
teri
rior
orme
ment
nte
e
explicada:

2
1
S 14,3641
F = ------- = ---------------- = 2,34
  S22 6,1504

El cociente F  indica que la varianza muestral de la población 1 es 2,34


veces la varianza muestral de la población 2. Sin embargo, dados los tamaños
de las muestras ¿Es suficiente esta evidencia para rechazar la hipótesis de que
las poblaciones tiene la misma varianza?. Se necesita el valor crítico de F para
contestar esta pregunta. Primero, se calculan los grados de libertad para el

numerador y el denominador:

Gl (numerador) = (n1 – 1) = (21 – 1) = 20


Gl (denominador) = (n2 – 1) = (25 – 1) = 24

Se usa la tabla F para encontrar el valor crítico. Hay dos valores de F en
la tabla: uno para el nivel de significancia de 0,05 y otro para el nivel de 0,01. Al
ser ésta una prueba de una cola, como sugiere la hipótesis alternativa, toda el
área de 0,05 o de 0,01 estará en el extremo superior de la curva.

Lass co
La colu
lumn
mnasas de la ta
tabl
bla
a F  representan los grados de libertad del
numerador, por lo que se selecciona la columna 20. Las filas corresponden a
los grados de libertad del denominador, así que se elige la fila 24. El valor 
crítico de F a un nivel de significancia de 0,05 para 20 grados de libertad en el
numerador y 24 grados de libertad en el denominador es 2,02.
El cociente F  calculado a partir de los datos de la muestra es 2,34.
Según este valor de prueba, la hipótesis nula se rechaza (2,34 > 2,02). Si
acepta un riesgo del 5% de un error de tipo I, las poblaciones no tienen la
misma varianza.
 

EJEMPLO

2.- ¿Son iguales las varianzas de dos poblaciones de edades de los


artículos en inventario, o la población 2 tiene una mayor varianza? Se toman

muestras aleatorias de 53 artículos de cada población de inventario y se


calculan las varianzas muestrales. La prueba ha de llevarse a cabo con un nivel
de significancia de 0,01. Las hipótesis nula y alternativa son:

• H 0 : δ 2
2
-δ 1
2
 ≤ 0
2 2
• H 1 : δ 2 -δ 1 >0

Los grados de libertad del numerador y denominador son 52 (53-1). En


La tabla F  abreviada, la fila 50 y la columna 50 se usan como aproximaciones

de los grados de libertad. La regla de decisión es:

Si el cociente F calculado es mayor que 1,94, se rechaza


r echaza la hipótesis
nula (se rechaza H 0 si F > 1,94).
Los resultados de la muestra son:

S12 = 489 n1 = 53 (inventario 1)


S22 = 1,37 n2 = 53 (inventario 2)
 

El estadístico F se calcula mediante la ecuación anteriormente


explicada:

S12 1,370
F = --------- = ----------- = 2,8
S22 489

Una de las varianzas muestrales es 2,8 veces mas grande que la otra.
La hipótesis nula se rechaza ya que el estadístico de prueba (2,8) excede al

valor crítico (1,94) de la tabla F . Se puede concluir que el inventario 2 tiene mas
 

variabilidad en el tiempo que el inventario 1.

CONCEPTOS BÁSICOS PARA ANOVA

 Análisis para la varianza

EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola


variable numérica medida en los elementos de la muestra para probar la
hipótesis nula de igualdad de medias poblaciones. Esta variable puede
ser de intervalo o de escala de razón.
Esta
Esta var
aria
iabl
ble
e al
algu
guna
nass vece
vecess reci
recibe
be el no
nomb
mbre
re de vari
variab
able
le
dependiente, en especial en programas de computadora que ejecutan ANOVA.
La hipótesis nula que se prueba en el ANOVA es que la mayoría

de las poblaciones que se estudian (al menos tres) tienen el mismo valor de la
media para la variable dependiente. Las hipótesis nula y alternativa en ANOVA
son:
H 0: µ 1 = µ 2 = µ 3 = ... = µ c 
H 1: No todas las poblaciones tienen la misma media.
EL ANÁLISIS DE LA VARIANZA (AN
(ANOVA) ES UN PROCEDIMIENTO
EST
STAD
ADÍS
ÍST
TICO
ICO PA
PARA
RA DE
DET
TER
ERMI
MINA
NAR
R SI LAS MEDI
MEDIAS
AS DE TRE
RES
S O MA
MAS
S
POBLACIONES IGUALES.

En la prueba ANOVA, se reúne evidencia muestral de cada población


bajo estudio y se usan estos datos para calcular un estadístico muestral.
Después se consulta la distribución muestral apropiada para determinar si el
estadístico muestral contradice la suposición de que la hipótesis nula es cierta.
Si es así, se rechaza; de lo contrario no se rechaza.
Hemos de recordar que en la prueba de varianza con dos poblaciones
se calcula el coeficiente de las varianzas muestrales y se verifica con arreglo a
la distribución F . Este procedimiento también se usa en ANOVA para probar la
hipótesis nula.

Se supone que todas las poblaciones bajo estudio tienen la misma


varianza, sin importar si sus medias son iguales. Es decir, ya sea que las
 

poblaciones tengan
tengan medias iguales o distintas, la variabilidad
variabilidad de los elementos
elementos
alrededor de su respectiva media es la misma. Si esta suposición es válida,
entonces se puede probar la hipótesis nula de las medias poblacionales iguales
usando la distribución F .

Método dentro y método entre.

El método dentro para estimar la varianza de las poblaciones produce


una estimación válida, sea o no cierta la hipótesis nula. El método entre
produce una estimación válida sólo si la hipótesis nula es cierta.

El paso final en ANOVA requiere el cálculo de un cociente con la


estimación del método entre en el numerador y la estimación del método dentro
en el denominador.. Si la hipótesis nula de que las poblaciones tienen la misma

media es cierta, esta razón consiste en dos estimaciones separadas de la


misma varianza poblacional y, se puede obtener la distribución F  si las medias
poblacionales no son iguales. La estimación en el numerador estará inflada, y
el resultado será un cociente muy grande. Al consultar la distribución F  no es
probable que un cociente tan grande haya sido obtenido de esta distribución, y
la hipótesis nula será rechazada. La prueba de hipótesis en ANOVA es de una
cola: un estadístico F  grande llevará al rechazo de la hipótesis nula y un valor 
pequeño hará que no se rechace.

• METDO DENTRO

El método dentro de estimación de la varianza produce una estimación


válida sin importar si la hipótesis nula de las medias poblacionales iguales es
cierta. Esto se debe a que la variabilidad de los valores de la muestra se
determina comparando cada elemento en los datos con la media muestral.
Cada valor de la muestra obtenido de la población A se compara con la media
muestral A; cada elemento obtenido de la población B se compara con la media
muestral B, y así sucesivamente. La ecuación para calcular la estimación de la

varianza con el método dentro es:


 

  ∑ ∑ ( xij – x j ) 2


 j i
Sw2 = ----------------------------

c (n – 1)

Donde:

• sw2 = Estimación de la varianza muestral con el método entre.


• Xij = i-ésimo elemento de los datos de grupo j.
• X j = media del grupo j
• C = número de grupos
• N = número de elementos de la muestra en cada grupo.

El doble signo de suma en la ecuación, significa que primero deben


sumarse los valores indicados por el signo de la derecha, y después sumar los
valores indicados por el de la izquierda. Primero, se encuentran las diferencias
entre cada valor x y la media del grupo, se elevan al cuadrado y se suman.
Después, se agregan estas sumas para cada grupo. El resultado es la suma
del cuadrado de las desviaciones entre cada medida de la muestra y la media
de su grupo.
grupo. Este valor con frecuenci
frecuencia
a se llama la suma de cuadrado
cuadradoss dent
dentro
ro
(SCw). Esta suma se divide después entre el número adecuado de grados de
libertad para poder producir una estimación de la varianza desconocida de la
población.
El número adecuado de grados de libertad para el método dentro se
calcula como c(n-1) si el número de observaciones en cada grupo es igual.
Como a cada elemento del grupo se le resta la media de ese grupo, sólo (n-1)
elementos de cada grupo pueden variar. Además como se tienen c grupos, c
se multiplica por (n-1) para obetener los grados de libertad para el método
dentro.
 

EJEMPLO

1.- Se obtienen muestras del peso del llenado de cuatro paquetes de

espinacas congeladas, a partir de tres contenedores. La preguntas es si los


peso
pesoss prom
promed
edio
io de lo
loss pa
paqu
quetetes
es so
son
n ig
igua
uales
les o di
dife
fere
rent
ntes
es en
entr
tre
e lo
loss tre
tress
contenedores. Seguidamente se ofrecen los pesos de la muestra (en onzas),
medias de grupos, media global y estimación de la varianza con el método
dentro usando la ecuación correspondiente.

GRUPO 1 GRUPO 2 GRUPO 3


___________________________
__________________________________________
_________________ 
__ 
12,4 11,9 10,3

13,7 9,3 12,4


11,5 12,1 11,9
10,3 10,6 10,2
Media 12,00 11,00 11,2

Media Global à 11,4

• ∑(xi – x1)2 = (12,4 – 12)2 + (13,7 – 12)2 + (11,5 – 12)2 + (10,3 – 12)2 =
6,19

• ∑(xi – x2)2 = (11,9 – 11)2 + (9,3 – 11)2 + (12,1 – 11)2 + (10,6 – 11)2 =
5,07
• ∑(xi – x 3)2 = (10,3 – 11,2)2 + (12,4 – 11,2)2 + (11,9 – 11,2)2 + (10,2 –
11,2)2 = 3,74

  ∑ (xIJ – xJ)2 6,
6,19
19 + 5,
5,07
07 + 3,74
3,74 15
SW2= ------------------ = ----------------------------
------------------- --------- = -------- = 1,67
c(n-1) 3(4-1) 9

Cada valor x en la muestra se compara con la media de su propio


 

Grupo. Estas diferencias se elevan al cuadrado y se suman de acuerdo con la


ecuación anteriormente descrita. Los valores que resultan se suman y se
dividen entre los grados de libertad. El resultado, 1,67, es una estimación de la
varianza común de las tres poblaciones. Con frecuencia el término S W2 se
denomina error cuadrático medio (MSE).

La razón por la que el método dentro produce una estimación válida de


la varianza desconocida de la población, sin importar el estado de H 0.

EJEMPLO

2.- Se pidió a cuatro personas que beben una marca determinada de


café que registraran el número de tazas consumidas por día. Lo mismo se hizo
con bebedores de otras tres marcas. Los resultados se muestran en la tabla.

Estime la varianza poblacional común mediante el método dentro.

MARCA “ A ” MARCA “ B “ MARCA “ C “ MARCA “ D “


 _________________________
 _________________________________________
____________________________
_________________ 
_____ 
3 5 2 3
2 1 10 6

5 4 5 4
6 6 7 5
Media 4 4 6 4,5

Media Global à4,625

• ∑(xi – x1)2 = (3 – 4)2 + (2 – 4)2 + (5 – 4)2 + (6 – 4)2 = 10


• ∑(xi – x2)2 = (5 – 4)2 + (1 – 4)2 + (4 – 4)2 + (6 – 4)2 = 14
• ∑(xi – x3)2 = (2 – 6)2 + (10 – 6)2 + (5 – 6)2 + (7 – 6)2 = 34
• ∑(xi – x4)2 = (3 – 4,5)2 + (6 – 4,5)2 + (4 – 4,5)2 + (5 – 4,5)2 = 9,25
 

  ∑ (xIJ – xJ)2 10 + 14 + 34 + 9,25 67,25


SW2= ------------------ = ----------------------------
------------------- --------- = -------- = 5,60
5,60416
416
c(n-1) 4(4-1) 12

• METODO ENTRE

El segundo método para estimar la varianza común de la población


produce una estimación válida sólo si la hipótesis nula es cierta. Para entender 
el método entre recuerde el teorema del límite central. Este importante teorema
en estadística establece que la distribución de las medias muestrales tiende a

una distribución normal conforme crece el tamaño de la muestra, con una


media µ y una desviación estándar  δ √ n. Si el error estándar de la media es
δ √ n, entonces la varianza de la distribución es igual al error estándar al
cuadrado, δ 2√n.
Esta varianza es una medida de las diferencias entre todas las medias
muestrales que puedan obtenerse de la distribución y la media de la población.
La raíz cuadrada de esta varianza es el error estándar de la media, es decir, la
diferencia estándar entre una media muestral y la media poblacional.
En ANOVA, para estimar la varia
varianza
nza de la distribució
distribución
n muestral de
medias, se debe estimar primero la mdia poblacional. La media de todos los
valore
valoress mue
muestr
strale
aless pro
propor
porcio
ciona
na esa est
estima
imació
ción.
n. Des
Despué
pués,
s, se det
determ
ermina
ina la
diferencia entre la media de cada grupo y esta media poblacional estimada, y
estas diferencias se elevan al cuadrado y se suman. Este valor, con frecuencia
se llama la suma de cuadrados entre (SC b). Esta suma se divide entonces
entre el número adecuado de grados de libertad para obtener la estimación de
la varianza de la distribución muestral. La ecuación siguiente da el cálculo de la
estimación de la varianza de la distribución muestral de las medias:
 

∑ (x j – x)2
 j
sx2 = ---------------------

c- 1

Donde:

• Sx2 = Estimación de la varianza de la distribución muestral de medias.


• X j = Media del grupo j.
• X = Medi
Media
a Gl
Glob
obal
al (med
(media
ia de todo
todoss lo
loss va
valo
lore
res)
s) us
usad
ada
a como
como
estimación de µ .
• C = número de grupos.

Para la distribución muestral de las medias δ x


2
=δ 2
/ n, en donde n es
el
tamaño
tamaño de la muestra
muestra o el número de elemen
elementos
tos de cada gr
grupo.
upo. Al evaluar 
evaluar 
esta ecuación para una estimación de la varianza (δ 2) se obtiene:

  δ 2

2
• δ x = -----
n
 
2
• nδ x = δ 2

2 2
• δ = nδ x

Se puede calcular una estimación de δ 2 si se multiplica n por la


2
estimación de δ , es decir;
x
 

s2 = nsx2

La estimación del método entre de la varianza se puede calcular si se


sustituye el valor de la ecuación anteriormente explicada por sx2:

n∑ (x j – x)2
j
sx2 = ---------------------
c- 1
 
Donde:

• sb2 = Estimación del método entre de la varianza poblacional común.


• x j = media del grupo j.
• x = me
med
dia glo
loba
ball (m
(me
edia
dia de to
todo
doss lo
loss val
alor
ores
es),
), usa
sad
da com
omo
o
estimación de µ .
• c = número de grupos
• n = número de elementos de la muestra en cada grupo si el número
de observaciones en cada uno es el mismo.

El valor adecuado de los grados de libertad para el método entre es c-1.


como la media global se resta de la media de cada grupo, sólo (c-1) medias
pueden variar. Observe que la ecuación anteriormente descrita, supone que el
número de observaciones en cada grupo, n, es el mismo.

EJEMPLO

En el ejemplo anterior al de antes, se obtuvo una muestra de los pesos


de llenado de cuatro paquetes de espinacas congeladas de tres contenedores
 

y se calculó una estimación de la varianza poblacional desconocida con el


método
método den
dentro
tro.. En est
este
e ejempl
ejemplo,
o, la varian
varianza
za po
pobla
blacio
cional
nal des
desco
conoc
nocida
ida se
estimará mediante el método entre:

(12,0 – 11,4)2 + (11,0 – 11,4)2 + (11,2 –11,4)

n∑ (x j – x)2
j 4 (0
(0,5
,56)
6) 2,24
2,24
sx2 = --------------------- = ------------- = -------- = 1,12
c- 1 3–1 2

La estimación de la varianza poblacional, calculada con el método entre


es 1,12.

• TABLA Y PRUEBA F  PARA ANOVA

Una vez que se ha usado el método dentro y entre, para estimar la


varianza desconocida de las poblaciones, se forma un cociente con estas
dos estimaciones:

sb2 estimación de δ 2 por el método entre


F = -----------------------------------------------------------
sb2 estimación de δ 2 por el método dentro

Si la hipótesis nula es cierta, tanto el numerador como el denominador 


de la ecua
ecuaci
ción
ón son es
estitima
maci
cion
ones
es váli
válida
dass de la va
vari
rian
anza
za co
comú
mún
n de la
lass
poblaciones que se estudian. Este cociente se ajusta a la distribución F . Si la
hipó
hipóte
tesi
siss nu
nula
la es fa
fals
lsa
a el nume
numera
rado
dorr de la ecua
ecuaci
ción
ón en real
realid
idad
ad es una
una
 

estimación inflada de δ 2; el denominador sigue siendo una estimación válida.


Bajo estas condiciones, el valor  F  será muy grande, y se puede concluir que la
hipótesis
hipótesis nula es falsa. La figura que
que mostramo
mostramoss a cont
continuac
inuación
ión presenta
presenta la
dist
distrib
ribuc
ución
ión mu
mues
estr
tral
al para
para la pr
prue
ueba
ba AN
ANOV
OVA
A ju
junt
nto
o co
con
n la
lass regio
regione
ness de
aceptación y rechazo.

La siguiente figura ilustra el paso final de la prueba de hipótesis ANOVA.


Si la hipótesis nula de medias poblacionales iguales es cierta, el estadístico F 
calculado se obtuvo de esta distribución; esto parece razonable siempre que el
valor  F  no sea demas
demasiado
iado grande. De los datos mues
muestrales
trales resulta un valor 
valor  F 
muy grande, se concluye que medias poblacionales diferentes son las causas
de que el numerador en el cálculo de F  esté inflado, y la hipótesis nula se
rechaza. En la figura siguiente se puede observar que alfa ( α ), la probabilidad
de un error tipo I se indica en la cola superior. Si la hipótesis nula es en
realidad cierta existe alguna posibilidad de que equivocadamente se declare

falsa. La probabilidad de que esto ocurra es alfa ( α ), es decir, el nivel de


significancia de la prueba.

• TABLA ANOVA

Los resultados del análisis de varianza se presentan en una tabla


ANOVA que resume los valores importantes de la prueba. Esta
 

tabla tiene un formato estándar que usan los libros y los problemas de
computadora que ejecutan ANOVA. La siguiente tabla muestra la
l a forma general
de la tabla ANOVA.
En dicha tabla se resumen los cálculos necesarios para la prueba de
igualdad de las medias poblacionales usando análisis de
2
varianza. Primero se usa el método dentro para estimar δ .Cada valor de los
datos se compara con us propia media, y la suma de las diferencias al
cuadrado se divide entre los grados de libertad c(n-1).
FuFuente de SC GL Estimación de Coeficiente F
Variación δ 2
Grupos Entre n ∑ ( x j – x ) 2 c - 1 SSb / glb S SSb2 / Sw2

Grupos ∑ ∑ ( xij – x j ) 2 c(n-1) SSb / glb


Dentro
Total ∑ ∑ ( xij – x ) 2 nc –1

Donde:

•  j = Número de la columna
• i = Número de la fila
• c = Número de columnas (grupos)
• n = Número de elementos en cada grupo (tamaño de la muestra)
 
La tabla ANOVA contiene columnas con las fuentes de variación, las
sumas de cuadrados, los grados de libertad, las
l as
estimaciones de la varianza y el valor F para el procedimiento de análisis de
varianza.

EJEMPLO

Una analista de una cadena de supermercados, quiere saber si las tres


tiendas tienen el mismo promedio en dólares por compra. Se elige una muestra
aleatoria de seis compras en cada tienda.
ti enda. La tabla número 1 presenta los datos
 

recolectados de esta muestra junto con las medias maestrales para cada tienda
y la media global de todos los datos. Hará una prueba con un nivel de
significancia de 0,01.
La hipótesis nula que se quiere probar es que todas las poblaciones de
las que se obtuvieron los datos maestrales tienen la misma media. La hipótesis

alternativa es que las poblaciones no tienen la misma media. Las primeras dos
medias maestrales en la tabla núm
número
ero 1 sugieren qu
que
e la hipótesis nula es
cierta, ya que son muy cercanas. La tercera media muestral, es
considerablemente mas pequeña que las otras dos. Pero, ¿Se debe esta
diferencia a la aleatoriedad del muestreo o al hecho de que las poblaciones
tienen medias distintas? Esta es la pregunta que vamos a responder con el
procedimiento de ANOVA.

Tabla número 1 à Datos maestrales para ANOVA (en dólares) para el

ejemplo

Tienda 1 Tienda 2 Tienda 3


---------------------------------------------------------------------------
12,05 15,17 9,48
23,94 18,52 6,92
14,63 19,57 10,47
25,78 21,40 7,63
17,52 13,59 11,90

18,45 20,57 5,92

Media 18,73 18,14 8.72

Media global : x = 15,20, c=3, n=6

Se usan ambos métodos, dentro y entre, para estimar la varianza de las


tres poblaciones. Recuerde
Recuerde la suposición
suposición fundamental de ANOVA : todas las
poblaciones tienen la misma varianza sin importar si tienen la misma media. La

tabla número 2 contiene los cálculos para el método dentro, y la tabla número 3
da los cálculos para el método entre.
 

Tabla número 2 à Cálculos del método dentro para el ejemplo.

Tienda 1 à (12,05 – 18,73)2 + (23,94 – 18,73)2 + (14,63 – 18,73)2 +


(25,78 – 18,73)2 + (17,52 – 18,73)2 + (18,45 – 18,73)2 =

139,82
Tienda 2 à (15,17 – 18,14)2 + (18,52 – 18,14)2 + (19,57 – 18,14)2 +
(21,40 – 18,14)2 + (13,59 – 18,14)2 + (20,57 – 18,14)2 =
48,25
Tienda 3 à (9,48 – 8,72)2 + (6,92 – 8,72)2 + (10,47 – 8,72)2 + (7,63 –
8,72)2 + (11,90 – 8,72)2 + (5,92 – 8,72)2 =
26,02

Suma de cuadrados dentro (SCw) = 139,82 + 48,25 + 26,02 =


214,09

Tabla número 3 à Cálculos del método entre para el ejemplo.

(18,73 – 15,20)2 + (18,14 - 15,20)2 + (8,72 – 15,20)2 = 63,09

Suma de los cuadrados entre (SC b) = 6(63,09) = 378,54

Los valores calculados en las tablas 2 y 3 se usan para rellenar la tabla


ANOVA. Como se tienen tres poblaciones en la prueba,
c = 3. Se obtuvo una muestra de seis valores de cada población, así que n = 6.
La tabla número cuatro presenta la tabla ANOVA para este ejemplo.
 

Tabla número 4 à Tabla ANOVA para el ejemplo.

Fuente de

Variación SC gl Estimación de δ 2
Coeficiente

----------------------------------------------------------------------------------------------------------
Grupos entre 378,54 2 189,27 13,26
Grupos dentro 214,09 15 14,27
----------------------------------------------------------------------------------------------------------
TOTAL 592,63 17

Los grados de libertad se calcularon como sigue:

• c- 1 = 3 – 1 = 2 (Grupos entre)
• c (n – 1) = 3 ( 6 – 1 ) = 15 (Grupos dentro)

Como se puede ver en la tabla número 4, el método entre para estimar 


δ 2, produce un valor de 189,27, mientras que la estimación
del método dentro es de 14,27. El cociente F indica que la estimación del
método ente es 13,26 veces el valor del método dentro. ¿Se debe esta
diferencia al error de muestreo, o se debe a que la hipótesis nula es falsa?.
Para contestar a esta pregunta se consulta la tabla F y se determina un valor 
crítico.
Dos grados de libertad están asociados con el numerador del cociente
de F , y se asocian quince grados de libertad con el denominador. De la tabla F 
el valor crítico es 6,36 para estos grados de libertad a un nivel de significancia
de 0,01. El valor F calculado de 13,26 es mayor que el valor crítico, lo que
significa que se tiene suficiente evidencia muestral para rechazar la hipótesis
nula de medias poblacionales iguales.
 
 

EJEMPLO 2 

Se pide a cuatro personas que beben una marca determinada de café


que registren el número de tazas que consumen durante un día. Se hace lo
mismo con bebedores de otras marcas. Los resultados se muestran a
continuación. Construya la tabla ANOVA para probar si existe alguna diferencia
en el número promedio de tazas consumidas, para cada marca.

Marca A Marca B Marca C Marca D


-------------------------------------------------------------------------------------------
3 5 2 3

2 1 10 6
5 4 5 4
6 6 7 3
---------------------------------------------------------------------------------------------
4 4 6 3

Media global à 4.25


n=4
c=4

METODO DENTRO

• Marca A à (3 – 4)2 + (2 – 4)2 + (5 – 4)2 + (6 – 4)2 = 10


• Marca B à (5 – 4)2 + (1 – 4)2 + (5 – 4)2 + (6 – 4)2 = 17
• Marca C à (2 – 6)2 + (10 – 6)2 + (5 – 6)2 + (7 – 6)2 = 34
• Marca D à (3 – 3)2 + (6 – 3)2 + (4 – 3)2 + (5 – 3)2 = 14

METODO ENTRE
 

(4 – 4,25)2 + (4 – 4,25)2 + (6 – 4,25)2 + (3 – 4,25)2 = 6,75

TABLA ANOVA

Fuente de
Variación SC GL Estimación δ 2
Coeficiente F 
----------------------------------------------------------------------------------------------------------
Metodo 6,75 3 6,75 / 3 2,25 / 6,25 = 0,36
Entre
Metodo 75 12 75 / 12
Dentro

TOTAL 81,75 15

ANALISIS DE LA VARIANZA CON DOS CRITERIOS DE CLASIFICACIÓN

 Anova con dos criterios

En oc
ocasi
asione
ones,
s, es deseab
deseable
le identi
identific
ficar
ar dos cau
causas
sas posibl
posibles
es para
para las
diferencias en la variable dependiente. Si es el caso, se lleva a cabo un

programa ANOVA con dos criterios de clasificación, donde se identifican dos


causas posibles para la variabilidad de la variable dependiente. Se toman al
azar
azar dos
dos mues
muestr
tras
as de la po
pobl
blac
ació
ión
n de in
inte
teré
réss y se us
usan
an lo
loss resu
resultltad
ados
os
maestrales para probar la hipótesis nula relevante.

EJEMPLO

Hace un par de ejemplos, el analista intentó determinar si había alguna


diferencia en el promedio en dólares por compra entre tres tiendas. ¿ Qué

ocurre si también quiere determinar si existe alguna diferencia en el promedio


de compra debida a los efectos de dos campañas distintas de publicidad ?
 

Los datos de la tabla número 1 del ejemplo del que estamos tratando se
vuelven a disponer de manera que se puedan examinar usando dos criterios de
cl
clas
asifific
icac
ació
ión
n para
para el anál
anális
isis
is de va
varia
rianz
nza.
a. Ha
Hayy tres
tres grup
grupos
os en el fact
factor
or 1
(tiendas) y dos grupos en el factor 2 (campañas de publicidad). Se tomó una
muestra de tres elementos (n=3) y se tomaron medidas para cada una de las

seis celdas de la tabla (3 *2 = 6).


Tabla
Tabla número
número 5 à Dat Datos
os maestr
maestrale
aless (dó
(dólar
lares)
es) de ANO
ANOVA
VA pa
para
ra el
ejemplo.

Campaña de
Publicidad TIENDA 1 TIENDA 2 TIENDA 3 MEDIAS
----------------------------------------------------------------------------------------------------------
12,05 15,17 9,48
A (16,
(16,87
87)) 23
23,9
,94
4 (1
(17,
7,75
75)) 18,5
18,52
2 (8
(8,9
,96)
6) 6,92
6,92 14,53

14,63 19,57 10,47


25,78 21,4 7,63
B (20,58) 17,52 (18,52) 13,59 (8
(8,,48) 11,90 15,86
18,45 20,57 5,92
----------------------------------------------------------------------------------------------------------
MEDIAS 18,73 18,14 8,72 15,20

Media global à 15,20 r=2 c=3

n=3

• Media tienda 1 à 18,73


• Media tienda 2 à 18,14
• Media tienda 3 à 8,72
• Media campaña A à 14,53
• Media campaña B à 15,86
• Media tienda 1 y ca
campaña
mpaña A à 16,87
• Media tienda 2 y campaña A à 17,75
 

• Media tienda 3 y campaña A à 8,96


• Media tienda 1 y campaña B à 20,58
• Media tienda 2 y campaña B à 18,52
• Media tienda 3 y campaña B à 8,48

Interacción

Una razón más importante para aplicar el procedimiento de ANOVA con


dos criterios de clasificación es que permite probar una tercera hipótesis. Como
se obtendrá una muestra de cada combinación entre las variables en filas y
columnas, se puede examinar el efecto de interacción de estas variables.
La interacción ocurre cuando los niveles de un factor se interrelacionan
de manera significativa con los niveles del segundo factor ejerciendo influencia
sobre la variable dependiente.
En el procedimiento de ANOVA con dos criterios de clasificación, la
primera hipótesis nula para probar se refiere a la presencia de interacción:

H0 : No hay interacción entre los factores en las filas y los factores en las
columnas para la población bajo prueba.
 
Si se encuentra interacción, hay que determinar porqué ciertos niveles
de un factor interactúan con ciertos niveles del segundo factor. Esto se hace
examinando las diferentes medias en las celdas. La interacción se encuentra
pocas veces, pero cuando la hay, el analista no puede interesarse por probar 
otras hipótesis.
Si no se encuentra interacción, las variables en filas y columnas se
examinan para buscar diferencias en la variable independiente. Las hipótesis
nulas bajo prueba son:

• H0 : No ex
exis
iste
te di
dife
fere
renc
ncia
ia en el va
valo
lorr prom
promed
edio
io de la va
vari
riab
able
le
dependiente para las poblaciones en las filas.
 

• H1 : No ex
exis
iste
te di
dife
fere
renc
ncia
ia en el va
valo
lorr prom
promed
edio
io de la va
vari
riab
able
le
dependiente para las poblaciones en las columnas.

EJEMPLO

Un analista de personal, quiere llevar a cabo un análisis de varianza con


dos cri
criteri
terios
os de cla
clasif
sifica
icació
ción
n par
para
a determ
determina
inarr si la variab
variable
le tiempo
tiempo con la
compañía está afectada por uno de dos factores: La localización del empleado
en las áreas de trabajo de la compañía y el nivel de salario del empleado. Cada
empleado se asigna a una de las cuatro áreas de trabajo de la compañía en
diferentes partes de la ciudad. Existen tres tipos de empleados según el
método de pago: por horas, por mes y por año. El conjunto de datos consiste
en muestras de cada combinación posible entre la localización del empleado y

su método de pago. Esto da como resultado una tabla de datos con 12 celdas.
Las hipótesis nulas que se van a probar son:

• H0 : No hay interacción entre la localización y el método de pago.


• H0 : No hay diferencia en el tiempo con la compañía debida a la
localización.
• H0 : No hay diferencia en el tiempo con la compañía debida al método
de pago.

EJEMPLO

Un estudio investigó los efectos de la información respecto al precio, la


marca y la tienda sobre la evaluación del producto por los consumidores.
Supongamos que la variable dependiente es la percepción del consumidor 
sobre la calidad del producto, medida en una escala numérica. Dos de los
factor
factores
es est
estudi
udiado
adoss fue
fueron
ron pre
precio
cio y mar
marca.
ca. Se ten
tenían
ían cin
cinco
co pre
precio
cioss para
para
calculadoras ($17, $28, $39, $50 y la ausencia de precio) y tres marcas
(Hewlett Packard , Royal y Sony). Los datos consistieron en muestras de todas
 

las combinaciones posibles de precio y marca. Esto dio como resultado una
tabla de datos con 15 celdas. Las hipótesis nulas bajo prueba son:

• H0 : No hay interacción entre el precio y la marca.


• H0 : No hay diferencia en la percepción de la calidad del producto
debida a los diferentes niveles de precio.
• H0 : No hay diferencia en la percepción de la calidad del producto
debida a las diferentes marcas.

Son muchos los cálculos requeridos por un análisis de varianza con dos
criter
criterios
ios de cla
clasif
sifica
icació
ción.
n. La dis
dispon
ponibi
ibilid
lidad
ad gen
genera
eraliz
lizada
ada de paq
paquet
uetes
es de
computadora que realizan ANOVA ha eliminado prácticamente los cálculos
manuales para esta técnica. Sin embargo, es importante saber que se está
haciendo con los datos para lograr una interpretación y un entendimiento
apropiados. Los cálculos específicos para un procedimiento de ANOVA con
dos criterios de clasificación no se presentarán aquí, pero se describirá la
naturaleza general del análisis y se interpretará una salida de computadora.
La suposición clave que fundamenta el ANOVA con dos criterios de
clasificación es la misma que para el ANOVA con un criterio: Se supone que
todas las poblaciones bajo estudio tienen la misma varianza. Si se tiene tres
filas en la tabla de datos y cinco columnas, hay quince celdas y quince
poblaciones que deben muestrarse. Independientemente de si las medidas de
estas quince poblaciones son las mismas, debe suponerse que varían en el
mismo grado. Todas deben tener la misma varianza para que el procedimiento
de ANOVA funcione correctamente.
Existen cuatro formas de estimar la varianza común de las poblaciones
en el procedimiento de ANOVA con dos criterios de clasificación. Una de estas
formas, el método dentro, produce una estimación fiable de esta varianza
independientemente de que cualquiera de las tres hipótesis nulas sean ciertas.
Igual que en el procedimiento de ANOVA con un criterio, el método dentro mide
la variabilidad de cada valor muestral alrededor de su propia medida de la
celda. Aún cuando varias de las celdas en la tabla de datos tengan medias
diferentes, esto no influirá en los cálculos de la varianza estimada con el
 

método dentro. Al calcular la suma de cuadros usando el método entre se


compara el primer dato con la media de la celda
celda en la que está. La diferencia
se eleva al cuadrado y se suma a los cuadrados de las diferencias entre todos
los otros valores de la muestra y las medias de sus propias celdas. El valor que
se obtiene se divide entre el número apropiado de grados de libertad, rc(n – 1).

Como la media de la celda se resta de cada uno de los n elementos en la


celda, uno de estos
estos elementos no tiene libertad para variar. Cad
Cada
a celda tiene
entonces (n – 1) grados de libertad, y hay r (el número de filas) multiplicado por 
c (el número de columnas)
columnas) celdas. Esta estimación dentro de la varianza es
es el
denominador de cada cociente F .
El segundo método para estimar la varianza es válido solo si no hay
in
inte
tera
racc
cció
ión
n entr
entre
e la
lass pobl
poblac
acio
ione
nes.
s. Si la hay,
hay, es
este
te mé
méto
todo
do prod
produc
uce
e un
una
a
estimación inflada. El valor de gl se calcula de la misma manera que para la
prueba de la tabla de contingencia: (r – 1) (c – 1).

El tercer método para estimar la varianza produce una estimación válida


sólo si la hipótesis nula sobre la igualdad de la media de columnas es cierta. Si
esta hipótesis es falsa, se obtendrá una estimación inflada. Esto es lo mismo
que usar el método entre para estimar la varianza en un procedimiento de
ANOVA con un criterio.
Los grados de libertad son el número de columnas menos uno, (c – 1).
El último método para estimar la varianza es válido sólo si la hipótesis
sobre medias iguales en las filas es cierta. Si no lo es, se obtiene una
estimación inflada. De nuevo, el procedimiento es similar al método entre para

estimar la varianza en un ANOVA con un criterio. Los grados de libertad son el


número de filas menos uno, (r – 1). La taba de a continuación contiene las
fórmulas para el procedimiento de ANOVA con dos criterios de clasificación.
 
Tabla de análisis
análisis de varianza con
con dos criterios de clasificación.
clasificación.
 

Fuente de Coeficiente
variación SC gl Estimación de δ 2
  F 
----------------------------------------------------------------------------------------------------------
Filas cn∑ (xri – x)2 r –1 SCr //gl
glr  S2r /S
/S2w
I
Columnas cn∑ (xcj – x)2 c–1 SCc/glc S2c/S2w
j
Interacción n [ ∑∑ (xij – xri – (r – 1)(c – 1) SCi/gli S2i/S2w
i j
- xcj – x)2 ]
Grupos ∑∑∑ (xijk – xij)2 rc (n – 1) SCw/glw
dentro i j k

TOTAL ∑∑∑
∑∑ ∑ (xijk – xij)2 nrc – 1
I j k

 j = Número de la columna.
i = Número del renglón.
k = Número de la observación dentro de una celda.
r = Número de filas.
c = Número de columnas.
n = Número de observaciones en cada celda.
 

El resultado final de un procedimiento de ANOVA con dos criterios es el


cálculo de tres cocientes F . El denominador para cada uno
de esto
estoss coci
cocien
ente
tess es la estim
estimac
ació
ión
n del
del mé
méto
todo
do de
dent
ntro
ro para
para la vari
varian
anza
za
desconocida de la población. Los numeradores de los cocientes
son las “ estimaciones” obtenidas bajo la suposición de que cada una de las

tres hipótesis es cierta. Cada cociente F se examina para ver 


si es
es mu
muyy gran
grande
de.. Cu
Cual
alqu
quie
ierr cocien
cociente
te F que sea mas grande que el valor de la
tabla F da como resultado el rechazo de la hipótesis nula
correspondiente. La forma general de cada uno de los tres cocientes F es:

si2 (estimación de interacción de δ2)


• F = ---------------------------------------------------------------- (interacción)
Sw2 (estimación por el método dentro de δ2)

Sc2 (estimación por el método entre por columna de δ2)


• F = --------------------------------------------------------------------------(columna)
Sw2 (estimación por el método dentro de δ2)

Sr 2 (estimación por el método entre por filas de δ 2)


• F = ------------------------------------------------------------------------ (filas)
Sw2 (estimación por el método dentro de δ2)

Si las tres hipótesis nulas son ciertas, los cálculos para los numeradores
y denominadores de estos tres cocientes F  serán estimaciones válidas de la
misma varianza poblacional desconocida. Como se ha visto, una razón de este
tipo se obtiene de la distribución F . Sin embargo, si cualquiera de las tres
hipótesis
hipótesis nulas
nulas es falsa, el numera
numerador
dor de la razón correspon
correspondient
diente
e estará
inflado y dará un valor grande de F que llevará el rechazo de la hipótesis nula.

EJEMPLO

La siguiente tabla presenta la tabla ANOVA con dos criterios de


 

clasificación para el ejemplo con el que comenzamos este tema (tres tiendas).
Se calc
calcul
ular
aron
on cuat
cuatro
ro “e
“est
stim
imac
acio
ione
nes”
s” de la va
varia
rianz
nza
a co
comú
mún
n de toda
todass la
lass
poblaciones. No obstante, solo el método dentro produce una estimación válida
sin importar el estado de ninguna hipótesis nula. La evidencia muestral ha
producido el valor
valor 16,019 como la estimación
estimación del método dentro para δ2.
método

Fuente de
variación SC gl Estimación de δ 2
Coeficiente

----------------------------------------------------------------------------------------------------------

Filas 8,013 1 8,013 0,50


Columnas 378,381 2 189,90 11,81
Interacción 13,851 2 6,925 0,43
Dentro 192,223 12 16,019

TOTAL 592,468 17

Las tres hipótesis nulas son:

• H 0 : No hay interacción entre tienda y campaña publicitaria en la


población.
• H 0 : Las poblaciones en las filas (campaña publicitaria) tienen ambas
la misma medida.
• H 0 : Las poblaciones en las columnas (tiendas) tienen todas las
mismas medidas.

Se calculan los cocientes F de la tabla anterior dividiendo cada una de


 

las “estimaciones” de δ2 correspondientes a las tres hipótesis nulas entre


16,019, la estimación válida de δ2. Estos cálculos son:

COCIENTE F GRADOS DE LIBERTAD F critica (.05)


8.013/16.019 = 0.500 1.112 4.75
189.190/16.019 = 11.810 2.12 3.88
6.925/16.019=0.432 2.12 3.88

Observe que la estimación dentro de δ 2


(S2w = 16,019) se usa en todos
los denominadores. Además se dan los grados de libertad para el numerador y
el denominador para cada prueba de hipótesis. Estos valores aparecen en la
tabla anterior para cada fila de la tabla.
A cont
contin
inua
uaci
ción
ón se en
encu
cuen
entra
tran
n la
lass razo
razone
ness criti
critica
cass de la tabl
tabla
a F 
calculando para interacción (0,432) es menor que el valor critico (3,88), de
manera que la hipótesis nula no se rechaza. El valor F calculado para las filas

(0,500) es menor que el valor critico (4,75), por lo que no se rechaza la


hipótesis nula para las filas. El valor  F calculado para las columnas (11,810) es
mayor que el valor critico (3,88) y la hipótesis nula para las columnas se
rechaza.
Lass con
La conclu
clusio
siones
nes para
para el anális
análisis
is de va
varia
rianza
nza con dos cri
criteri
terios
os de
clasificación son:
1. No hay interac
interacció
ción
n entre tiendas
tiendas y campañas
campañas pub
publici
licitar
tarias
ias en la
población.
2. Las campañ
campañas
as pub
publicita
licitarias
rias tienen
tienen ambas la mis
misma
ma med
media.
ia.

3. Las tiend
tiendas
as tie
tienen
nen difer
diferent
entes
es media
medias.
s.

Para las primeras dos conclusiones existe la posibilidad de un error tipo


II. En cualquier caso, la hipótesis nula puede de hecho ser falsa. Para la ultima
conclusión se tiene la posibilidad de haber rechazado una hipótesis nula que en
realidad es ciertas. Un paso final muy importante es la evaluación de los riegos
de error y las penalizaciones asociadas.

La tercera conclusión establece que las diferentes tiendas no tienen la

misma media en la población.


 

Vale la pena hacer algunos comentarios finales sobre los procedimientos


del análisis
análisis de varianza
varianza con uno dos criterios
criterios de clasif
clasificac
icación.
ión. Como se ha
comentado varias veces a lo largo del tema, la suposición clave de ANOVA es
que todas las poblaciones tengan la misma varianza. En realidad, son tres las
suposiciones que deben cumplir para que el procedimiento ANOVA arroje

resultados adecuados.

1. Todas
Todas las pobla
poblacio
ciones
nes que se prueban
prueban deben
deben tener la mis
misma
ma varia
varianza
nza
para la variable dependiente.
2. Todas
Todas las pobla
poblacio
ciones
nes que se prueban
prueban debe
deben
n seg
seguir
uir una distr
distribu
ibució
ción
n
normal para la variable dependiente.
3. Las muestr
muestras
as tomadas
tomadas de las poblacio
poblaciones
nes que se prueban
prueban deben
deben ser 
aleatorias.

Deben verificarse estas tres suposiciones para asegurar un análisis valido.


En ocasiones, estas suposiciones se ignoran, en particular porque los paquetes
de computadora que ejecutan ANOVA no preguntan al analista si se han tenido
en cuenta. El analista debe, por lo menos, tener una idea intuitiva de que se
cumplen las dos primeras y que se están usando muestras aleatorias.

OTROS DISEÑOS ANOVA

Los diseños con uno y dos criterios de clasificación descritos en este

capitulo constituyen los procedimientos básicos de ANOVA que se usan en la


mayor parte de las aplicaciones. En ocasiones se emplean modificaciones a
estos procedimientos al examinar los efectos de diferentes factores sobre una
variable de interés. En esta sección se describen las cuatro variaciones básicas
mas comunes.
1. Los
Los dise
diseño
ñoss bá
bási
sico
coss de ANOV
ANOVA
A sup
upon
onen
en qu
que
e lo
loss tama
tamaño
ñoss de la
lass
muestras son iguales. Para el ANOVA con un criterio de clasificación se
usa el mismo tamaño de muestra en cada tratamiento. En el diseño de
dos criterios
criterios se usa el mismo
mismo tamaño
tamaño de muestra en ca
cada
da celda de la

ta
tabl
bla
a de dato
datos.
s. Algu
Alguno
noss diseñ
diseños
os ma
mass co
comp
mple
lejo
joss pued
pueden
en ma
mane
neja
jar 

muestras desiguales. Esto puede ser conveniente cuando hay diferentes
 

proporciones de los elementos de una población y el analista quiere


reflejar estas diferencias en la muestra.
2. En los
los dise
diseño
ñoss desc
descri
rito
toss en este
este tema
tema,, se mu
mues
estr
trea
earo
ron
n toda
todass la
lass
poblaciones de interés. Suponga que un ANOVA con dos criterios de
clasificación básicos se obtiene una muestra de todas las poblaciones.

Un diseño alternativo de ANOVA elige al azar esas poblaciones para la


muestra y extiende los resultados a esas poblaciones.
3. El procedi
procedimie
miento
nto bás
básico
ico de ANOVA se pued
puede
e amplia
ampliarr par
para
a cubri
cubrirr tre
tress
factores o mas. Una alternativa es elegir al azar operadores (3 factores)
para la muestra y extender los resultados del ANOVA a todas las
poblaciones.
El estudio factorial de ANOVA con dos criterios estudiaba estos efectos.
De hecho, este diseñ
diseño
o facto
factorial
rial de tres criterios de clasificac
clasificación
ión obtiene
una muestra de cinco niveles de precio, tres nombre de marca y tres

nombres de tienda.
4. En el dise
diseño
ño bás
básic
ico
o de ANO
ANOVA
VA con un crit
criter
erio
io de cl
clas
asifific
icac
ació
ión
n , lo
loss
sujetos
sujetos se asign
asignan
an al azar a los tratamientos.
tratamientos. Esta asign
asignación
ación aleatoria
aleatoria
proporciona alguna seguridad de los sujetos en cada tratamiento son
mas o menos los mismos, y elimina así los efectos de sujetos diferentes.
El diseño de bloques aleatorizados elimina el efecto de las diferencias
entre los sujetos de los tratamientos, al someter a cada sujeto a todos
estos tratamientos.

Los distintos métodos de llevar a cabo el procedimiento de análisis de


varianza a veces reciben el nombre de diseños de experimentos. El término
experimento sugiere una aplicación científica mas que una de negocios, y esto
es cierto en general. Las aplicaciones de negocios, con frecuencia incluyen la
observación mas que la manipulación de variables, así que los procedimientos
avanzados de diseño o experimentos no son muy comunes. Sin embargo hay
ocas
ocasio
ione
ness en qu
que
e la situ
situac
acio
ione
ness de ne
nego
goci
cios
os se pu
pued
eden
en co
cont
ntro
rola
larr pa
para
ra
examinar el efecto de los distintos factores sobre la variable de Interés. En

estos casos, los procedimientos avanzados pueden ser muy útiles y, de hecho,
 

el control de calidad y la investigación para el diseño de productos son dos


áreas de importancia en este sentido.
 

LA PRUEBA DE KRUSKAL-WALLIS

La estructura de los datos

Con
onsi
sid
der
erem
emos
os un dis
iseñ
eño
o con
con un sol
olo
o fact
facto
or, co
comp
mple
leta
tame
ment
nte
e
aleatorizado. La prueba que estudiamos es una extensión de la prueba U de
Mann
Mann – Wh
Whititne
neyy para
para el caso
caso de k mues
muestr
tras
as o k ni
nive
vele
less de un fact
factor
or,,
mutuamente independientes. Y es una alternativa al ANOVA de un factor,
efectos fijos, complementos al azar, cuando no se cumplen los supuestos
paramétricos del mismo.

Transformemos las n1 + n2 + ... + nk = N observaciones en rangos u


ordenes Oij, de modo que la menor de las Y ij reciba el valor 1, la siguiente el
valor 2, ..., y la mayor el valor N. Si suponemos que la variable es continua no
deberían existir empates.
A1 O11 O12 ... O1j ... O1n1 O1 O1
A2 O21 O22 ... O2j ... O2n2 O2 O2
. --- --- --- --- --- ---- --- ----
. --- --- --- --- --- ---- --- ----
. --- --- --- --- --- ---- --- ----
  .Ai Oi1 Oi2 ... Oij ... Oini Oi Oi
. --- --- --- --- --- ---- --- ----
. --- --- --- --- --- ---- --- ----
Ak  Ok1 Ok2 ... Okj ... Oknk  Ok  Ok 

Llamamos Oi a la suma de los ordenes que han correspondido a la muestra i:


Oi = Σ Oi j
Oi
Por tanto: Oi = --------
ni
será la correspondiente media aritmética. La suma de los N valores valdrá_ 

N N(N+1)
ΣΣΟ ij = Σ --------------- (i´ = 1,2,..,N)
 

i j i´ 2
Y su promedio:
  ΣΣΟ ij (N+1)
O = --------- = ---------
N 2
Estadísticos de contraste

Podemos considerar que las k muestras son aleatorias e independientes


extraidas de un población finita de tamaño N, en la cual:

N N(N+1) N (i´ - µ )2 (N2 – 1)


  µ = Σ i´ = ------------ y δ 2 = Σ ----------- = --------------
i` 2 i N 12
(N+1)
Por tanto : E (O i ) = µ = ----------
2

N+1 2
N – ni δ 2
N – ni (N2 – 1)12 (N – ni)(N + 1)(N – 1)
Var(Oi) = E(Oi- ------ ) = -------- ---- = -------- --------------- =------------------
=---------------------------
---------
2 N - 1 ni N–1 ni 12ni(N – 1)

Un estadístico de contraste puede ser:


N+1 ni(N+1)2 Oi2 N(N+1)2
S = Σ ni (Oi - ---------- )2 = Σ ( niOi - ------------------)2 = Σ ( ----- ) - ---------------
  i  2 2 ni  4

Si las muestras proceden de una misma población o de k poblaciones


idénticas, es decir, si no existen diferencias entre los tratamientos, serian
mínimas las diferencias entre las medias y la media común, lo que se traducirá
en valores de S pequeños. Si hay diferencias entre los tratamientos , el valor de
S tendera a ser grande.
Tenemos, además según las 2 ultimas demostraciones anteriores que:
 

N+1 (N – ni)(N+1)(N-1) (k-1)N(N+1)


E(S) = Σ ni E (O
E(S) (Oii - --
----
----
----
----
-- ) 2
= Σ ni ----------------
-------------------------
-----------------
----------
-- =
--------------------
  2 12ni(N-1) 12

Observ
Obse rvam
amos
os qu
quee el valo
valorr espe
espera
rado
do de S de depe
pend
nde
e de
dell nu
nume
mero
ro de
observaciones. Por ello, un estadístico cuyo valor esperado no depende del
numero de observaciones, función de S, y con el cual llegamos a las mismas
conclusiones, es:
1 1 Oi2 N(N+1)2 12 Oi2 
H = -----------------------S = ------------------- ( Σ ---- - -----------------) = ----------- Σ ----
-
N(N+1)/12 N(N+1)/12 nI 4 N(N+1) i nI

12 N(N+1)2
------------------ -----------------
N(N+1) 4

12 Oi 2
Entonces, H = ------------- Σ ---- - 3(N+1)
N(N+1) ni

1
Y E(H) = -------------------
---------------------
-- E(S) = k – 1
N(N+1)/12

El estadístico de contraste tiene un valor esperado que no depende del


numero de observaciones; solo depende del número de muestras.
Es facil conocer su distribución muestral. Bajo la hipótesis nula, los
1,2, ...,N ordenes estaran distribuidos al azar en las k muestras, con la unica
 

restricción de que haya n i de ellos en cada una. Las distintas maneras como N
elementos se pueden distribuir en k muestras de tamaño n i son:

N!
-------------------

n1! n2!... nk!

Si para cada una de esas posibilidades calculamos el valor de H y


llamamos a las que coincidan t(h), la posibilidad de aparacion de este valor 
viene dada por 
n1! n2!... nk!
f(h) = t(h) ----------------
N!

Aver
Averig
igua
uarr las pr
prob
obab
abililid
idad
ades
es exac
exacta
tass pa
para
ra ca
cada
da ca
caso
so es bast
bastan
ante
te
engor
ngorro
rosso. Es ma
mass út
útilil se
serv
rvir
irsse de un
una
a ap
apro
roxi
xima
macció
ión
n si lo
loss n i son
moderadamente grandes. Para cada muestra tenemos:
[Oi – (N+1)/2]
Zi = -----------------------------
Var (Oi)

Cuya distribución tiende a N(0,1). Por tanto si Z i2 es χ 12. De modo que :

N – ni [Oi – (N+1)/2]2 
H = Σ ( -----------) ----------------------
N var (Oi) 

Es la suma de k términos Z i2 ponderados, deberá seguir una distribución


χ 2.Como se debe cumplir que:
N(N+1)
Σ niO = ---------------
2
 

no todos estos términos serán independientes, por lo que los grados de


libertad serán k –1.
H es un estadístico de contraste que la sigue la distribución χ 2
con k –1
grados de libertad.
Si hay empates es las observaciones y se promedian los rangos, la
distribución muestal de H se verá afectada. Cuantos mas empates hay, mas
conser
con servad
vadora
ora se hace la prueba
prueba,, lo que signi
signific
fica
a que se torna mas difí
difícil
cil
considerar H como significativo.
Se precisa una corrección que depende exclusivamente del numero de
observaciones empatadas. Si llamamos tk al numero de valores empatados en
el orden k , la corrección consiste en dividir H por el siguiente termino:


  Σ (tk3 – tk)
k
C = 1 - --------------------
N3 - N

La prueba es fundamentalmente una prueba respecto a los promedios,


muy poco sensible a desigualdad de las poblaciones subyacentes en sesgo,
curt
curtos
osis
is o am
ampli
plitu
tud
d de los dato
datos.
s. Es decir,
decir, qu
que
e ba
bajo
jo H 0 de igu
iguald
aldad
ad de
promedios, el estadístico H tiende a ser pequeño aunque las poblaciones
difieran en la forma o en las escala, lo cual implica que la probabilidad de
rechazar H0 es verdadera sigue siendo próxima a alfa.

EJEMPLO:

Un psicólogo esta interesado en el efecto que determinado tipo de


castigo y determinado tipo de premio tienen sobre la conducta agresiva de
 

niños de 8 a 10 años. Con este


este fin, prepa
prepara
ra un experim
experimento
ento con 22 niñ
niños
os de
esas edades tomados al azar de un colegio de EGB. Al azar los asigna a las
dos condiciones experimentales y al grupo control. Al cabo de unos meses les
pasa una prueba de agresividad y los obtiene los siguientes datos.

CONTROL 12 16 14 2 12
PREMIO 13 18 14 13 8 7 6 4
CASTIGO 13 14 7 8 4 3 2 5 9

Se desea saber si hay evidencias suficientes para concluir que diferencia entre
las medianas de los tratamientos, a nivel de significación de 0,01.

1. Hipótesis
H0 = Las tres poblaciones subyacentes son idénticas.
H1 = Las tres poblaciones no tienen la misma mediana.

2. Supu
upuesto
estoss:
a) Las k muestras de tamaños n1,, n2 , n3 son aleatorias
b) Las N observac
observaciones
iones sson
on mutuamen
mutuamente
te inde
independi
pendientes
entes
c) La variab
variable
le dep
depend
endien
iente
te es con
continu
tinua.
a.
d) El nivel
nivel de medid
medida
a es al menos
menos ordin
ordinal.
al.
e) Las poblaci
poblacione
oness son idén
idéntic
ticas
as exce
excepto
pto posi
posible
blemen
mente
te en los
promedios.

3. Estadí
Estadísti
stico
co de contra
contraste
ste
Transformemos los datos en ordenes:
Oi
-----
Control: 13.5, 21, 19, 1.5, 13.5 68.5
Premio: 16, 22,19,16,10.5,8.5,7,4.5 103.5
Castigo: 16,19,8.5,10.5,4.5,3,1.5,6,12 81

Calculo H:
12 68.52 103.5 812
 

Hk = ------------- (-------+--------+-------) – 3(23) =


(22)(23) 5 8 9
= 0.0237(938.45+1339.03+729) – 69 = 71.3+ 69 = 2.3

Hago la corrección por empates:

(13.5, dos veces) : 23 – 2 = 6


(19, tres veces): 33 – 3 = 24
(1.5, dos veces): 23 – 2 = 6
(16, tres veces): 33 – 3 = 24
(10.5, dos veces): 23 –2 = 6
(8.5, dos veces): 23 –2 = 6
(4.5, dos veces): 23 –2 = 6

(6 + 24 + 6 + 24 + 6 +6 +6) 78
C = 1 - -------------------------------------- = 1 - -------- = 0.9993
223 - 22 10626
23
h`k = ---------- = 2.316
0.993

4. Zona
ona Crí
Crítiticca

Puesto que un grupo tiene tamaño superior a 8 , utilizamos la


distribución de χ 2 con 2 g.l. La zona critica estará formada por todos
los valores iguales o superiores a 0.99χ 2
2
=9.21

5. Decisión:

Puesto que 2.316 < 9.21, no podemos rechazar la hipótesis nula (p >
0.05).

6. Con
oncl
clus
usió
ión
n
 

No ha
hayy evid
eviden
enci
cia
a su
sufic
ficien
iente
te en lo
loss da
dato
toss pa
para
ra afirm
afirmar
ar qu
que
e los
tratamientos tienen efecto diferencial.

RESUMEN

Adem
emás
ás de media
ediass y pr
prop
opor
orccio
ione
nes,
s, mu
muccha
hass vec
eces
es in
inte
tere
ressa la
variabilidad de las poblaciones. En e
este
ste tema se prese
presentaron
ntaron métodos para la
viabilidad de una sola población y para comparar las viabilidades de dos
poblaciones.
También se presento en este tema la manera de examinar los efectos de
los diferentes factores sobre la variable de interés (Variable independiente). En

el análisis
análisis de varia
varianza
nza con un criterio, las medidas
medidas de la variable dependi
dependiente
ente
se hacen para cada nivel del factor que se piensa que afecta a esta variable.
Se pu
pued
eden
en ex
exam
amin
inar
ar do
doss fa
fact
ctor
ores
es re
rele
leva
vant
ntes
es al mi
mism
smo
o tiem
tiempo
po en el
procedimiento de ANOVA con dos criterios de clasificación, y estudiar los
efectos de tres o mas factores sobre la variable dependiente a través de
procedimientos mas avanzados.
El análisis de varianza es un buen ejemplo de una técnica estadística
que resulta muy practica debido al uso generalizado de las computadoras. El
volumen de cálculos es tal que es muy difícil realizar un diseño de cualquier 

tamaño útil solo con cálculos manuales. Los programas de computadora que
ejecutan ANOVA están disponibles para computadoras personales al igual que
 

para las mas grandes. Estos programas, por lo general, realizan análisis con
uno y dos criterios de clasificación y algunas veces también ofrecen técnicas
mas avanzadas.

APLICACIONES DE CONCEPTO ESTADÍSTICO AL MUNDO DE LOS


NEGOCIOS

Existen muchas aplicaciones de las técnicas de ANOVA presentadas a


lo largo de este tema que son importantes para el mundo de los negocios.
Cuando el valor promedio de alguna variable se compara con tres o mas
poblaciones, las conclusiones que resultan de un estudio de ANOVA pueden
ser muy útiles para el administrado
administrador.
r. Con frecuencia se modifican
modifican las variables
de pr
prod
oduc
uccción
ión para
para dete
determ
rmin
inar
ar que
que co
comb
mbin
inac
ació
ión
n llllev
eva
a al proc
proces
eso
o de
manufactura optimo.

EJERCICIOS

Numero 1.- Prueba de varianza con una población.

Los instrumentos científicos de medición como el altímetro de un avión,


debe
deben
n pr
prop
opor
orci
cion
onal
al le
lect
ctur
uras
as co
corr
rrec
ecta
tass y co
con
n erro
errore
ress de me
medi
dici
ción
ón mu
muyy
pequeños. El gerente de producción esta preocupado por el índice de variación

en las lecturas producidas por los altímetros de su compañía. Los altímetros


están diseñados para tener una desviación estándar de 200 pies. El gerente
decide probar si la variabilidad de estos instrumentos es mayor que 200 pies.
Selecciona una muestra de siete altímetros y calcula una desviación estándar 
de 250 pies.
a) Estab
Establezca
lezca las hipótes
hipótesis
is nu
nula
la y altern
alternativa
ativa..
b) Cal
Calcu
cule
le los grados
grados d
de
e lib
libert
ertad.
ad.
c) Estab
Establezca
lezca la
lass reglas de
de decis
decisión
ión para un nivel
nivel de sig
significa
nificacia
cia de 0,05
0,05
d) Prueb
Pruebe
e si la var
variabilid
iabilidad
ad de los a
altímet
ltímetros
ros de la co
compañ
mpañía
ía es may
mayor
or que

200 pies.
 

a) La h
hipóte
ipótesis
sis nula y alterna
alternativa
tiva son:
H0 :δ 2 <40,000 à menor e igual
H1: δ 2 > 40,000 à mayor o igual
b) gl = (n –1)
–1) = (7 – 1 ) = 6
c) La rreg
egla
la de
de de
deci
cisi
sión
ón es:
es:
Si χ 2
> 12,59, se rechaza la hipótesis nula de que la varianza de la
población es 40,000 (se rechaza H0 si χ 2 > 12,59).
(n-1)s2 (7 – 1 )(250)2
d) χ 2 = ------------------ = -----------------------
-------------------- --- = 9,375
2
  δ 2002

Como el estadístico de prueba calculado (9,375) es menor al valor crítico de


la tabla (12,59), la hipótesis nula no se puede rechazar a un nivel de
significacia de 0,05. No existe suficiente evidencia muestral para concluir 
que la desviación estándar poblacional es mas de 200 pies.

Número 2.- Prueba de varianza con dos poblaciones.

Carla Mitchell, analista de los laboratorios Abbott, un fabricante nacional


de medicamentos, esta preocupada por la calidad de uno de sus productos.
Abbott compra el material para fabricar este producto a dos proveedores. El
nivel de defectos en la materia prima es aproximadamente el mismo entre los
dos proveedores, pero Carla esta preocupada por la variabilidad que existe de
un embarque a otro. Si el nivel de defectos tiende a variar en forma excesiva
para uno proveedor, puede afectar la calidad del medicamento. Para comparar 
la variación relativa de los dos proveedores, Carla selecciona 11 embarques de
cada uno y mide los porcentajes de defectos en la materia p
prima,
rima, junto con la
desviación estándar. Los resultados son:
S1 = 0,61 n1= 11 (proveedor 1)
S2= 0,29 n2= 11 (proveedor 2)
 

a) Estab
Establezca
lezca la hipótes
hipótesis
is n
nula
ula y alternativa
alternativa
b) Cal
Calcu
cule
le los
los gr
grado
adoss de llibe
iberta
rtad
d
c) Estab
Establezca
lezca la re
regla
gla de dec
decisión
isión para
para un nive
nivell de significanc
significancia
ia de 0,05.
d) Prue
Prueba
ba si la va
vari
riab
abili
ilida
dad
d de
dell ni
nive
vell de defe
defect
ctos
os po
porr em
emba
barq
rque
ue de un
proveedor 1 es mayor que para el proveedor 2.

a) Las hipótesis
hipótesis nula y alterna
alternativa
tiva son:
H0 : δ 1
2
-δ 2
2
<0
2 2
H1 : δ 1 -δ 2 >0
b) gl1 = (n1 –1 ) = (11 – 1) = 10
gl2 = (n2 – 1) = (11 – 1) = 10 
c) El valo
valorr ccrí
rítitico
co F es 2,97. La regla de decisión es
Si el cociente F  calculado es mayor que 2,97, se rechaza H 0 (se
rechaza H0 si F > 2,97)

S12 (0.61)2
d) -----
----- = ---
------
-----
-- = 4.
4.42
42
S22 (0.29)2

Una de las varianzas muestras es 4,42 veces la otra. La hipótesis nula


se rechaza porque el estadístico (2,97). Carla debe concluir que la variabilidad
en los niveles de defectos de los embarques para el proveedor 1 es mayor que
para los del proveedor 2.

Número 3.- Análisis de la varianza con un criterio de clasificación.

La due
dueña
ña de la corpor
corporaci
ación
ón LUZ COLOR
COLOR dec
decide
ide ree
reempl
mplaza
azarr var
varias
ias
pinturas de aerosol. Después de investigar la situación, concluye que 4 marcas
pare
parece
cen
n co
comp
mpar
arab
able
less en té
térm
rmino
inoss de co
cost
ste
e y vi
vida
da útil
útil proy
proyec
ecta
tada
da,, el
ella
la
determina que el factor decisivo entre las cuatro marcas es la cantidad de
pintura que se usa en la operación normal. Mide entonces el espesor de la
pintura, en milímetros, para varias pruebas , con los siguientes resultados.
 

AEROSOL 1 AEROSOL 2 AEROSOL 3 AEROSOL 4


5,4 6,1 8,2 7,2
5,9 5,9 8,5 6,5
6,2 6,3 6,9 6,8
7,0 6,5 9,4 7,1
5,1 7,2 7,9 7,4
5,5 6,9 8,6 6,7
MEDIA = 5,85 648 8,25 6,95

Media Global = x = 6.88


a) Establezca
Establezca las hipótes
hipótesis
is nu
nula
la y a
altern
lternativa.
ativa.
b) Cal
Calcu
cule
le los
los gr
grado
adoss de llibe
iberta
rtad
d
c) Est
Estab
ablez
lezca
ca la regla de decisió
decisión
n si se pru
prueba
eba la hipó
hipótes
tesis
is nula al
0,01 de nivel de significacia.
d) ¿ A q
que
ue conc
conclus
lusión
ión se llleg
lega?
a?

a) Las hipótesis
hipótesis nula y alterna
alternativa
tiva son:
H0 : µ 1 = µ 2 = µ 3 = µ 4

H1 : No todas las poblaciones tienen la misma media.

b) Gln = c(n – 1) = 4(6 – 1) = 20


gl2 = (c - 1) = (4 –1) = 3
c) En
Encu
cuen
entr
tra
a el elemen
elemento
to de la ta
tabl
bla
a F  para la columna 3 y la fila 20.
Para un nivel de significacia de 0,01 este valor crítico es 4,94. La
regla de decisión es:
Si el cociente F calculado es mayor que 4,94, se rechaza la hipótesis
nula ( se rechaza H0 si F > 4,94)

d) La sig
siguient
uiente
e tabla contie
contiene
ne la tabla
tabla ANOV
ANOVA
A para este
este prob
problema.
lema.
Fuente de SC gl Estimación Cociente F
variación de δ 2
Grupos entre 18,61 3 6,203 16,37
Grupos 7,57 20 0,379
dentro
Total 26,18 23
 
 

Las sumas de cuadrados en esta tabla son:

(5,4 – 5,85)2 + (5,9 – 5,85)2 + (6,2 –5,85)2 +


(7,0 – 5,85)2 + (5,1 – 5,85)2 + (5,5 –5,85)2 +
(6,1 – 6,48)2 + (5,9 – 6,48)2 + (6,3 –6,48)2 +
(6,5 – 6,48)2 + (7,2 – 6,48)2 + (6,9 –6,48)2 +
(8,2 – 8,25)2 + (8,5 – 8,25)2 + (6,9 –8,25)2 +
(9,4 – 8,25)2 + (7,9 – 8,25)2 + (8,6 –8,25)2 +
(7,2 – 6,95)2 + (6,5 – 6,95)2 + (6,8 –6,95)2 +
(7,1 – 6,95)2 + (7,4 – 6,95)2 + (6,7 –6,95)2 +
SCn = 7,57
(5,85 – 6,88)2 + (6,48 – 6,88)2 + (8,25 –6,88)2 + (6,95 – 6,88)2 = 3,1
SCb = 6(3,1) = 18,6

Sb2/glb (18,6/3) 6,2


  F = ------------ = ----------------- = ---------- = 16,36
Sn2 /glw (7,57/20) 0,379
La hipótesis nula se rechaza ya que el estadístico de prueba (16,36) es
mayor que el valor critico (4,94). La conclusión es que el espesor de la pintura
difiere entre todas estas cuatro marcas de aerosol.

Número 4.- 

Pedro Martínez, analista de la compañía de investigaciones de mercado


profesional marketing, esta llevando a cabo de un estudio para un cliente a fin
de determinar si la edad y la escolaridad afectan a los ingresos percibidos. La
tabla siguiente da los resultados del conjuntos de datos de Julie. ¿Cual será la
conclusión de Julie si hace la prueba con un nivel de significancia de 0,05?

Grupo de Edad Preparatoria Universidad Posgrado


18 a < 30 $25,000 $36,250 $42,500
31,450 39,400 46,000
27,500 35,450 47,250
30 a < 50 2
380,0
9050 46
4,2
4500 52
6,6
700
26,250 48,450 57,750
 

50 + 35,000 46,250 62,800


38,250 49,400 66,700
37,700 55,450 70,250

Los datos anteriores se ejecutan en un programa de computadora

Los cocientes F calculados se comparan con los valores F críticos.


gl F crítica ( α = 0,05) Estadístic
Estadístico
o de prueb
prueba
a F 
calculado
2,18 3,55 55,87
2, 18 3,55 161,24
4,18 2,93 4,78

De acuerdo con los valores críticos apropiados y los cocientes críticos de F 

de la anterior tabla , las tres hipótesis nulas se rechazan. Con esto como
fundamento, Julie concluye que:
1. Exis
Existe
te in
inte
tera
racc
cció
ión
n entr
entre
e la
lass celd
celdas
as y la
lass es
esco
cola
lari
rida
dad.
d. Pa
Pare
rece
ce habe
haber 

diferencias inesperadas cuando ciertos campos de edad se comparan
con ciertos niveles de escolaridad . El rechazo de la hipótesis nula de
que no hay interacción hace que Juie regrese a los datos muestrales
para buscar
buscar las combin
combinacion
aciones
es de edad / escolaridad
escolaridad que produjeron
produjeron
los resultados inesperados.
2. Los grupos
grupos de edad
edad tien
tienen
en dife
diferente
rentess niveles
niveles de
de ingre
ingreses
ses

3. Los grupos
grupos de esc
escolarid
olaridad
ad tien
tienen
en diferentes
diferentes niveles
niveles de in
ingrese
greses.
s.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy