Universidad de Las Fuerzas Armadas ESPE: Diseño Experimental
Universidad de Las Fuerzas Armadas ESPE: Diseño Experimental
Universidad de Las Fuerzas Armadas ESPE: Diseño Experimental
Diseño Experimental
Massiel Zurita
25/8/2020
Cargar librería
1
## Warning: package ’dplyr’ was built under R version 4.0.2
##
## Attaching package: ’dplyr’
##
## Attaching package: ’rstatix’
##
## Attaching package: ’rcompanion’
2
## effectsize haven apaTables DescTools report dplyr rstatix
## TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## FSA rcompanion tidyBF
## TRUE TRUE TRUE
devtools::install_github("easystats/report")
## Skipping install of ’report’ from a github remote, the SHA1 (ee77c479) has not changed since last ins
## Use ‘force = TRUE‘ to force installation
library(report)
Importar datos
Anova$edad<-as.factor(Anova$edad)
Anova paramétrico
objeto<-aov(Anova$ASF ~ Anova$edad)
summary(objeto)
Se le asigna como variable objeto a la variable continua y la variable de agrupación para realizar el anova
con el comando summary el cual muestra con el valor_p < α (α = 0.05), con lo cual se rechaza la H0 y se
acepta H1 teniendo la variable edad significancia sobre la variable de respuesta ASF (p_valor<2e-16).
3
plot(objeto)
Residuals vs Fitted
2907
3130
3075
10
5
Residuals
0
−5
−10
Fitted values
aov(Anova$ASF ~ Anova$edad)
4
Normal Q−Q
2907
3130
3
3075
Standardized residuals
2
1
0
−1
−2
−2 0 2
Theoretical Quantiles
aov(Anova$ASF ~ Anova$edad)
5
Scale−Location
2907
3130
3075
1.5
Standardized residuals
1.0
0.5
0.0
Fitted values
aov(Anova$ASF ~ Anova$edad)
6
Residuals vs Leverage
2907
3130
3
3075
Standardized residuals
2
1
0
−1
−2
Cook's distance
−3
Leverage
aov(Anova$ASF ~ Anova$edad)
Aqui se muestran los plots del ejercicio donde se puede observar que los datos siguen una distribución
normal según el Q-Q plot y el supuesto de homocedasticidad según las gráficas de residuos.
report(objeto)
El reporte general indica que se tiene significancia debido a que el F calculado es mayor que el F crítico (F(2,
3680) = 190.37, p < .001).
Post Hoc
##
## Posthoc multiple comparisons of means : Tukey HSD
##
## $‘Anova$edad‘
## 1 2
## 2 8.8e-09 -
## 3 8.8e-09 8.8e-09
7
Hay diferencias significativas entre los grupos 1-2,1-3 y 2-3; siendo el 1 los menores, 2 los intermedios y 3 las
mayores.
Tuckey
TukeyHSD(objeto)
plot(TukeyHSD(objeto))
Los grupos 2-1 presentan menor diferencia, seguido del grupo 3-2 y las mayores diferencias entre el grupo
3-1; siendo el 1 los menores, 2 los intermedios y 3 las mayores.
8
Descriptivos
apa.1way.table(edad,ASF,Anova)
##
##
## Descriptive statistics for ASF as a function of edad.
##
## edad M SD
## 1 9.40 3.88
## 2 8.12 4.12
## 3 6.38 3.73
##
## Note. M and SD represent mean and standard deviation, respectively.
##
Las medias y desviaciones de los tres grupos de edad siendo el grupo 1 con mayor media, el grupo 2 con
mayor desviación estándar(mayor variabilidad en los datos) y el 3 con menor media y menor variabilidad;
siendo el 1 los menores, 2 los intermedios y 3 las mayores.
FSA::Summarize(ASF ~ edad,
data=Anova,
digits=2)
Otra manera de hacerlo es con SUmmarize que muestra los cuartiles de cada grupo incluso.
apa.aov.table(lm_output,filename="pokemen2.doc",table.number = 4)
##
##
## Table 4
##
## ANOVA results using ASF as the dependent variable
##
##
## Predictor SS df MS F p partial_eta2
## (Intercept) 112173.96 1 112173.96 7351.60 .000
## edad 5809.37 2 2904.68 190.37 .000 .09
## Error 56151.10 3680 15.26
## CI_90_partial_eta2
##
## [.08, .11]
##
##
## Note: Values in square brackets indicate the bounds of the 90% confidence interval for partial eta-sq
9
Otra manera es utilizar la función lm que nos indica que la variable ASF es dependiente de las edades y que
en el intervalo de confianza del 90% para eta-cuadrado los límites son [.08, .11]
Tamaños de efecto
Eta cuadrado (η 2 )
## [1] 0.0937593
ome<-effectsize::omega_squared(objeto)
ome
epsilon_squared(objeto)
De igual manera se calcula epsilon cuadrado (2 ), siendo una mejor estimación de la fuerza de asociación en
una población de lo que es eta cuadrado, explicando que los datos de la prueba variaron un 9% debido al
efecto de las edades.
cohens_f(objeto)
Este parámetro tambíen permite estudiar la variabilidad de los datos obteniéndose 32% en ASF por el factor
de tratamiento edades.
10
interpret_omega_squared(ome, rules = "field2013")
AL interpretar omega cuadrado siendo los tamaños de efecto medios y los intervalos de confianza también
siendo 0.09 tamaño del efecto medio.
Anova no paramétrico
##
## Kruskal-Wallis rank sum test
##
## data: ASF by edad
## Kruskal-Wallis chi-squared = 353.87, df = 2, p-value < 2.2e-16
Al obtener un valor menor a α significa que se rechaza la hipótesis nula y se acepta la alternativa, siendo el
factor edades significante para los datos (p_valor < 2.2e-16) .
pairwise.wilcox.test(Anova$ASF, Anova$edad,
p.adjust.method = "BH")
##
## Pairwise comparisons using Wilcoxon rank sum test with continuity correction
##
## data: Anova$ASF and Anova$edad
##
## 1 2
## 2 2.7e-15 -
## 3 < 2e-16 < 2e-16
##
## P value adjustment method: BH
Entre grupos se da una diferencia significativa entre los grupos 1-2, 1-3 y 2-3; siendo 1 los más jovenes, 2
intermedios y 3 los mayores.
Dun test
11
dunnTest(ASF ~ edad,
data=Anova,
method="bh")
## Warning: Some rows deleted from ’x’ and ’g’ because missing data.
Los grupos 1-2 presentan menor diferencia, seguido del grupo 2-3 y las mayores diferencias entre el grupo
1-3; siendo el 1 los menores, 2 los intermedios y 3 las mayores.
Eta cuadrado (η 2 )
Anova %>%
kruskal_effsize(ASF ~ edad)
## # A tibble: 1 x 5
## .y. n effsize method magnitude
## * <chr> <int> <dbl> <chr> <ord>
## 1 ASF 3838 0.0918 eta2[H] moderate
epsilonSquared(x = Anova$ASF,
g = Anova$edad)
## epsilon.squared
## 0.0922
freemanTheta(x = Anova$ASF,
g = Anova$edad)
## Freeman.theta
## NA
Al obtener el eta una variabilidad de 9.18% , el epsilon 9,22% en los datos debido al factor edades. Para el
caso de theta no se calcula porque existen casos perdidos dentro de la población.
12
Tamaño del efecto de los de los posthoc no paramétricos.
multiVDA(x = Anova$ASF,
g = Anova$edad)
## $pairs
## Comparison VDA CD rg VDA.m CD.m rg.m
## 1 1 - 2 0.537 0.074 NA 0.537 0.074 NA
## 2 1 - 3 0.679 0.358 NA 0.679 0.358 NA
## 3 2 - 3 0.563 0.126 NA 0.563 0.126 NA
##
## $comparison
## Comparison
## "1 - 3"
##
## $statistic
## VDA
## 0.679
##
## $statistic.m
## VDA.m
## 0.679
Los grupos 1-2 presentan menor diferencia, seguido del grupo 2-3 y las mayores diferencias entre el grupo
1-3; siendo el 1 los menores, 2 los intermedios y 3 las mayores. Siendo la más fuerte 1-3 siendo el estadístico
0.679.
Anovas bayesianos
## # A tibble: 1 x 7
## bf10 bf01 log_e_bf10 log_e_bf01 log_10_bf10 log_10_bf01 bf.prior
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 4.16e75 2.40e-76 174. -174. 75.6 -75.6 0.707
Al obtener que el factor bayesiano es extremadamente alto , es decir mayor a 100, se interpreta como una
extrema evidencia para aceptar la hipótesis alternativa, demostrándo significancia del factor edades sobre
ASF (bf10=4.162446e+75).
Graficando
ggstatsplot::ggbetweenstats(
data = Anova,
x = edad,
y = ASF,
plot.type = "violin", # type of plot también se puede "box" o "violin"
notch = TRUE, # box plot cuadrado o ovalado (notch)
mean.ci = TRUE, # Intervalos de confianza para las medias
type = "r", #"p" (para parametrica), "np" (no parametrica), "r" (robusta), or "bf" (bayes factor)
13
effsize.type = "partial_omega",# hay "biased" (equivalente a la d cohen del t test), "partial_eta" (et
k = 2, # cuántos decimales?
pairwise.comparisons = TRUE, # Muestra las comparaciones post hoc
p.adjust.method = "bonferroni", # método para utilizar las post hoc. esta: "holm", "hochberg", "hommel
pairwise.display = "s", # "s" solo te muestra las que son significativas, "ns" muestra no significativ
outlier.tagging = TRUE, # mostrar outliers
outlier.coef = 1.5, # coeficiente para considerarlo outlier siguiendo la Tukey’s rule
xlab = "rótulo del eje x",
ylab = "rótulo del eje y",
title = "Anova de un factor", # Título del plot
ggtheme = ggthemes::theme_economist(), # cambiar el fondo del gráfico
ggstatsplot.layer = FALSE, # turn off ‘ggstatsplot‘ theme layer
package = "wesanderson", # elegir el paquete asociado a la paleta de colores.
palette = "Darjeeling1", # cambiar la paleta
messages = FALSE
)
14
Anova de un factor
F trimmed−means(2,1950.56) = 186.74, p = < 0.001, ξ = 0.38, CI95% [0.34, 0.41], n obs = 3683
p adjusted ≤ 0.001
p adjusted ≤ 0.001 18
20 p adjusted ≤ 0.001 18
17
17
17
15
rótulo del eje y
17
0
1 2 3
(n = 1269) (n = 1157) (n = 1257)
rótulo del eje x
El gráfico indica que las varianzas no son iguales para los tres grupos, el p_valor es menor que 0.001 siendo
significativo el factor edad sobre la variable dependiente ASF, el intervalo de confianza se encuentra entre
[0.34;0.40] para un intervalo de confianza de 95%.
El grupo con mayor media es el 1 y el menor media es el 3, la mediana del grupo 1 es 10, del grupo 2 es 8 y
del 3 es 6. Además de las observaciones para el grupo 1 es 1269, para el 2 es 1157 y para el 3 es 1257, siendo
el total 3683;siendo 1 los menores, 2 los intermedios y 3 los mayores.
15