Desviación Media
Desviación Media
Desviación Media
Ejemplo:
Calcular la desviación media de la distribución:
xi fi xi · fi |x - x| |x - x| · fi
[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.714 21.428
21 457.5 98.57
Variancia de muestras:
Varianza de una muestra y una población
Usamos el término variación como una descripción general de la cantidad que varían los valores entre sí. (En
ocasiones se aplica el término dispersión en vez de variación). El término varianza se refiere a una definición
específica
Por ejemplo, si los tiempos de espera originales de los clientes están dados en minutos, las unidades de
varianza están dadas en minutos cuadrados (min2 ). ¿Qué es un minuto cuadrado? Como la varianza utiliza
unidades distintas, es sumamente difícil comprenderla si la relacionamos con el conjunto original de datos.
Por esta propiedad, nos enfocaremos en la desviación estándar cuando tratemos de comprender la
variación más adelante en este capítulo. Ahora presentamos la notación y la regla de redondeo que
utilizamos. Varianza muestral 5 s 2 5 7.02 5 49.0 min2
Conclusiones:
La varianza es un estadístico importante que se utiliza en algunos métodos estadísticos relevantes, como el
análisis de varianza, que se explica el capítulo 12. Para nuestros propósitos, la varianza tiene una gran
desventaja: las unidades de la varianza son diferentes de las unidades del conjunto original de datos. Por
ejemplo, si los tiempos de espera originales de los clientes están dados en minutos, las unidades de varianza
están dadas en minutos cuadrados (min2). ¿Qué es un minuto cuadrado? Como la varianza utiliza unidades
distintas, es sumamente difícil comprenderla si la relacionamos con el conjunto original de datos. Por esta
propiedad, nos enfocaremos en la desviación estándar cuando tratemos de comprender la variación más
adelante en este capítulo.
Ahora presentamos la notación y la regla de redondeo que utilizamos.
Notación
s 5 desviación estándar muestral
s2 5 varianza muestral
s5 desviación estándar poblacional
s2 5 varianza poblacional
Nota: Los artículos de las revistas y los reportes científicos suelen usar DE (o bien,
SD, por standard deviation en inglés) para la desviación estándar y VAR para la
varianza.
Regla práctica del intervalo Para estimar el valor de la desviación estándar s: Para obtener un estimado de la
desviación estándar, utilice donde el rango 5 (valor máximo) 2 (valor mínimo). Para interpretar un valor
conocido de la desviación estándar: Si se conoce la desviación estándar s, utilícela para calcular estimados
de los valores muestrales mínimos y máximos “comunes” por medio de valor mínimo “común” 5 (media) 2 2
3 (desviación estándar) valor máximo “común” 5 (media) 1 2 3 (desviación estándar) s < rango
5 (valor máximo) 2 (valor mínimo).
Para interpretar un valor conocido de la desviación estándar: Si se conoce la desviación estándar s, utilícela
para calcular estimados de los valores muestrales mínimos y máximos “comunes” por medio de valor
mínimo “común” 5 (media) 2 2 3 (desviación estándar) valor máximo “común” 5 (media) 1 2 3 (desviación
estándar) s < rango 4 Cuando calcule una desviación estándar por medio de las fórmulas 3-4 o 3-5, la regla
práctica del intervalo resulta útil para verificar el resultado, pero debe estar consciente de que, si bien la
aproximación nos acerca a la respuesta, puede tener un error considerable.
EJEMPLO Edades de las mejores actrices Utilice la regla práctica del intervalo para calcular un estimado de la
desviación estándar con la muestra de las 76 edades de las actrices que ganaron un Óscar en la categoría de
mejor actriz. Las edades se presentan en la tabla 2-1, que viene incluida en el problema del capítulo 2.
SOLUCIÓN Al emplear la regla práctica del intervalo para estimar la desviación estándar de datos muestrales,
calculamos el rango y lo dividimos entre 4. Si observamos la lista de las edades de las actrices, notaremos
que el valor máximo es de 80 y el valor mínimo de 21; por lo tanto, la regla práctica del intervalo para
estimar la desviación estándar s se utiliza de la siguiente manera:
Conclusiones:
INTERPRETACIÓN Este resultado se acerca al valor correcto de 11.1, que se obtiene al calcular el valor
exacto de la desviación estándar con las fórmulas 3-4 o 3-5, aunque el resultado de 15 se aleja de la
desviación estándar real de forma considerable. Esto demuestra que la regla práctica del intervalo produce
un estimado “burdo” que puede alejarse mucho del resultado real. El siguiente ejemplo es particularmente
importante como ilustración de una forma de interpretar el valor de una desviación estándar
La simple suma de las desviaciones no funciona, ya que la suma siempre será cero. Para obtener un
estadístico que mida la variación (en vez de que siempre sea cero), necesitamos evitar la cancelación de
números positivos y negativos. Un método consiste en sumar valores absolutos, como en Si calculamos la
media de esta suma, obtendremos la desviación media absoluta (DMA), que es la distancia media de los
datos con respecto a la media. desviación media absoluta Puesto que los tiempos de espera de 1, 3 y 14
tienen desviaciones de 25, 23 y 8, la desviación media absoluta es (5 1 3 1 8)>3 5 16>3 5 5.3.
¿Por qué no utilizar la desviación media absoluta? Como la desviación media absoluta requiere que usemos
valores absolutos, emplea una operación que no es algebraica. (Las operaciones algebraicas incluyen la
suma, la multiplicación, la raíz cuadrada y la elevación a potencias enteras o fraccionarias, pero el valor
absoluto no está incluido). El uso de valores absolutos crea problemas algebraicos en los métodos
inferenciales de la estadística. Por ejemplo, la sección 9-3 presenta un método para hacer inferencias acerca
de las medias de dos poblaciones, y ese método se construye alrededor de una propiedad de adición de las
varianzas, pero la desviación media absoluta no posee tal propiedad de adición. (He aquí una versión
simplificada de la propiedad de adición de la varianza: si se tienen dos poblaciones independientes y si
selecciona aleatoriamente un valor de cada población y se suman, esas sumas tendrán una varianza que es
igual a la suma de las varianzas de las dos poblaciones).
La misma propiedad de adición subyace en los fundamentos de la regresión, que se presenta en el capítulo
10, y el análisis de varianza, que se estudia en el capítulo 12. La desviación media absoluta carece de esta
importante propiedad de adición. Además, el valor de la media absoluta está sesgado, lo que significa que
cuando se calculan valores de media absoluta de muestras, no se tiende a igualar el valor medio absoluto de
la población. En contraste, la desviación estándar utiliza únicamente operaciones algebraicas. Puesto que se
basa en la raíz cuadrada de una suma de cuadrados, la desviación estándar se asemeja a las fórmulas de
distancia que se emplean en álgebra. Existen muchos ejemplos en los que un procedimiento estadístico se
basa en una suma de cuadrados similar. Por lo tanto, en vez de emplear valores absolutos, obtenemos una
mejor medida de variación si logramos que ninguna de las desviaciones sea negativa, elevando todas al
cuadrado; este método conduce a la desviación estándar. Por esas razones, las calculadoras científicas
suelen incluir una función para la desviación estándar, pero casi nunca para la desviación media absoluta.
¿Por qué dividir entre n 21? Después de obtener todos los valores individuales de los combinamos
calculando su suma y luego obtenemos un promedio dividiéndola entre n 2 1. Dividimos entre n 2 1 porque
existen solamente n 2 1 valores independientes. Es decir, con una media dada, sólo a n 2 1 valores se les
puede asignar un número con libertad, antes que se determine el último valor. Vea el ejercicio 38, que
ofrece números concretos, los cuales ilustran cómo la división entre n 2 1 es mejor que la división entre n.
Este ejercicio demuestra que si s 2 se definiera con la división entre n, de forma sistemática subestimaría el
valor de s2 , por lo que lo compensamos al incrementar su valor general haciendo que su denominador sea
más pequeño (usando n 2 1 en vez de n).
Conclusiones:
El ejercicio 38 demuestra cómo la división entre n 2 1 provoca que la varianza muestral s 2 iguale el valor de
la varianza poblacional s2 , mientras que la división entre n causa que la varianza muestral s 2 subestime el
valor de la varianza poblacional s2 . El paso 6 del procedimiento para calcular la desviación estándar implica
sacar una raíz cuadrada. Esto se hace para compensar la elevación al cuadrado que se realizó en el paso 3.
Una consecuencia importante de la obtención de la raíz cuadrada es que la desviación estándar tiene las
mismas unidades de medición que los valores originales. Por ejemplo, si el tiempo de espera de los clientes
está dado en minutos, la desviación estándar de tales tiempos también estará dada en minutos. Si nos
detuviéramos en el paso 5, el resultado estaría dado en unidades de “minutos cuadrados”, que es un
concepto abstracto sin relación directa con la realidad.
EJEMPLO Estatura y peso de hombres Si utilizamos los datos de la muestra de estaturas y pesos de los 40
hombres del conjunto de datos 1 del apéndice B, obtendremos los estadísticos que aparecen en la siguiente
tabla. Calcule el coeficiente de variación de las estaturas, después calcule el coeficiente de variación de los
pesos; finalmente, compare los dos resultados.
Estadísticos para describir, explorar y comparar datos Uso de la tecnología STATDISK, Minitab, Excel y la
calculadora TI-83>84 Plus pueden usarse para hacer los importantes cálculos de esta sección. Use los
mismos procedimientos que se describen al final de la sección 3-2. 3-3 DESTREZAS Y CONCEPTOS BÁSICOS
Conocimientos estadísticos y pensamiento crítico 1. Variación. ¿Por qué la desviación estándar se considera
una medida de variación? Describa con sus propias palabras las características de un conjunto de datos
medido con la desviación estándar. 2. Comparación de la variación.
¿Cuáles datos cree usted que tengan mayor variación: las puntuaciones de CI de 30 estudiantes de un curso
de estadística o las puntuaciones de CI de 30 individuos que ven una película? ¿Por qué? SOLUCIÓN
Tenemos estadísticos muestrales, así que los dos coeficientes de variación se obtienen de la siguiente
manera: Estaturas: Pesos: Aun cuando la diferencia en unidades imposibilita la comparación de la desviación
estándar de 3.02 pulgadas con la desviación estándar de 26.33 libras, es posible comparar los coeficientes
de variación, que carecen de unidades.
Concluciones:
Podemos ver que las estaturas (con CV 5 4.42%) tienen una variación considerablemente menor que los
pesos (con CV 5 15.26%). Lo anterior tiene sentido, ya que por lo general vemos que los pesos de los
hombres varían mucho más que sus estaturas. Por ejemplo, es muy raro encontrar un hombre adulto que
mida el doble que otro, pero es mucho más común ver a un hombre que pese el doble que otro. Después de
estudiar esta sección, debería quedar claro que la desviación estándar es una medida de variación entre
valores. A partir de datos muestrales, usted debería ser capaz de calcular el valor de la desviación estándar,
así como de interpretar los valores de las desviaciones estándar que calcule. También debería saber que
para conjuntos de datos comunes, es inusual que un valor difiera de la media por más de dos o tres
desviaciones estándar.
BLIBLIOGRAFIA:
Variabilidad Absoluta y Relativa en Distribuciones de Frecuencias.: Coeficientes e
Intervalos de Confianza. 2011. Rafael A. Hernandez-Nieto Ph. D., Mariano Duran. 172 pag.
Realmente en este ámbito, la desviación media, sirve para saber cuando algún problema
se desvía o no. Entonces puedes llegar a tener la solución absoluta, preparando solo las
siguientes ecuaciones. CreateSpace Independent Publishing Platform . ISBN
1456356704, ISBN 978-1456356705
Volver arriba↑ Statistics, Third Edition 3 Sub Edition David Freedman, Roger Purves,
Robert Pisani. 578 pag. W. W. Norton & Company; 3 Sub edition (January 1998). ISBN
0393970833, ISBN 978-0393970838
Técnico industrial.
Materia:
Estadística
Grado:
5to
Sección:
Carrera:
Electricidad
Nombre:
Nelson Raúl
Chuy sequen.
Trabajo:
Muestra de variaciones.