MODULO III Estadística
MODULO III Estadística
MODULO III Estadística
1. Valores centrales
a. Concepto de promedio.
2. Medidas de dispersión.
a. Concepto de desviación.
c. Rango o recorrido.
f. Varianza. Propiedades.
i. Desviación cuartílica.
j. Rango semi-cuartílico.
3. Forma de distribución.
k. Coeficiente de asimetría.
l. Coeficiente de Kurtósis.
MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRIA.
MEDIDAS DE TENDENCIA CENTRAL:
Las medidas de tendencia central son parámetros estadísticos que informan sobre
el centro de distribución de la muestra o la población estadística. En otras
palabras, es un número que se ubica hacia el centro de la distribución de los
valores de una serie de observaciones o medidas, en la que se encuentra
localizado el conjunto de los datos.
Para calcular la mediana, lo que se debe hacer es “partir en dos” la muestra. Para
hacer esto, es necesario agrupar los datos de menor valor a mayor valor, dejando
la misma cantidad de valores de un lado que del otro. Es diferente a la media ya
que nos da la posición promedio del conjunto de datos. La fórmula matemática de
esta medida de tendencia central es la siguiente:
Moda: Finalmente, llegamos a la moda. Esta medida de tendencia central es
sencillamente el valor que más se repite en la muestra estadística o población. Si
bien existe una fórmula matemática, lo más fácil de hacer es determinar cuál es el
valor que más se repite.
En otras palabras, las medidas de tendencia central son sumamente útiles porque
ayudan a resumir el número de datos en un solo valor para facilitar el análisis en
detalle de todo el conjunto de información.
También tenemos que aclarar que las medidas de tendencia central y dispersión
(específicamente estas últimas) tienen las mismas unidades que la cantidad que
se está midiendo. Por ejemplo, si los datos que estamos recolectando están en
centímetros o segundos, también lo estará la medida de dispersión de la que
hablamos.
Y entre las medidas de dispersión más utilizadas o conocidas podemos
mencionar:
Rango.
Rango intercuartil (IQR).
Desviación Estándar.
Mediana desviación absoluta (MDA).
Desviación media absoluta o desviación media.
Desviación estándar de distancia.
Diferencia absoluta media de Gini.
a. Concepto de promedio.
Cantidad o valor que se logra sumando todos los valores de una serie de datos
cuantitativos que se divide a su vez entre el número o cantidad de sumados. Se lo
suele denominar también media aritmética.
Por ejemplo, de los siguiente número: 10, 23, 45, 67, 81, 23 y 75, el promedio
sería: (10+23+45+67+81+23+75)/7=46,28
PA = S / n
PA = a1 + a2 + a3 + ... an / n
Datos agrupados y no agrupados
Los datos agrupados son los que se clasifican en categorías o clases, que
es el número de subconjuntos, tomando como criterio su frecuencia. Se
trata de hacer más fácil y de simplificar el manejo de grandes cantidades de
datos y poder así establecer cuáles son sus tendencias. Es recomendable
agruparlos si se trata de 20 o más elementos que tienen características
comunes y pueden ser organizados en categorías, de esta forma se puede
conseguir manejar mejor y analizar en forma más profunda.
Los datos agrupados se organizan en una tabla de frecuencia, siendo esta tabla el
número de veces que cada valor se repite en la serie de datos.
Por su parte, los datos no agrupados constituyen el conjunto de datos que
no han sido clasificados y que son presentados en una tabla de datos en
forma individual, es decir que no forman parte de un conjunto. De manera
general constituye una cantidad de elementos que es menor a 30 con muy
poca o nula repetición.
Existen así las medidas de tendencia central para datos no agrupados, cuyos
datos se manejan en forma simple. Primero son recolectados los datos de la
población de estudio y estos son distribuidos en una tabla y analizados sin formar
clases, que son el número de subconjuntos en que se han agrupado los datos con
los mismos: cada dato mantiene su propia identidad luego de que se ha elaborado
la distribución de frecuencia.
Los datos agrupados son aquellos que están clasificados en función a un criterio,
mostrando una frecuencia para cada clase o grupo formado.
La moda
Es la tercera de las medidas de tendencia central para datos no agrupados. Esta
medida sirve para identificar cuando un dato aparece continuamente, como
también durante un periodo de tiempo determinado. Es en sí el dato que más
aparece en un grupo, también pudiendo existir dos modas, conociéndose así
como bimodal o, cuando hay más de dos modas recibe la denominación de
multimodal, que es cuando el máximo número de repeticiones se da para tres o
más números.
Para calcular la moda se deben escribir los números del conjunto y luego escribir
el número o los números que se repiten mayor cantidad de veces. En un conjunto
con los siguientes componentes: 4, 5, 8, 8, 7, 6, 8; la moda es el número 8 al ser el
número que se repite más.
Es decir, cuando tenemos una serie de datos que no poseen igual relevancia (es
decir, no poseen igual ponderación) dentro del conjunto, por lo que no es
adecuado obtener simplemente una media aritmética.
Así, para obtener un promedio ponderado debemos multiplicar cada dato por su
ponderación (o peso) y luego sumándolos (esto se denomina una suma
ponderada), para finalmente dividir la cifra obtenida entre la suma de los pesos o
ponderaciones. Fórmula de la media aritmética ponderada.
Calcule el valor de los logaritmos naturales (ln) de los números usando una
calculadora o regla de cálculo. Escribe estos números abajo. En el ejemplo, ln
(190) = 5.25 y ln (280) = 5.63.
Calcula la diferencia de los dos números de los que deriva la media al restar uno,
llamado x, del otro, llamado y. El cálculo de la media de más de dos logaritmos
requerirá una fórmula diferente y una matemática superior, por lo que solo utilice
este método para obtener la media de dos logaritmos. Siguiendo el ejemplo
anterior, 280 - 190 = 90.
Propiedades:
Moda para datos no agrupados: Si ningún número se repite dentro del conjunto
de datos decimos que la moda no existe. Además, puede darse el caso de que
haya más de una moda. Esto pasa cuando más de un número se repiten la misma
cantidad de veces.
2. MEDIDAS DE DISPERSIÓN.
A la variabilidad que existe entre ellos, o dicho de otra forma, al grado en que los
valores de la variable estadística tienden a extenderse alrededor del centro o
promedio de la distribución.
Las medidas de dispersión indican el grado de concentración de los valores de la
variable alrededor de una medida de posición central, dando, a su vez, una idea
de la representatividad de esta medida de centralización como resumen global de
la variable.
Una desviación baja indica que los puntos de datos están muy cerca de la media,
mientras que una desviación alta muestra que los datos están dispersos en un
rango mayor de valores.
c. Rango o recorrido.
El Rango es la diferencia numérica entre el valor máximo y el valor mínimo; por
ello, comparte unidades con los datos. Permite obtener una idea de la dispersión
de los datos, cuanto mayor es el rango, aún más dispersos están los datos. El
rango, también es llamado amplitud o recorrido de medida.
f. Varianza. Propiedades.
Es una medida de dispersión que indica el rango entre la mitad de los datos
centrales. En concreto, la desviación cuartil es igual a la diferencia entre el tercer
cuartil y el primer cuartil dividido por dos.
j. Rango semi-cuartílico.
Es la mitad de la diferencia entre el primer y el tercer cuartil. Por lo tanto, para
calcular el rango semi-intercuartil se debe restar el tercer cuartil menos el primer
cuartil y luego dividir entre dos.
3. Forma de distribución.
Son parte de las funciones de probabilidad que aparecen con mayor frecuencia
cuando se realiza algún estudio estadístico.
Distribución uniforme: continua. Todos los valores tienen la misma
posibilidad.
k. Coeficiente de asimetría.
Es un coeficiente que permite calcular la asimetría de una distribución. Es decir, el
coeficiente de asimetría sirve para determinar si una función es asimétrica
positiva, asimétrica negativa o simétrica.
Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.
Alternative Proxies: