MODULO III Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 27

MODULO III (Duración: 12 horas - valor 25%)

MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRIA.

1. Valores centrales

a. Concepto de promedio.

b. Promedio aritmético para datos agrupados: repetidos y no repetidos.

c. Promedio aritmético ponderado.

d. Propiedades del promedio aritmético.

e. Media: Cuadrática, logarítmica, geométrica y armónica.

f. Mediana para datos agrupados: repetidos y no repetidos. Propiedades.

g. Moda para datos agrupados: repetidos y no repetidos. Propiedades.

2. Medidas de dispersión.

a. Concepto de desviación.

b. Propiedades de una buena medida de dispersión.

c. Rango o recorrido.

d. Desviación media absoluta.

e. Desviación media cuadrática.

f. Varianza. Propiedades.

g. Desviación típica. Propiedades.

h. Cuantiles: Cuartil, Decíl, y Percentíl.

i. Desviación cuartílica.

j. Rango semi-cuartílico.

3. Forma de distribución.
k. Coeficiente de asimetría.
l. Coeficiente de Kurtósis.
MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRIA.
MEDIDAS DE TENDENCIA CENTRAL:
Las medidas de tendencia central son parámetros estadísticos que informan sobre
el centro de distribución de la muestra o la población estadística. En otras
palabras, es un número que se ubica hacia el centro de la distribución de los
valores de una serie de observaciones o medidas, en la que se encuentra
localizado el conjunto de los datos.

Las medidas de tendencia central, son herramientas utilizadas para medir


estadísticas cuyo objetivo es resumir en un solo valor a un conjunto de valores, y
de esta manera representar un centro en el cual se deben encontrar ubicados en
conjunto los datos. Existe varias medidas de tendencia central, sin embargo, las
más utilizadas son: media, mediana y moda, otras como las medidas de
dispersión, por ejemplo. Que se encargan de medir el grado de dispersión que se
produce entre los valores de una variable.
Media: La media es la medida de tendencia central más utilizada. Es el valor
promedio de un conjunto de datos numéricos. Se calcula sumando el total del
conjunto de valores dividido entre el número total de valores, es decir, el tamaño
de la muestra. Se expresa de la siguiente forma matemática:

Donde x es el valor de la observación o número i; N el total de observaciones o


tamaño de la muestra.
Mediana: La siguiente medida de tendencia central es la mediana. Con mediana
nos referimos al dato estadístico que parte exactamente a la mitad la misma
cantidad de valores de un lado y del otro.

Para calcular la mediana, lo que se debe hacer es “partir en dos” la muestra. Para
hacer esto, es necesario agrupar los datos de menor valor a mayor valor, dejando
la misma cantidad de valores de un lado que del otro. Es diferente a la media ya
que nos da la posición promedio del conjunto de datos. La fórmula matemática de
esta medida de tendencia central es la siguiente:
Moda: Finalmente, llegamos a la moda. Esta medida de tendencia central es
sencillamente el valor que más se repite en la muestra estadística o población. Si
bien existe una fórmula matemática, lo más fácil de hacer es determinar cuál es el
valor que más se repite.

A diferencia de la media y mediana, la moda también se puede calcular para


observaciones no numéricas.

Se trata de herramientas muy empleadas en la estadística, ya que permiten


obtener la variabilidad de los datos de cualquier población o muestra. Además,
sirven para llevar esas variables a una representación cuantitativa y, de esa
manera, conocer los promedios.

En otras palabras, las medidas de tendencia central son sumamente útiles porque
ayudan a resumir el número de datos en un solo valor para facilitar el análisis en
detalle de todo el conjunto de información.

MEDIDAS DE TENDENCIA DE DISPERSIÓN:

Las medidas de dispersión son otro tipo de medida estadística que en


contraposición de la medida central, miden el grado de dispersión de los valores
de la variable. Dicho de otra manera, son las medidas que indican si una variable
se mueve mucho, poco, más o menos que otras.
Asimismo, es necesario decir que una medida de dispersión estadística se
presenta como un número real no negativo, que será igual a cero si todos los
datos obtenidos son idénticos. La misma también tendrá la tendencia a subir a
medida que los datos se vuelvan mucho más diversos.

También tenemos que aclarar que las medidas de tendencia central y dispersión
(específicamente estas últimas) tienen las mismas unidades que la cantidad que
se está midiendo. Por ejemplo, si los datos que estamos recolectando están en
centímetros o segundos, también lo estará la medida de dispersión de la que
hablamos.
Y entre las medidas de dispersión más utilizadas o conocidas podemos
mencionar:

Rango.
Rango intercuartil (IQR).
Desviación Estándar.
Mediana desviación absoluta (MDA).
Desviación media absoluta o desviación media.
Desviación estándar de distancia.
Diferencia absoluta media de Gini.

MEDIDAS DE TENDENCIA DE ASIMETRIA


Las medidas de asimetría son indicadores que permiten establecer el grado de
simetría (o asimetría) que presenta una distribución de probabilidad de una
variable aleatoria sin tener que hacer su representación gráfica.
Como eje de simetría consideramos una recta paralela al eje de ordenadas que
pasa por la media de la distribución. Si una distribución es simétrica, existe el
mismo número de valores a la derecha que a la izquierda de la media, por tanto, el
mismo número de desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la
media es más larga que la de la izquierda, es decir, si hay valores más separados
de la media a la derecha. Diremos que hay asimetría negativa (o a la izquierda) si
la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si
hay valores más separados de la media a la izquierda.

En punteado amarillo: la media, en punteado azul: la moda.


1. VALORES CENTRALES

Dato estadístico que ocupa la posición central en un conjunto de datos cuando


estos se organizan en orden de magnitud, dejando la misma cantidad de valores a
un lado y al otro.

a. Concepto de promedio.

El concepto de promedio se vincula a la media aritmética, que consiste en el


resultado que se obtiene al generar una división con la sumatoria de diversas
cantidades por el dígito que las represente en total.

El promedio, por lo tanto, es un número finito que puede obtenerse a partir de la


sumatoria de diferentes valores dividida entre el número de sumandos.

Cantidad o valor que se logra sumando todos los valores de una serie de datos
cuantitativos que se divide a su vez entre el número o cantidad de sumados. Se lo
suele denominar también media aritmética.

Por ejemplo, de los siguiente número: 10, 23, 45, 67, 81, 23 y 75, el promedio
sería: (10+23+45+67+81+23+75)/7=46,28

b. Promedio aritmético para datos agrupados: repetidos y no repetidos.

Promedio aritmético para datos agrupados: Promedio aritmético (PA) o media


aritmética (MA): es el promedio o suma (S) de un conjunto finito de números
dividido entre el número de ellos (n).

PA = S / n

PA = a1 + a2 + a3 + ... an / n
Datos agrupados y no agrupados
 Los datos agrupados son los que se clasifican en categorías o clases, que
es el número de subconjuntos, tomando como criterio su frecuencia. Se
trata de hacer más fácil y de simplificar el manejo de grandes cantidades de
datos y poder así establecer cuáles son sus tendencias. Es recomendable
agruparlos si se trata de 20 o más elementos que tienen características
comunes y pueden ser organizados en categorías, de esta forma se puede
conseguir manejar mejor y analizar en forma más profunda.
Los datos agrupados se organizan en una tabla de frecuencia, siendo esta tabla el
número de veces que cada valor se repite en la serie de datos.
 Por su parte, los datos no agrupados constituyen el conjunto de datos que
no han sido clasificados y que son presentados en una tabla de datos en
forma individual, es decir que no forman parte de un conjunto. De manera
general constituye una cantidad de elementos que es menor a 30 con muy
poca o nula repetición.
Existen así las medidas de tendencia central para datos no agrupados, cuyos
datos se manejan en forma simple. Primero son recolectados los datos de la
población de estudio y estos son distribuidos en una tabla y analizados sin formar
clases, que son el número de subconjuntos en que se han agrupado los datos con
los mismos: cada dato mantiene su propia identidad luego de que se ha elaborado
la distribución de frecuencia.

Los datos agrupados son aquellos que están clasificados en función a un criterio,
mostrando una frecuencia para cada clase o grupo formado.

Los datos no agrupados es el conjunto de observaciones que se presentan en su


forma original tal y como fueron recolectados, para obtener información
directamente de ellos.

Los datos no agrupados es un conjunto de información si ningún orden que no nos


establece relación clara con lo que se pretende desarrollar a lo largo de un
problema, esto se soluciona mediante una tabulación que conduce a una tabla de
frecuencias.

La principal diferencia entre datos agrupados y no agrupados es que los primeros


han sido divididos por categorías, como habíamos mencionado. En cambio, los
datos no agrupados se presentan tal cual han sido recopilados, sin ninguna
modificación (quizás pueden ser ordenados, por ejemplo, de menor a mayor).
Entre las medidas de tendencia central para datos no agrupados más
utilizadas se encuentran:

La media o media aritmética


Esta es la primera de las medidas de tendencia central para datos no agrupados
de la que hablaremos. Está determinada por el valor en promedio de una serie de
conjunto de datos numéricos. Con esta medida, los cálculos se realizan a través
de la sumatoria de todos los valores que se encuentren divididos, es el punto
medio entre el valor máximo y valor mínimo de las cantidades existentes.

La media es el centro de toda la distribución, ya que en esta son representados los


valores observados; por ejemplo, si existe un grupo de personas que tienen una
estatura media de 1.60 metros, pues esta cantidad representa la estatura
promedio de todos, a pesar de que no es la estatura de ninguna de las personas
en forma particular.

La mediana o mediana aritmética


Esta es una de las medidas de tendencia central para datos no agrupados también
conocida como promedio aritmético: esta es el valor encontrado en el centro del
conjunto de los datos luego de haber sido ordenados.
Se le llama también media posicional, y no es relevante si los datos están
ordenados en forma ascendente o descendente; independientemente de ello, la
mediana corresponderá al mismo valor.

La moda
Es la tercera de las medidas de tendencia central para datos no agrupados. Esta
medida sirve para identificar cuando un dato aparece continuamente, como
también durante un periodo de tiempo determinado. Es en sí el dato que más
aparece en un grupo, también pudiendo existir dos modas, conociéndose así
como bimodal o, cuando hay más de dos modas recibe la denominación de
multimodal, que es cuando el máximo número de repeticiones se da para tres o
más números.

Para calcular la moda se deben escribir los números del conjunto y luego escribir
el número o los números que se repiten mayor cantidad de veces. En un conjunto
con los siguientes componentes: 4, 5, 8, 8, 7, 6, 8; la moda es el número 8 al ser el
número que se repite más.

Estas medidas de tendencia central para datos no agrupados te permitirán


analizar los datos de un conjunto.
c. Promedio aritmético ponderado.

El promedio ponderado o media aritmética ponderada es la medida de tendencia


central obtenida a partir de un conjunto de datos cuya relevancia o importancia
dentro del conjunto es relativa respecto de los demás.

Es decir, cuando tenemos una serie de datos que no poseen igual relevancia (es
decir, no poseen igual ponderación) dentro del conjunto, por lo que no es
adecuado obtener simplemente una media aritmética.
Así, para obtener un promedio ponderado debemos multiplicar cada dato por su
ponderación (o peso) y luego sumándolos (esto se denomina una suma
ponderada), para finalmente dividir la cifra obtenida entre la suma de los pesos o
ponderaciones. Fórmula de la media aritmética ponderada.

d. Propiedades del promedio aritmético.

 La suma de las desviaciones de todo el conjunto de datos de una


distribución respecto a la media de la misma es equivalente a cero. Esto es:

 La suma de los cuadrados de las desviaciones de los valores de la variable


con respecto a un número cualquiera se hace mínima cuando dicho número
coincide con la media aritmética. En otras palabras, lo siguiente siempre se
cumple:
 Si a todos los valores de la variable se les suma un mismo número, la
media aritmética de estos nuevos datos es a la media de los anteriores más
la misma cantidad que se le sumó a los datos. Esto es, suponiendo que
tenemos los datos X1, X2,…, XN con media X, ahora, si le sumamos a
todos los datos una cantidad a, X1 + a, X2 + a, …, XN + a, la media de
estos nuevos datos es:

 Si todos los valores de la variable se multiplican por un mismo número la


media aritmética queda multiplicada por dicho número. Esto es, suponiendo
que tenemos los datos X1, X2, …, XN con media X, ahora, si multiplicamos
a todos los datos por una cantidad a, X1 * a, X2 * a, ..., XN * a, la media de
estos nuevos datos es:

 La media de la multiplicación o suma de una constante por una variable X,


es equivalente al producto o suma de dicha constante por la media de la
variable dada. Es decir, si se efectúa un cambio de unidad de medida a los
datos (por ejemplo, de metros a centímetros), la media queda afectada por
dicho cambio de escala.

e. Media: Cuadrática, logarítmica, geométrica y armónica.


Media Cuadrática: La media cuadrática, se define como la raíz cuadrada de la
media aritmética de los elementos al cuadrado. La media cuadrática es
ampliamente utilizada para el cálculo de la media de un conjunto de números con
las alternancias de cantidades con valores positivos y negativos.
Se suele utilizar cuando el símbolo de la variable no es importante y lo que
interesa es el valor absoluto del elemento. Por ejemplo, para calcular la media de
errores de medida. Una aplicación clásica de la media cuadrática es la
determinación del valor eficaz de un parámetro sinusoidal en electricidad, en
corriente alterna (tensión en voltios o intensidad en amperios). Entonces,
aplicamos la fórmula de la media cuadrática:
Media logarítmica: El valor promedio de un conjunto de mediciones, calculado
mediante la obtención de los logaritmos de las mediciones, el cálculo del promedio
aritmético de los logaritmos y luego la obtención del antilogaritmo del promedio.
Ejemplo:
Coloque los dos números de los que obtendrá la media de una serie
escribiéndolos en orden secuencial. Por ejemplo, use 190 y 280, escritos en ese
orden.

Calcule el valor de los logaritmos naturales (ln) de los números usando una
calculadora o regla de cálculo. Escribe estos números abajo. En el ejemplo, ln
(190) = 5.25 y ln (280) = 5.63.

Calcula la diferencia de los dos números de los que deriva la media al restar uno,
llamado x, del otro, llamado y. El cálculo de la media de más de dos logaritmos
requerirá una fórmula diferente y una matemática superior, por lo que solo utilice
este método para obtener la media de dos logaritmos. Siguiendo el ejemplo
anterior, 280 - 190 = 90.

Reste un valor logarítmico, llamado ln x, del segundo, llamado ln y. Use la función


de registro en su calculadora, que puede realizar el proceso de resta en un paso, o
calcule el valor de log x e log y de forma individual y restar estos dos números
entre sí. Mantenga un registro del orden en que está restando los números.
Continuando con el ejemplo, 5.63 - 5.25 = 0.38

Divida la diferencia de x e y por la diferencia de ln x y ln y. Asegúrate de que x e y


estén en el mismo orden en el cociente y el denominador de la fracción. En el
problema de ejemplo, 90 / 0.38 = 236.84. La media logarítmica es 236.84.

Media geométrica: Se define la media geométrica como la raíz n-ésima de los


productos de todos los valores de la variable o bien como la raíz n-ésima de los
productos de los valores x elevadas a sus correspondientes frecuencias absolutas
fi. Donde n es el tamaño de la muestra.
La media geométrica se utiliza cuando los valores de la distribución de datos
cambian de forma multiplicativa, y no aditiva. Esto la hace ideal para promediar
datos de progresión geométrica, como razones, interés compuesto.
Presenta problemas de cálculo cuando los valores de la variable y sus frecuencias
conducen a que el radicando sea negativo y coincida que el tamaño de la muestra
es par. También en muchas ocasiones, los valores de la distribución nos impiden
poder efectuar los cálculos al exceder estos la capacidad de la calculadora. Por
ello, en ese caso se suele utilizar los logaritmos:

Y podemos observar que el logaritmo de la media geométrica es la media


aritmética de los logaritmos de los valores de la variable.
Suele utilizarse cuando los valores de la variable siguen una progresión
geométrica. También para promediar porcentajes, tasas, nº índice, etc., siempre
que nos vengan dados en porcentajes.

Media armónica: La media armónica es el recíproco de la media aritmética. Se


calcula como el número total de observaciones dividido por la suma de los
recíprocos. Se utiliza en situaciones en las que hay que promediar trayectos de
igual longitud con diferentes tiempos, así como para promediar múltiplos o
cocientes.

f. Mediana para datos agrupados: repetidos y no repetidos. Propiedades.


Mediana para datos no agrupados: La mediana para datos no agrupados
Cuando una serie de datos contiene uno o dos valores muy grandes o muy
pequeños, la media aritmética no es representativa. El valor central en tales
problemas puede ser mejor descrito usando una medida de tendencia central
llamada mediana.
La mediana (Me) es el punto medio de los valores de una serie de datos después
de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que
la mediana como posteriores en el arreglo de datos.
Mediana para datos agrupados: Cuando los datos se encuentran agrupados en
una distribución de frecuencia no conocemos los datos originales, por lo tanto es
necesario estimar la mediana mediante los siguientes pasos:
1. Calcular el valor n / 2
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo
mediano). Esto se hace encontrando el primer intervalo de clase donde la
frecuencia acumulada es igual o mayor que n / 2.

Propiedades:

g. Moda para datos agrupados: repetidos y no repetidos. Propiedades.


Moda para datos agrupados: Cuando tenemos los datos agrupados en forma de
intervalos realmente no sabemos cuántas veces está repetido cada dato,
solamente conocemos la frecuencia de cada intervalo.
Por lo tanto, para calcular la moda de unos datos agrupados en intervalos se debe
utilizar la siguiente fórmula:
Dónde:

 Li es el límite inferior del intervalo modal (intervalo con mayor frecuencia


absoluta).
 fi es la frecuencia absoluta del intervalo modal.
 fi-1 es la frecuencia absoluta del intervalo anterior al modal.
 fi+1 es la frecuencia absoluta del intervalo posterior al modal.
 Ai es la amplitud del intervalo modal.

Moda para datos no agrupados: Si ningún número se repite dentro del conjunto
de datos decimos que la moda no existe. Además, puede darse el caso de que
haya más de una moda. Esto pasa cuando más de un número se repiten la misma
cantidad de veces.

Las propiedades de la moda son las siguientes:

 Se puede hallar la moda tanto en variables cuantitativas como variables


cualitativas.
 Si aplicamos una transformación lineal a una variable aleatoria, el valor de
la media cambiará según las operaciones aplicadas.

 En general, la moda es insensible a valores atípicos (outliers).


 Si todos los valores tienen la misma frecuencia, no hay moda.

2. MEDIDAS DE DISPERSIÓN.
A la variabilidad que existe entre ellos, o dicho de otra forma, al grado en que los
valores de la variable estadística tienden a extenderse alrededor del centro o
promedio de la distribución.
Las medidas de dispersión indican el grado de concentración de los valores de la
variable alrededor de una medida de posición central, dando, a su vez, una idea
de la representatividad de esta medida de centralización como resumen global de
la variable.

Las medidas de dispersión por lo general se clasifican en cuatro categorías:


 Rango de variación: se trata de un número que indica la distancia entre un
valor máximo y uno mínimo. Dicho valor se toma de una población
estadística determinada y se calcula con base en diferentes factores.
 Varianza: esta medida representa la variación que puede sufrir un conjunto
de datos respecto a la media.
 Desviación estándar: corresponde a una desviación que es “habitual”
entre el valor y la media. Se trata de un evento más probable y por lo tanto
se emplea como tal en el cálculo de dispersión.
 Coeficiente de variación: Esta medida de dispersión se expresa como un
porcentaje que es el resultado de dividir la desviación típica sobre la media
del conjunto.
a. Concepto de desviación.
Es una medida de extensión o variabilidad en la estadística descriptiva. Se utiliza
para calcular la variación o dispersión en la que los puntos de datos individuales
difieren de la media.

Una desviación baja indica que los puntos de datos están muy cerca de la media,
mientras que una desviación alta muestra que los datos están dispersos en un
rango mayor de valores.

b. Propiedades de una buena medida de dispersión.

c. Rango o recorrido.
El Rango es la diferencia numérica entre el valor máximo y el valor mínimo; por
ello, comparte unidades con los datos. Permite obtener una idea de la dispersión
de los datos, cuanto mayor es el rango, aún más dispersos están los datos. El
rango, también es llamado amplitud o recorrido de medida.

d. Desviación media absoluta.

En estadística la desviación absoluta promedio o, sencillamente desviación media


o promedio de un conjunto de datos es la media de las desviaciones absolutas y
es un resumen de la dispersión estadística. Se expresa, de acuerdo a esta
fórmula:
e. Desviación media cuadrática.
La desviación cuadrática media es la raíz cuadrada de la varianza, es decir, de la
media aritmética de los cuadrados de las desviaciones respecto a la media.

La codificación de esta función es similar a la función miembro desviación Media.

f. Varianza. Propiedades.

g. Desviación típica. Propiedades.


Es la desviación media de una variable respecto de su media aritmética,
adquiriendo siempre unos valores que son iguales o mayores que 0.
Existen dos fórmulas para calcular la desviación típica. Son las siguientes:

1.- La raíz cuadrada de la varianza: en este caso, hemos de realizar la raíz


cuadrada de la fórmula de la varianza para poder calcular la desviación típica, es
decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de la
desviación.
2.- La suma de las desviaciones y dividir entre el total de observaciones: esta
segunda fórmula es más intuitiva, de forma que se ha de realizar la suma de todas
las desviaciones en valor absoluto y, a continuación, dividir entre el total de
observaciones.
h. Cuantiles: Cuartil, Decíl, y Percentíl.
Cuantiles: Es donde una muestra se divide en subgrupos adyacentes del mismo
tamaño (es por eso que a veces se le llama » fráctil «). También puede referirse a
dividir una distribución de probabilidad en áreas de igual probabilidad.
Los cuantiles son estadísticos de localización que sirven para estudiar o analizar lo
que sucede con algún porcentaje de datos en particular, cuando se han ordenado
previamente los datos. Los cuantiles se dividen en Cuartiles, deciles y percentiles;
y se calculan teniendo en cuenta también, las tres formas en que se presentan los
datos.
Cuartil: Son los 3 valores de la variable que dividen a un conjunto de datos
ordenados en 4 partes iguales. Q1 son los datos menores, Q2 se corresponde con
la mediana (Me) que es un estadístico de posición que divide la distribución de los
datos a la mitad, y Q3 los datos mayores, todos determinan los valores
correspondientes al 25%, al 50% y al 75% de los datos.
Decíl: Son los 9 valores que dividen la serie de datos en 10 partes iguales. Los
deciles dan los valores correspondientes al 10%, 20%… y al 90% de los datos. D5
coincide con la mediana.
Percentíl: Son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, 2%... y al 99% de los
datos. P50 coincide con la mediana.
i. Desviación cuartílica.

Es una medida de dispersión que indica el rango entre la mitad de los datos
centrales. En concreto, la desviación cuartil es igual a la diferencia entre el tercer
cuartil y el primer cuartil dividido por dos.

La desviación cuartil suele representarse con el símbolo QD

La interpretación del valor de la desviación cuartil es fácil: cuanto mayor sea la


desviación cuartil, significa que los datos centrales están más separados entre sí.
En general, nos interesa que los datos estén concentrados, por lo que se debe
intentar minimizar la desviación cuartil.
La desviación cuartil es igual a la diferencia entre el tercer cuartil y el primer cuartil
partido por dos. Por lo tanto, para calcular la desviación cuartil primero se debe
determinar el primer y el tercer cuartil, luego restarlos y, por último, dividir entre
dos.

De modo que la fórmula para calcular la desviación cuartil es la siguiente:

j. Rango semi-cuartílico.
Es la mitad de la diferencia entre el primer y el tercer cuartil. Por lo tanto, para
calcular el rango semi-intercuartil se debe restar el tercer cuartil menos el primer
cuartil y luego dividir entre dos.

El rango semi-intercuartil es una medida de dispersión que indica la variabilidad de


los valores centrales. Así pues, cuanto mayor sea el rango semi-intercuartil de un
conjunto de datos, significa que los valores del centro están más dispersos entre
sí.
Una de las características del rango semi-intercuartil es que es un parámetro
estadístico robusto, de manera que las observaciones atípicas no afectan al rango
semi-intercuartil.

Así pues, el rango semi-intercuartil es una medida de dispersión similar al rango


estadístico, ya que indica la variabilidad de un conjunto de datos haciendo la resta
de dos valores cuartílicos. No obstante, el rango estadístico se calcula de manera
ligeramente diferente.

El rango semi-intercuartil es igual a la diferencia entre el tercer cuartil y el primer


cuartil partido por dos. Por lo tanto, para calcular el rango semi-intercuartil primero
se deben hallar el primer y el tercer cuartil, luego restarlos y, finalmente, dividir el
resultado de la resta entre dos.

Así pues, la fórmula para calcular el rango semi-intercuartil es la siguiente:

3. Forma de distribución.
Son parte de las funciones de probabilidad que aparecen con mayor frecuencia
cuando se realiza algún estudio estadístico.
 Distribución uniforme: continua. Todos los valores tienen la misma
posibilidad.

 Distribución Bernoulli: discreta. Dos posibles soluciones. Por ejemplo:


echar una moneda al aire.
 Distribución Exponencial: continua. Tiempo medio entre ocurrencia de
eventos de una distribución de Bernoulli.

 Distribución Binomial: discreta. Generalización de Bernoulli. Por ejemplo:


tirar varias monedas al aire.

 Distribución Poisson: discreta. Generalización de Binomial cuando hay


infinitos eventos de probabilidad muy baja.
 Distribución Gaussiana: continua. Es la distribución más usada, toda
combinación de variables aleatorias tiende a una gaussiana.

 Distribución Chi cuadrado: continua. Es el cuadrado de una distribución


gaussiana.

k. Coeficiente de asimetría.
Es un coeficiente que permite calcular la asimetría de una distribución. Es decir, el
coeficiente de asimetría sirve para determinar si una función es asimétrica
positiva, asimétrica negativa o simétrica.

El coeficiente de asimetría también se puede llamar índice de asimetría.


Así pues, los diferentes tipos de asimetría son:

 Asimetría positiva: la distribución tiene más valores diferentes a la


derecha de la media que a su izquierda.
 Asimetría negativa: la distribución tiene más valores diferentes a la
izquierda de la media que a su derecha.
 Simetría: la distribución tiene el mismo número de valores a la izquierda
que a la derecha de la media.

Principalmente, se utilizan tres tipos de coeficientes de asimetría según el caso: el


coeficiente de Fisher, el coeficiente de Pearson y el coeficiente de Bowley. A
continuación se explica detalladamente cómo calcular cada tipo de coeficiente de
asimetría.
l. Coeficiente de Kurtósis.

También llamada apuntamiento, es una medida estadística que indica o analiza el


grado de concentración que presenta los valores alrededor de la zona central en
una distribución alrededor de su media.
Es decir, la curtosis muestra si una distribución es escarpada o achatada. En
concreto, cuanto mayor sea la curtosis de una distribución más escarpada (o
apuntada) es.
Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor


de los valores centrales de la variable (el mismo que presenta una distribución
normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor


de los valores centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor


de los valores centrales de la variable.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy