Investigacion de Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 30

Concepto e importancia de las medidas de tendencia central.

Las medidas de tendencia central son parámetros estadísticos que informan


sobre el centro de la distribución de la muestra o población estadística.

A veces, tratamos con una gran cantidad información. Variables que presentan
muchos datos y muy dispares. Datos con muchos decimales, de diferente signo o
longitud. En estos casos, siempre es preferible calcular medidas que nos ofrezcan
información resumida sobre dicha variable. Por ejemplo, medidas que nos
indiquen cuál es el valor que más se repite.

Sin perjuicio de lo anterior, no hay que irse tan lejos. Si miramos la siguiente tabla
que muestra el salario que cobra cada uno de los trabajadores de una empresa
que fabrica cajas de cartón, tendremos lo siguiente:

Trabajador Salario

1  €          1.235

2  €          1.002

3  €             859

4  €             486

5  €          1.536

6  €          1.248

7  €          1.621

8  €             978
9  €          1.125

10  €             768

Alguien podría preguntarse, ¿cuánto gana el trabajador promedio de esta


empresa? En ese caso las medidas de tendencia central nos podrían ayudar.
Concretamente, la media. Sin embargo, a priori, lo único que sabemos es que el
número estará entre el mínimo y el máximo.

Medidas de tendencia central


Entre las medidas de tendencia central podemos encontrarnos con las siguientes:

Media

La media es el valor promedio de un conjunto de datos numéricos, calculada


como la suma del conjunto de valores dividida entre el número total de valores. A
continuación se muestra la fórmula de la media aritmética:

Formula
media aritmetica
Consultar explicación y ejemplo de la media
Como se explica en el artículo enlazado anteriormente, existen muchos tipos de
media. La elección de cada tipo de media tiene que ver, principalmente con el tipo
de dato sobre el que se calcula.

Mediana

La mediana es un estadístico de posición central que parte la distribución en dos,


es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas
propuestas no nos darán el valor de la mediana, lo que nos darán será la posición
en la que está dentro del conjunto de datos. Las fórmulas que indica la posición de
la mediana en la serie son las siguientes:
 Cuando el número de observaciones es par:

Mediana = (n+1) / 2 → Media de las posiciones observaciones

 Cuando el número de observaciones es impar:

Mediana = (n+1) / 2 → Valor de la observación

Consultar explicación y ejemplo de la mediana

Moda

La moda es el valor que más se repite en una muestra estadística o población. No


tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las
repeticiones de cada valor. Por ejemplo, ¿cuál es la moda de la siguiente tabla de
salarios?

Trabajador Salario

1  €          1.236

2  €          1.236

3  €             859

4  €             486

5  €          1.536

6  €          1.536

7  €          1.621
8  €             978

9  €          1.236

10  €             768

La moda sería 1.236€. Si vemos los salarios de los 10 trabajadores, veríamos que
1.236€ se repite en tres ocasiones.

Crítica a las medidas de tendencia central


Las medidas de posición central son una ayuda en forma de resumen pero no son
categóricas. Como resumen pueden darnos una información de lo que, en
promedio, cabría esperar. Pero no siempre son precisas.

Para analizar mejor estas medidas, es recomendable combinar las medidas de


tendencia central con medidas de dispersión. Las medidas de dispersión tampoco
son infalibles, pero nos ofrecen información sobre la variabilidad de una
determinada variable. Así, supongamos siguiendo el ejemplo de los salarios, que
existen dos empresas A y B. En la empresa A el salario medio es de 3.100 USD,
mientras que la empresa B es de 3.100 USD también. Esto podría hacernos caer
en el error de que los salarios son iguales o muy similares. Pero no es
necesariamente así.

Puede ocurrir que la empresa A presente una desviación estándar de 400 dólares,
mientras la empresa B tenga una desviación estándar de 1.000 dólares. Esto nos
indica que existe mayor desigualdad, por la razón que sea, en los salarios de la
empresa B que en los de la empresa A

SEGÚN WIKIPEDIA

La medida de tendencia central, parámetro de tendencia central o medida de


centralización es un número situado hacia el centro de la distribución de los valores de una
serie de observaciones (medidas), computado para.Cuando se hace referencia únicamente a
la posición de estos parámetros dentro de la distribución, independientemente de que esté
más o menos centrada, se habla de estas medidas como medidas de posición.1 En este
caso se incluyen también los cuantiles entre estas medidas.

Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo
que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de
variable que se está observando, en este caso se observan variables cuantitativas.
Tipos de promedios: matemáticos y estadísticos.

La media aritmética es la más conocida. Existen otros tipos de


promedios como medida de posición central, que según el tipo de datos
será un indicador más representativo o indicado que la media aritmética.
 Media geométrica: se calcula sobre un conjunto de
números estrictamente positivos. Es la raíz N-ésima del producto de
los N elementos. Está indicada para calcular medias de porcentajes,
tantos por uno, puntuaciones o índices. Tiene la ventaja de que no es
tan sensible a los valores extremos.
 Media armónica: es el recíproco de la suma de los recíprocos
(donde 1/X  es el recíproco de X )) multiplicado por el número de
i i

elementos del conjunto. Suele utilizarse principalmente para calcular


la media de velocidades, tiempos o en electrónica.
 Media cuadrática: se define como la raíz cuadrada del promedio de
los elementos al cuadrado. La media cuadrática es muy útil para
variables que toman valores negativos y positivos y su signo no es
importante e interesa el valor absoluto del elemento. Por ejemplo,
los errores de medida, el valor eficaz de un parámetro sinusoidal en
electricidad, etc.
 Media ponderada: consiste en otorgar a cada observación del
conjunto de datos unos pesos según la importancia de cada elemento.
Tiene numerosas aplicaciones, como el cálculo del IPC (Índice de
Precios de Consumo), calcular la nota media de una
asignatura ponderando exámenes, trabajos, etc.
Rel

CALCULO DE MEDIDAS DE DISPERSION PARA SERIES SIMPLES Y


AGRUPADAS

Cálculo a partir de series simples y agrupadas de las medidas de dispersión


 Las Medidas de Dispersión 

FORMULARIO

RANGO

VARIANZA

Recuerde que la formula de la Media para datos agrupados es


OTRA FUENTE DE INFORMACION =>
https://www.hiru.eus/es/matematicas/medidas-de-dispersion

Medidas De Dispersión
Las medidas de tendencia central ofrecen una idea aproximada del comportamiento de una serie
estadística. No obstante, no resultan suficientes para expresar sus características: una misma media
puede provenir de valores cercanos a la misma o resultar de la confluencia de datos estadísticos
enormemente dispares. Para conocer en que grado las medidas de tendencia central son representativas
de la serie, se han de complementar con medidas de dispersión como la varianza o la desviación típica.

Concentración y dispersión
Las medidas de centralización ayudan a determinar el «centro de gravedad» de una distribución
estadística. Para describir el comportamiento general de la serie se necesita, sin embargo, una
información complementaria para saber si los datos están dispersos o agrupados.
Así, las medidas de dispersión pueden definirse como los valores numéricos cuyo objeto es analizar el
grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia
central consideradas.
Las medidas de dispersión son de dos tipos:
 Medidas de dispersión absoluta: como recorrido, desviación media, varianza y desviación
típica, que se usan en los análisis estadísticos generales.
 Medidas de dispersión relativa: que determinan la dispersión de la distribución estadística
independientemente de las unidades en que se exprese la variable. Se trata de parámetros más
técnicos y utilizados en estudios específicos, y entre ellas se encuentran los coeficientes de apertura,
el recorrido relativo, el coeficiente de variación (índice de dispersión de Pearson) y el índice de
dispersión mediana.

La distribución normal, o campana de Gauss, es una función simétrica (con la media aritmética en el
centro de la serie) con un grado de dispersión bajo (la mayoría de los valores están comprendidos dentro
del valor de la desviación típica ).

Recorrido
La medida de dispersión más inmediata es el recorrido de la distribución estadística, también
llamado rango o amplitud. Dada una serie de valores x 1, x2, ..., xn, su recorrido es la diferencia
aritmética entre el máximo y el mínimo de estos valores:

Desviación media
Como medida de dispersión más frecuentemente utilizada, la desviación media se define como la media
aritmética de los valores absolutos de la desviación de cada valor de la variable con respecto a la media.
Su formulación matemática es la siguiente:

Varianza y desviación típica


La desviación media no siempre suministra una idea clara del grado de separación entre los valores de
una variable estadística. Para estudios científicos, se prefiere utilizar una pareja de parámetros
relacionados que se conocen como varianza y desviación típica.
La varianza se define como el cociente entre la suma de los cuadrados de las desviaciones de los valores
de la variable y el número de datos del estudio. Matemáticamente, se expresa como:

Por su parte, la desviación típica, simbolizada por , se define sencillamente como la raíz cuadrada de la
varianza:

Por lo tanto, se tiene que:

La varianza y la desviación típica, cada una con su respectivo valor, se usan indistintamente en los
estudios estadísticos.
DESVIACIÓN ESTÁNDAR

  o en este caso, la formula se puede expresar así

la cual se puede emplear cuando ya se tiene el valor numérico de


la Varianza.

COEFICIENTE DE VARIACIÓN
EJERCICIOS RESUELTOS

  Los datos ordenados que se dan, representan las percepciones


salariales diarias, de empleados en una empresa

Calcule para esta tabla el Rango, la Varianza, la Desviación Estándar y el


coeficiente de Variación.

CALCULO DEL RANGO


  Para calcular el Rango, se requiere incluir los Limites Reales de Clase.
Para lograrlo se emplean las formulas que se utilizaron en la sección
llamada ORDENAMIENTO DE DATOS, a saber
  Observe que la Unidad de Variación es igual a 5, la cual se
calcula restando el LNI de la Clase 1(95) al LNS de la Clase 2(100).
  Para el calculo de los Limites Reales restamos y sumamos la mitad de
la unidad de variación, o sea, 2.5, respectivamente como indican las
formulas anteriores. La tabla quedaría

 el LRSMAX  es igual a 177.5 y el LRIMIN es igual a 77.5, entonces el


Rango es de

R = 177.5 -77.5 =100

CALCULO DE LA VARIANZA

  Para calcular la Varianza es necesario determinar primero la media, la


cual se obtiene en función del producto de las Marcas de Clase y las
Frecuencias Absolutas en cada clase, como se vio en la sección anterior,
por lo cual es necesario complementar la TDF con esta columna.
Realizando el calculo respectivo, la tabla quedaría
en esta tabla se observa que la suma de los productos de
MC*Fabs=39,550, y ademas que N=340.  Sustituyendo los valores en la
formula de la Media 

quedaría

Ahora, si observamos el numerador en la formula de la Varianza

nos daremos cuenta que debemos incluir nuevas columnas a la TDF, que
muestren cada una de las diferencias entre cada marca de clase y la
media (MCI - Media) y también que muestren esta diferencia elevada al
cuadrado y multiplicada por cada Frecuencia Absoluta. Enseguida se
incluyen
Sustituyendo en la formula de la Varianza los datos obtenidos

DESVIACIÓN ESTÁNDAR

  La Desviación Desandar se calcula como la raíz cuadrada


de la Varianza.
COEFICIENTE DE VARIACIÓN

y el Coeficiente de Variación es

PROBLEMAS PARA EXAMEN

Calcule el Rango, Varianza, Desviación Estándar y Coeficiente


de Variación para:
Solución
  Para la Tabla 1: Media=    193.65      
                            Varianza=10,628.80
                  Desv. Estándar=103.09
    Coeficiente de Variación=53.24%

  Para la Tabla 2: Media=166.98


                        Varianza=3600.61
      Desviación Estándar=60.60.01
Coeficiente de Variación=35.93%

Medidas de posición.
2. Medidas de Posición
Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de
frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra
en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas de
Tendencia Central ".
Pero estas medidas de posición de una distribución de frecuencias han de cumplir
determinadas condiciones para que lean verdaderamente representativas de la variable a la que
resumen. Toda síntesis de una distribución se considerara como operativa si intervienen en su
determinación todos y cada uno de los valores de la distribución, siendo única para cada
distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación se
describen las medidas de posición más comunes utilizadas en estadística, como lo son:
 Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero,
segundo y tecer cuartil.
 Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
 Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero
al noventa y nueve percentil).

Cuartiles (Q1, Q2, Q3)


a. Aquel valor de una serie que supera al 25% de los datos y es superado por el 75%
restante.
Formula de Q1 para series de Datos Agrupados en Clase.

Donde:

: posición de Q1, la cual se localiza en la primera frecuencia acumulada que la


contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada.
Li, faa, fi, Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de
la posición correspondiente.
b. Primer cuartil (Q1):
c. Segundo cuartil (Q2):

Coincide, es idéntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado
por el 50% de los valores de una Serie.
c) Tercer cuartil (Q3):
Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes
de la Serie.
Formula de Q3 para series de Datos Agrupados en Clase.

Donde:

: posición de Q3, todo idéntico al calculo de la Mediana.


Deciles (D1, D2, … D9)
Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9).
El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado
por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es
superado por el 90% restante),
El D9 (noveno decil) supera al 90% y es superado por el 10% restante.
 Como se observa, son formulas parecidas a la del calculo de la Mediana, cambiando
solamente la respectivas posiciones de las medidas.

Percentiles (P1, P2, … P99)


Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99).
El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve
por ciento restante.
Formulas de P1, P50, P99 para series de Datos Agrupados en Clase.

El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1%
restante.
 Idénticas formulas al calculo de la Mediana, cambiando obviamente las
correspondientes posiciones de cada medida.

Para determinar estas medidas se aplicara el principio de la mediana; así, el primer cuartil
cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tecer cuartil
se encuentra el 75 por ciento; el 80 decil será el valor por encima del cual estará el 20 por
ciento de los datos, etc.
Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el
primer cuartil no es sino el 25° percentil, el tercer cuartil el 75° percentil, el cuarto decil el 40°
percentil, etc.
Datos no agrupados:
Se hace difícil calcular estas medidas, sin embargo, siguiendo los
mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente:
Si tenemos una serie de valores X1, X2, X3 … Xn, se localiza el primer cuartil como el

valor  cuando n es par, y  cuando n es impar. Para el tercer cuartil

será  (n par);  (n impar).

En caso de los textiles será  o  donde A representa el número del textil.

Para los deciles será  o  siendo A el número del decil; y para los

percentiles  o  .
Ejemplo:
En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.

Esto significa que el 4° textil se encuentra localizado en el termino numero 21, es decir, el que
ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino numero 25° y 26° ; y
el 95° percentil entre la posición 30° y 31° .
Calculo para una distribución de frecuencia
Para el calculo de esta medida en datos agrupados en una distribución de frecuencia, se utiliza
el mismo procedimiento estudiado para el calculo de la Mediana, e; cual es:
1. Se efectúa la columna de las frecuencias acumuladas.
2. Se determina la posición del término cuyo valor se pretende calcular, en caso de ser el

primer cuartil será  , si fuese el 95° centil  … etc.


3. Se verifica cual es la clase que lo contiene; para ello se utiliza la columna de las
frecuencias acumuladas.
4. Se hace la diferencia entre el número que representa el orden de posición cuyo valor se
pretende calcular y la frecuencia acumulada de la clase anterior a la que lo contiene.
5. Se calcula la medida solicitada de acuerdo a la siguiente fórmula:

Donde:
1i: limite inferior de la clase que lo contiene.
P: valor que representa la posición de la medida.
fi: la frecuencia de la clase que contiene la medida solicitada.
fa-1: frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic: intervalo de clase.
Ejemplo:
Determinación del primer cuartil, el cuartil textil, el séptimo decil y el 30° percentil.

Salarios N° de empleados fa

(I. de Clases) (fi)

200 – 299 85 85

300 – 399 90 175

400 – 499 120 295

500 – 599 70 365

600 – 699 62 427

700 – 800 36 463

 
 

Estos resultados nos indican que el 25 por ciento de los empleados ganan salarios por debajo
de Bs. 334; que sobre Bs. 519,51 ganan el 33,33 por ciento de los empleados; que bajo 541,57
gana el 57 por ciento de los empleados y sobre Bs. 359,88 gana el 70 por ciento de los
empleados.
Muchas veces necesitamos conocer el porcentaje de valores que esta por debajo o por encima
de un valor dado; lo que representa un problema contrario al anterior, esto es, dado un cierto
valor en la abscisa determinar en la ordenada el tanto por ciento de valores inferiores y
superiores al valor dado. Operación que se resuelve utilizando la siguiente formula general:

Donde:
P: lugar percentil que se busca.
P: valor reconocido en la escala X.
fa-1: frecuencia acumulada de la clase anterior a la clase en que esta incluida P.
fi: frecuencia de la clase que contiene a p.
Li: limite inferior de la clase que contiene a P.
Ic: intervalo de clase.
N: frecuencia total.
Ejemplo:
Utilizando la distribución anterior, determinar que porcentaje de personas ganan salarios
inferiores a Bs. 450,00

El 50,75 por ciento de las personas ganan salarios inferiores a Bs. 450.
Método gráfico para fraccionar la distribución
Se pueden obtener en forma gráfica, a través de la curva de la frecuencia acumulada (ojiva).
Para ello basta después de trazar la ojiva, llevar el orden de posición de la medida que se quiere
sobre la ordenada, trazar por ese punto una perpendicular toca a la ojiva, baja una paralela a la
ordenada hasta tocar la abscisa; en el punto donde toque a dicho eje, se encontrará el valor
buscado.
Obtención gráfica de las medidas de posición
Similar o idéntico a la distribución grafica de la Mediana con la sola excepción de que se
llevaría al eje vertical (frecuencias acumuladas) las especificas posiciones de cada indicador de
posición en particular.
Ejemplo:
Forma de obtener los indicadores de posición (cuartiles, deciles y percentiles) para series de
datos agrupados en clases:
Supongamos la siguiente distribución de frecuencias referidas a las estaturas que
representaban 40 alumnos de un curso.

(I. de Clases) Estaturas N° alumnos fa

(mts) (fi)

1,60 1,639 5 5

1,64 1,679 8 13

** 1,68 1,719 15 ** 28

* 1,72 1,759 10 38 *

1,76 1,80 2 40

Q3=?

La cual se ubica en la primera fa que la contenga


Esta estatura de Q3 = 1,73 mts. Supera en la distribución de frecuencia al 75% de los alumnos
del curso y es superada por el 25% de los mismos.
D8 = ?

supera esta estatura de 1,736 mts a 8/10 partes de curso y es superado por las 2/10 partes
restantes.
P55 = ?

Esta estatura supera al 55% de los alumnos del curso y es superada por el 45% restante.
Calcular de cada uno de los intervalos de clases cuartiles, deciles y percentiles.
Datos agrupados

I. de clases fi fa

10 – 15 10 10

16 – 21 18 28
22 – 27 10 38

28 – 33 8 46

34 – 39 9 55

40 – 45 7 62

46 – 51 3 65

52 – 57 1 66

n = 66
Cuartiles:



Deciles:



Percentiles:



3. Conclusión
Las medidas de posición en un conjunto de datos están diseñadas para proporcionar al analista
algunas medidas cuantitativas de donde está el centro de los datos en una muestra.
En las medidas de posición se trata de encontrar medidas que sinteticen las distribuciones de
frecuencias. En vez de manejar todos los datos sobre las variables, tarea que puede ser pesada,
podemos caracterizar su distribución de frecuencias mediante algunos valores numéricos,
eligiendo como resumen de los datos un valor central alrededor del cual se encuentran
distribuidos los valores de la variable. La descripción de un conjunto de datos, incluye como un
elemento de importancia la ubicación de éstos dentro de un contexto de valores posibles.
4. Bibliografía
Armando, Soto Negrin. Principios de Estadística. Editorial Panapo. 1999. Pág.: 71-81.
Ernesto, Rivas González. Estadística General. Ediciones de la Biblioteca. Caracas. 2000. Pág.:
164-169.
 

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy