Guia Unidad 3 y 4

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD NACIONAL EXPERIMENTAL


SIMÓN RODRÍGUEZ
NUCLEO PALO VERDE

MATERIA: TERMINOLOGÍA EN ESTADISTICA E INVESTIGACIÓN. (COD. 31022)


PERIODO INTENSIVO 2017-III
FACILITADOR: LIC. JOSÉ AVILA

GUIA UNIDAD TRES


Y CUATRO.

AGOSTO 2017

I. MEDIDAS DE POSICIÓN.
INTRODUCCIÓN.
Después que los datos han sido reunidos y tabulados, se inicia el análisis con el
fin de calcular un número único, que represente o resuma todos los datos. Las
medidas de posición forman parte del conjunto de medidas descriptivas
numéricas, las cuales se clasifican en parámetros –cuando se calculan a partir de
la población total- y los estadígrafos - cuando se calculan a partir de los datos de
una muestra. Una medida de posición es un número que se toma como
orientación para referirnos a un conjunto de datos.
Uno de los problemas fundamentales que presenta un análisis estadístico, es el de
buscar el valor más representativo de una serie de valores. El primer paso que hay
que realizar para que se entienda una larga serie de valores u observaciones, es
el de resumir los datos en una distribución de frecuencia; esto no es suficiente
para fines practico, puesto que a menudo es necesario una sola medida
descriptiva, y en especial cuando se requiere comparar dos o más serie
estadísticas. Es necesario continuar el proceso de reducción hasta sustituir todos
los valores observados por uno solo que sea representativo, de tal forma que
permita una interpretación global del fenómeno en estudio; para que ese valor sea
representativo debe reflejar la tendencia de los datos individuales de la serie de
valores. Un valor o dato de la serie con estas características recibe el nombre de
promedio, media o medida de posición, esto es debido a su ubicación en la zona
central de la distribución. Las medidas de posición son de gran importancia en el
resumen estadístico, ya que representan un gran número de valores individuales
por uno solo.
El valor más representativo de un conjunto de datos por lo general no es el valor
más pequeño ni el más grande, es un número cuyo valor se encuentra en un
punto intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia
un valor referido que representará la medida de posición de la serie de valores.
Las medidas de posición se emplean con frecuencia como mecanismo para
resumir un gran número de datos o cantidades con la finalidad de obtener un valor
que sea representativo de la serie.
Las Principales Medidas de Posición son:
La Media Aritmética, Mediana, Moda, los cuartiles, Deciles y Percentiles.
Todas ellas a su manera tratan de dar una idea del número alrededor del cual se
centra a todo el conjunto de datos.

CARACTERÍSTICAS DE LAS MEDIDAS DE POSICIÓN.


• Deben ser definidas rigurosamente y no ser susceptibles de diversas
interpretaciones.
• Deben depender de todas las observaciones de la serie, de lo contrario no
sería una característica de la distribución.
• No deben tener un carácter matemático demasiado abstracto.
• Deben ser susceptibles de cálculo algebraico, rápido y fácil.
MEDIA ARITMÉTICA.
La media aritmética o simplemente la media es la medida de posición de más
importancia y utilización en las aplicaciones estadísticas por su fácil cálculo e
interpretación. Se trata del valor medio de todos los valores que toma la variable
estadística de una serie de datos. La media es el valor más representativo de la
serie de valores, es el punto de equilibrio, el centro de gravedad de la serie de
datos. Por lo general se le designa con

La media aritmética de una serie de n valores de una variable X1, X2, X3;
X4,.........Xn, es el cociente de dividir la sumatoria de todos los valores que toma la
variable Xi, entre el número total de ellos. La fórmula se puede expresar así:

Desviaciones o desvíos.- Son diferencias algebraicas entre cada valor de la serie


o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera
tomado arbitrariamente. Los desvíos o desviación se designan con la letra di.
Dado una serie de valores X1, X2, X3, .......Xn , se llama desvío a la diferencia entre
un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el
valor indicado k de la serie corresponde precisamente a la media aritmética de
esos valores dados, se dice entonces que los desvíos son con respecto a la media
aritmética. En símbolo:

PROPIEDADES DE LA MEDIA ARITMÉTICA.


1. La suma de las desviaciones con respecto a la media aritmética es igual a cero.

2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a


la media aritmética es menor que la suma de las desviaciones al cuadrado de
los diversos valores con respecto a cualquier punto K, que no sea la media
aritmética.

3. La media aritmética total o conjunta de dos o más serie de datos, se puede


calcular en función de las medias aritméticas parciales y del número de datos
de cada una de ellas, mediante la siguiente formula:

Donde:
en esta n1, n2, n3 y nk es el número de datos de cada
serie.

Además,

son las medias de cada una de las series.

4. La media del producto de una constante por una variable, es igual al producto
de la constante por la media de la variable.

5. La media de la suma de una constante más una variable, es igual a la media de


la variable más la constante.

De la misma forma se cumple esta propiedad para la resta.

CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA.


• El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la
serie de datos.

• La media se calcula con facilidad y es única para cada caso y permite


representar mediante un solo valor la posición de la serie de valores.

• La media es una medida de posición que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.

CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS.


Para calcular la media de datos no agrupados en clases se aplica la siguiente
formula:
En donde n es el número total de datos y son los valores de la variable.

CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS


Cuando se trabaja con la distribución de frecuencia agrupada, se parte del
supuesto de que todos los datos comprendidos en un intervalo de clase se
distribuyen uniformemente a lo largo de este, entonces se puede tomar la marca
de clase o punto medio () del intervalo como adecuada representación de los
valores que conforman el mencionado intervalo. Para calcular la media en estas
condiciones se pueden utilizar tres métodos: El método directo o largo y dos
métodos abreviados. En este curso utilizaremos el primer método.

MÉTODO DIRECTO
Este método se le conoce también como método largo; el mismo resulta
demasiado engorroso cuando las magnitudes de los puntos medios o de las
frecuencias de clase son muy grandes, debido a que los cálculos son demasiados
extensos. Los pasos a seguir para calcular la media con este método son los
siguientes:

1. Se agrupan los datos en clases y se llevan a una columna, se calculan los


puntos medios de cada clase y se colocan en sus respectivas columnas, se
determinan las frecuencias de cada clase y se ubican en sus respectivas
columnas.

2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto
medio (X) así:

3. Luego se calcula la media aritmética aplicando la fórmula:


Donde n es igual al número total de datos.

Ejemplo:

Calcule la media de la siguiente distribución de frecuencia correspondiente al peso


en Kg. de un grupo de obreros. Realice los cálculos respectivos para completar el
siguiente cuadro.

Solución:
LA MEDIANA
La mediana es el valor que divide en dos partes iguales, al conjunto de
observaciones ordenadas respecto de sus magnitudes, de tal manera que el
número de datos por encima de la mediana sea igual al número de datos por
debajo de la misma. Se designa por las letras Me. Tal como sucede con la media,
el método de determinación depende de si los datos son agrupados o no.

CÁLCULO DE LA MEDIANA PARA DATOS NO


AGRUPADOS (Discretos).
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se
hace es ordenar los datos en una forma creciente o decreciente y luego se ubica
la posición que esta ocupa en esa serie de datos; para ello hay que determinar si
la serie de datos es par o impar.

Si el número n es impar, entonces la posición de la mediana se determina por la


fórmula:

Luego el número que se obtiene indica el lugar o posición que ocupa la mediana
en la serie de valores, luego la mediana será el número que ocupe el lugar de lo
posición encontrada.

Si n es par, se aplica la formula


El resultado obtenido, es la posición que ocupara la mediana, pero en este caso
se ubica la posición de la mediana por ambos extremos de la serie de valores y los
dos valores que se obtengan se le saca la media y esta será la mediana buscada,
por lo tanto la mediana, en este caso, es un número que no se encuentra dentro
de la serie de datos dados.

Ejemplos:

Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un grupo
de trabajadores. Determine la mediana.

Lo primero que se hace es ordenar los datos en forma creciente o decreciente;


Los datos ordenados quedaran así: 5, 6, 7, 8, 9, 10, 12.

Luego, como se trata de un número impar de datos (n=7), se aplica la fórmula:

Para ubicar la posición de la mediana. Esto indica que la mediana ocupa la


posición 4, que en la serie de valores esa posición corresponde al número 8,
entonces, Me = 8.

Tomemos ahora los datos: 5, 5, 7, 9, 11, 12, 15, 18. Como se trata de un número
par de datos (n =8), la mediana está dada por:

Cuando los valores de un conjunto de datos se agrupan en una distribución de


frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana
obtenida de una distribución de frecuencia de datos puede no ser la misma que la
mediana obtenida de los datos sin arreglar en clases, pero el resultado será una
aproximación. Cuando se trata de datos agrupados, la mediana se obtiene
mediante el método de interpolación. La interpolación parte del supuesto de que
los datos de cada intervalo de la distribución están igualmente distribuidos.
PASOS PARA DETERMINAR LA MEDIANA EN DATOS
AGRUPADOS.
1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de
clases, se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de
esa distribución.

2. Se determina la ubicación o posición de la mediana en el intervalo de la


distribución de frecuencia, mediante la fórmula:

El resultado obtenido determinará la clase donde se encuentra ubicada la


mediana, lo cual se conseguirá en la clase donde la frecuencia acumulada Fi sea
igual o superior a este resultado. Luego se aplica la fórmula:

Ejemplo:
Dada la siguiente distribución de frecuencia referida a las horas extras laboradas
por un grupo de obreros. Calcule la mediana. Realice los cálculos respectivos para
completar el siguiente cuadro.

N° de horas Obreros
Extras

55---59 6
60---64 20
65---69 18
70---74 50
75---79 17
80---84 16
85---89 5
n=132
Solución:

Luego se busca en la frecuencia acumulada Fi, un valor que sea


igual o superior a 66, este se encuentra en la clase 70 -74, la cual llamaremos
clase mediana. Por lo tanto el límite inferior de esa clase es 70 = Li. La
frecuencia absoluta de esa clase es 50 = fi, F(i-1) = 44 y el Ic = 5. Aplicando la
formula se tiene:

Luego la mediana de esa distribución es 72.2. Esto quiere decir


que un 50 % de los obreros trabajaron horas extras por debajo de
72.2 horas y el otro 50 % trabajaron horas extras por encima de
72.2 horas.

CARACTERÍSTICAS DE LA MEDIANA.
La mediana no es afectada por los valores extremos de una serie de valores,
puesto que la misma no es calculada con todos los valores de la serie.

• La mediana no está definida algebraicamente, ya que para su cálculo no


intervienen todos los valores de la serie.

• La mediana en algunos casos no se puede calcular exactamente y esto


ocurre cuando en una serie de valores para datos no agrupados el número
de datos es par, en este caso la mediana se calcula aproximadamente.
• La mediana se puede calcular en aquellas distribuciones de frecuencia de
clases abierta, siempre y cuando los elementos centrales puedan ser
determinados.

• La suma de los valores absolutos de las desviaciones de los datos


individuales con respecto a la mediana siempre es mínima. (propiedad)

LA MODA
La moda es la medida de posición que indica la magnitud del valor que se
presenta con más frecuencia en una serie de datos; es pues, el valor de la variable
que más se repite en un conjunto de datos. De las medidas de posición la moda
es la que se determina con mayor facilidad, ya que se puede obtener por una
simple observación de los datos en estudio, puesto que es el dato que se observa
con mayor frecuencia. Se designa con las letras Mo.

En las representaciones gráficas la moda es el punto más alto de la gráfica. La


obtención de la moda para datos agrupados no es un valor exacto, ya que varía
con las diferentes formas de agrupar una distribución de frecuencia.
En algunas distribuciones de frecuencias o serie de datos no agrupados o
agrupados se pueden presentar dos o más modas, en estos casos se habla de
serie de datos bimodales o multimodales respectivamente. Estos tipos de
distribuciones o series de valores se deben a la falta de homogeneidad de los
datos.

Cuando los datos se encuentran no agrupados la determinación de la moda es


sencilla y exacta; pero para calcularla en datos agrupados existen varios
métodos; cada uno de los cuales puede dar un valor diferente de la moda: En
este curso se dará el método de la interpolación por considerarse uno de los
más precisos en el cálculo de esta. Este método puede expresarse mediante la
siguiente fórmula:
Ejemplo:
Dada la siguiente distribución de frecuencia correspondiente al peso en Kg. de un
grupo de trabajadores de una empresa, calcule la moda.

La clase que presenta mayor frecuencia absoluta es 80----89, entonces será la


clase modal, donde:

Aplicando la fórmula se tiene:

Este resultado de la moda se interpreta así: La mayoría de los trabajadores tienen


un peso aproximadamente de 82.22 Kg.

CARACTERÍSTICAS DE LA MODA.
 El valor de la moda puede ser afectado grandemente por el método de
elaboración de los intervalos de clases.
 El valor de la moda no se halla afectado por la magnitud de los valores
extremos de una serie de valores, como sucede en la media aritmética.
 La moda se puede obtener en una forma aproximada muy fácilmente,
puesto que la obtención exacta es algo complicado.
 La moda tiene poca utilidad en una distribución de frecuencia que no
posea suficientes datos y que no ofrezcan una marcada tendencia
central.
 No es susceptible de operaciones algebraicas posteriores.
 La moda se utiliza cuando se trabaja con escalas nominales aunque se
puede utilizar con las otras escalas.
 La moda es útil cuando se está interesado en tener una idea
aproximada de la mayor concentración de una serie de datos.
COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA.

OTRAS MEDIDAS POSICIONALES.

Cuando se estudió la mediana se pudo detectar que esta divide la serie de valores en dos
partes iguales, una generalización de esta medida da origen a unas nuevas medidas de
posición denominadas:

Cuartiles, Deciles y Percentiles. Estas nuevas medidas de posición surgen por la


necesidad de requerir de otras medidas que expresen diferentes situaciones de orden,
aparte de las señaladas por la mediana. Por lo tanto es interesante ubicar otras medidas
que fraccionen una serie de datos en diferentes partes. Es bueno destacar que los
cuartiles, los Deciles y los Percentiles son unas variantes de la mediana: De la misma
forma los percentiles abarcan tanto a los cuartiles como a los Deciles.

LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia


en cuatro partes iguales. Se designa por el símbolo Qc en la que c corresponde a los
valores 1, 2 y 3. El Q1 es el valor debajo del cual queda el 25 % de los datos; Q3 deja el 75
% de los datos y Q2 divide la distribución de frecuencia en dos partes iguales, un 50 % que
está por debajo de los valores de Q2 y otro 50 % que está por encima del valor de Q2. El Q2
es igual a la mediana.

CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad


práctica calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en una
distribución de frecuencia existe un método por análisis gráfico y otro por determinación
numérica, por fines prácticos en esta cátedra se utilizara él último método. Para calcular
los cuartiles por el método numérico se procede de la siguiente manera:
1. Se localiza la posición del cuartil solicitado aplicando la fórmula de posición:
En donde c viene a ser el número del cuartil solicitado, n corresponde al número total
de datos de la distribución y 4 corresponde al número de cuartiles que presenta una
distribución de frecuencia.

2. Se determina la posición que ocupa el cuartil mediante la fórmula:

El resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo


cual se conseguirá en la clase donde la frecuencia acumulada Fi que sea igual o
superior a este resultado. Luego se aplica la fórmula:

LOS PERCENTILES.- Son medidas posesiónales que dividen la distribución de


frecuencia en 100 partes iguales. Con estos se puede calcular cualquier
porcentaje de datos de la distribución de frecuencia. Los percentiles son las
medidas más utilizadas para propósitos de ubicación de valor de una serie de
datos ubicados en una distribución de frecuencia. El número de percentiles de
una distribución de frecuencia es de 99. El percentil 50 es igual a la mediana y
al cuartil 2, es decir: Me=Q2=P50% por encima y 50 % por debajo de los datos
de la distribución.

El cálculo de los percentiles es similar al cálculo de los cuartiles con una


variante en la posición de ubicación de estos, que viene expresada por la
siguiente fórmula:
Ejemplo:
Dada la siguiente distribución correspondiente al salario semanal en dólares de
un grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q1, b)
Q2, c) Compare los resultados con la mediana, d)P25, e)P50, f) P70

a) Para calcular Q1 se determina primero la posición así:

Q1 = 115.75. Con ese valor de la posición encontrado se busca en las


frecuencias acumuladas para ver cual de esas es mayor o igual a ese valor.
Observando las frecuencias acumuladas se puede detectar que la posición
115.75 se encuentra en la clase 300------399, por lo tanto el Li = 300, fi =
90, y la F(i-1) = 85 y Ic = 100, aplicando la formula se tiene:

Este valor de Q1 indica que el 25 % de los obreros en estudio,


devengan un salario semanal por debajo de 334.17 $ y el 75 % restante
gana un salario por encima de 334.17 $.

b) Para calcular Q2=Me se determina primero la posición de este así.

Ahora se ubica esta posición en las frecuencias acumuladas para


determinar la posición de Q2, se puede observar en la distribución que esta
posición está ubicada en la clase 400----499, entonces, Li = 400, fi = 120,
F(i-1) = 175 y Ic = 100, aplicando la formula se tiene:
Este resultado de Q2 establece que el 50 % de los obreros de este
estudio, devengan un salario semanal por debajo de 447.08 $ y el otro
50 % devenga un sueldo por encima de 447.08 $. Calcule la mediana y
compárela con este resultado.

c) Calcular, Q2 = P50, además P25 = Q1, la comprobación de estos


resultados se le deja como practica al estudiante.

f) Para calcular P70 lo primero que se hace es determinar la posición,

Ahora se ubica este resultado en la columna de frecuencias acumuladas


para encontrar la posición de P70 en la distribución de frecuencia. Como se
puede observar en la tabla de distribución de frecuencia, P70 se encuentra
ubicado en la clase 500-------599, entonces, Li = 500, fi = 70, F(i-1) = 295 y
Ic = 100, aplicando la formula se tiene:

Esto indica que el 70 % de los obreros devengan un sueldo semanal


que está por debajo de 541.57 $ y que el 30% de los restantes obreros,
ganan un salario por encima de 541.57 $.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy