Antología E1 T1

INSTITUTO TECNOLÓGICO SUPERIOR DE
ÁLAMO TEMAPACHE
ESTADÍSTICA I
CLAVE: ADC-1020
ANTOLOGÍA
TEMA 1
ESTADÍSTICA DESCRIPTIVA
PROFESOR:
ING. VÍCTOR HUGO TLAPALCOYOA FRANCISCO
SEPTIEMBRE 2021
ANTOLOGÍA – ESTADÍSTICA I-INGENIERÍA EN ADMNINISTRACIÓN
TEMA 1: ESTADÍSTICA DESCRIPTIVA
1.1 Conceptos:
Definición de Estadística descriptiva
1. Se encarga de organizar y resumir los datos de forma numérica.
2. Es la rama de la estadística que formula recomendaciones sobre como resumir la
información en cuadros o tablas y graficas o figuras.
¿Qué es la estadística?
Es la ciencia de los datos, que implica la colección, clasificación, síntesis, organización y
análisis de los datos. Suele utilizarse para conocer el comportamiento de la población
utilizando una muestra (figura 1).
 Población: “Conjunto de datos que tienen las mismas características y están
limitados en tiempo y espacio”.
 Muestra: Subconjunto de la población.
Figura 1. Muestra de una población estadística.
Como lo que se desea es conocer el comportamiento de la población tomando como base

una muestra, la población utiliza parámetros (valores descriptivos de la población) que
deben ser conocidos utilizando los valores de la muestra, estimadores (valores
descriptivos de la muestra), con los cuales se inferirá los valores de los parámetros. Como
se utiliza una muestra, esta debe poseer las características siguientes:
 Aleatoria: Todos los individuos que constituyen la población de estudio deben
tener la misma posibilidad de ser seleccionados.
 Representativa: Los individuos deben de estar uniformemente distribuidos en el
sitio donde serán seleccionados.
 Repetitiva: Que la muestra sea capaz de ser extraída cuantas veces sea
necesaria bajo las mismas condiciones de la que fue extraída la primera.
 Tamaño de muestra: Que la cantidad de individuos que constituyen a la muestra
no sea ni muy grande ni muy pequeña, con la finalidad de obtener información
suficiente.
Z2 σ2 N
n=
e2 ( N−1 ) + Z2 σ 2
Donde n= es el tamaño de la muestra poblacional a obtener; N = es el tamaño de la
población total; σ = representa la desviación estándar de la población, en caso de
1
desconocer este dato es común utilizar un valor constate que equivale a 0.5; Z= es el
valor obtenido mediante niveles de confianza. Su valor es una constante, por lo general se
tienen dos valores dependiendo el grado de confianza que se desee siendo 99% el valor
más alto (este valor equivale a 2.58) y 95% (1.96) el valor mínimo aceptado para
considerar la investigación como confiable; e= representa el límite aceptable de error
muestral, generalmente va del 1% (0.01) al 9% (0.09), siendo 5% (0.5) el valor estándar
usado en las investigaciones.
Conforme a lo anterior se puede decir que la estadística maneja cantidades de datos. Los
datos son hechos y los números que se reúnen, analizan y resumen para su presentación
e interpretación.
A los datos se les asignan valores obtenidos de cada variable y cada uno de los
elementos de estudio. Las variables (figura 2) se clasifican en:
 Cuantitativas (numéricas, métricas)
 Cualitativas (categóricas)
Las primeras se definen por la existencia de una unidad de medición que puede ser
contable (unidades enteras), medible o ponderada por algún atributo físico con algún
instrumento.
Las variables cualitativas se caracterizan por clasificar a los individuos o fenómenos solo
con relación a sus atributos.
Nominal
Clasificar
ABCD
Cualitativa
Ordinal
Jerarquizar
1°, 2°, 3°
Variable
Discreta
Contar
1, 2, 3
Cuantitativa
Continua
Medir
1.62, 2.1, 3.5
Figura 2. Clasificación de las variables estadísticas.
1.2 Tipos de estadística:

Estadística descriptiva:
Esta herramienta permite destacar rápidamente los aspectos más importantes de un
conjunto de datos. Es conocida también como deductiva “y se encarga de mostrar el
resultado de los datos estudiados de forma específica” (Enciclopedia económica, 2018).
Los ejemplos que se observan a continuación son muestras de tipos de estadística:
 La imagen positiva del presidente de la Nación descendió casi 8 puntos luego de

las decisiones aplicadas al contexto de pandemia actual.
 El 24.3% de la población de Argentina fue vacunado con la primera dosis de la
vacuna.
2
 El 70% de los jóvenes entre 16 y 25 años desean continuar sus carreras

profesionales en el extranjero.
Estadística inferencial:
Éste es uno de los tipos de estadística en el que se buscan patrones que permitan
tomar decisiones sobre las muestras obtenidas. Con la finalidad de “emitir juicios
sobre los datos, identificar las relaciones entre las variables en el conjunto de valores, e
inferir sobre poblaciones más amplias basándose en muestras más pequeñas” (Carpi &
Egger, 2008). Este tipo de estadística puede verse reflejada en los siguientes ejemplos:
 Los estudiantes que finalizaron el secundario con un promedio mayor a 8

probablemente aprobarán el ingreso universitario de materias exactas.
 La tendencia hacia políticas liberales en jóvenes menores de 18 años
posiblemente desplace del escenario político, en el mediano plazo, a uno de los
dos grandes bloques actuales.
 Los equipos de futbol que presentaban deudas a fines del año 2019, se podrían
ver en peligro de perder la categoría actual debido a las dificultades económicas
provocadas por el Covid-19.
1.3 Distribución de frecuencias:

Datos en bruto: Son todos los datos que no se han organizado.
Ordenación: Datos numéricos en bruto dispuestos en orden creciente magnitud.
Rango (R): es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. Su fórmula es:
R=Máx x −Min x
Donde Máx x y Minx representan el valor máximo y el valor mínimo respectivamente de la

muestra o población y x es la variable sobre la cual se calcula la medida.
Clase: Número de subconjuntos en que se han agrupado los datos.
Numero de clases ( Regla de Sturges)=k=1+ log 2(N )

R
Tamaño de clase (intervalo de clase)=a= =LS −LI
k
Fronteras de clase: Conforman el intervalo de clase (Límite inferior y superior) ( Li−L s ).
Límite inferior real:

unidad de medida
LI =Li−
2
Límite superior real:
unidad de medida
LS =Ls +
2
3
Marca de clase: Punto medio del intervalo de clase.

Li + L s
x i=
2
Tabla 1. Tabla de frecuencias
Intervalo Límites Marca Frecuencia Frecuencia Frecuencia Frecuencia
de clase reales de absoluta Absoluta Relativa Relativa
( Li−L s ) LI −LS clase fi acumulada fr acumulada
xi Fi Fr
N 1
∑ f i=N ∑ f r =1
Frecuencia absoluta: Número de datos que entran en un intervalo de clase.

Frecuencia absoluta acumulada: Suma de la frecuencia absoluta más el dato anterior.
Frecuencia relativa: Frecuencia absoluta entre número total de datos (n).
Frecuencia absoluta acumulada: Suma de la frecuencia relativa más el dato anterior.
1.4 Medidas de tendencia central

Estas nos permiten resumir la distribución de los datos en un solo valor central, alrededor
del cual se sitúan, a estas medidas se les conoce como estadísticos de localización, estas
son: moda, mediana y media.
Moda (Mo):
Se define como el valor que con mayor frecuencia se presenta en un conjunto de datos.
Cuando la máxima frecuencia se presenta en un solo dato, se dice que el conjunto de
datos es unimodal, si por el contrario de presentan 2 datos con la misma frecuencia, el
conjunto es bimodal, en caso de que ningún dato se repita, es amodal.
Mediana (Me):
Es el valor que divide a un conjunto de datos exactamente por la mitad, una vez que estos
has sido ordenados correctamente de menor a mayor. Para un número par de datos, se
obtiene sumando los valores intermedios y dividiéndolos entre 2.
Media ( x́) :
Es la medida numérica más importante, y representa el promedio de los datos.
Las fórmulas de las medidas de tendencia central para datos agrupados y no agrupados,
se muestran en las tabla 1 y tabla 2.
Tabla 1. Medidas de tendencia central para datos no agrupados
Media Mediana
4
∑ xi
Muestra x́= i=1
n
Me i+ Me s
N Me=
2
∑ xi
Población μ= i=1
N
Tabla 2. Medidas de tendencia central para datos agrupados

Media Mediana Moda
n
∑ f i xi n
−F i−1
Muestra x́= i=1 2
n Me=Li + ×a
fi f i −f i −1
N
Mo=Li +
N (f ¿ ¿i−f i−1 )+(f ¿ ¿ i−f i−1)× a¿ ¿
∑ f i xi −F i−1
Población μ= i=1 2
N Me=Li + ×a
fi
1.5 Medidas de dispersión:

Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar
un valor numérico que ofrezca información sobre el grado de variabilidad de una variable.
En otras palabras, las medidas de dispersión son números que indican si una variable se
mueve mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es
conocer de manera resumida una característica de la variable estudiada. En este sentido,
deben acompañar a las medidas de tendencia central. Juntas, ofrecen información de
un sólo vistazo que luego podremos utilizar para comparar y, si fuera preciso, tomar
decisiones.
Principales medidas de dispersión:
Desviación media (DM): La desviación respecto a la media es la diferencia entre

cada valor de la variable estadística y la media aritmética. La desviación media es
la media aritmética de los valores absolutos de las desviaciones respecto a la media.
Varianza: es una medida de dispersión que representa la variabilidad de una serie de

datos respecto a su media. Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones.
Desviación estándar: es otra medida que ofrece información de la dispersión respecto a
la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz
cuadrada de su resultado. Es decir, la desviación estándar es la raíz cuadrada de la
varianza.
5
Coeficiente de variación: Indica si la variación de los datos es grande o pequeña, es una

medida relativa ya que expresa el porcentaje. En estadística se considera que un valor del
10% o menor de variación resulta adecuado. Se denota como CV.
Coeficiente de asimetría de Pearson: Mide la desviación de la simetría, expresada la
diferencia entre la media y la mediana con respecto a la desviación estándar del grupo de
mediciones la fórmula es: Sólo se puede utilizar en distribuciones uniformes, unimodales y
moderadamente asimétricas.
Interpretación del coeficiente de asimetría de Pearson:
 Si Ap < 0: la distribución tiene una asimetría negativa (Media < Moda).
 Si Ap = 0: la distribución es simétrica.
 Si Ap > 0: la distribución tiene una asimetría positiva, (Media > Moda).
Las fórmulas para cada una de las medidas de dispersión, de datos sin agrupar y
agrupados, para la muestra y población se muestran en la tabla 3.
Tabla 3. Medidas de tendencia central para datos agrupados

Datos no agrupados Datos agrupados
Muestra Población Muestra Población
Desviación n n n n
media ∑ (x i−x́) ∑ ( x i−μ) ∑ f i ∙(xi −x́) ∑ f i ∙( x i−μ)
D x́ = i=1 D μ= i=1 D x́ = i=1 D μ= i=1
n−1 N n−1 N
Varianza n N
n
N
∑ ( xi −x́)2 ∑ (x i−μ)2 ∑ f i ∙( x i− x́ ) 2 ∑ f i ∙( xi −μ)2

s2= i=1 σ 2= i=1 s2= i=1 σ 2= i=1
n−1 N n−1 N
Desviación
estándar s=± √ s 2 σ =± √ σ 2 s=± √ s 2 σ =± √ σ 2
Coeficiente s σ s σ
de variación CV = CV = CV = CV =
¿ x́∨¿ ×100 % ¿ ¿ μ∨¿ ×100 % ¿ ¿ x́∨¿ ×100 % ¿ ¿ μ∨¿ ×100 % ¿
Coeficiente x́ −Mo μ−Mo x́ −Mo μ−Mo
de asimetría A x́ = A μ= A x́ = A μ=
de Pearson s s s s
3 ( x́−Me ) 3(μ−Me) 3 ( x́−Me ) 3(μ−Me)

A x́ = A μ= A x́ = A μ=
s s s s

Antología E1 T1

Cargado por

Copyright:

Formatos disponibles

Antología E1 T1

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Antología E1 T1

Cargado por

Copyright:

Formatos disponibles

INSTITUTO TECNOLÓGICO SUPERIOR DE

TEMA 1: ESTADÍSTICA DESCRIPTIVA

Figura 1. Muestra de una población estadística.

Como lo que se desea es conocer el comportamiento de la población tomando como base

Figura 2. Clasificación de las variables estadísticas.

1.2 Tipos de estadística:

 La imagen positiva del presidente de la Nación descendió casi 8 puntos luego de

 El 70% de los jóvenes entre 16 y 25 años desean continuar sus carreras

 Los estudiantes que finalizaron el secundario con un promedio mayor a 8

1.3 Distribución de frecuencias:

Donde Máx x y Minx representan el valor máximo y el valor mínimo respectivamente de la

Numero de clases ( Regla de Sturges)=k=1+ log 2(N )

Fronteras de clase: Conforman el intervalo de clase (Límite inferior y superior) ( Li−L s ).

Límite inferior real:

Marca de clase: Punto medio del intervalo de clase.

Frecuencia absoluta: Número de datos que entran en un intervalo de clase.

1.4 Medidas de tendencia central

Tabla 2. Medidas de tendencia central para datos agrupados

1.5 Medidas de dispersión:

Principales medidas de dispersión:

Desviación media (DM): La desviación respecto a la media es la diferencia entre

Varianza: es una medida de dispersión que representa la variabilidad de una serie de

Coeficiente de variación: Indica si la variación de los datos es grande o pequeña, es una

Tabla 3. Medidas de tendencia central para datos agrupados

∑ ( xi −x́)2 ∑ (x i−μ)2 ∑ f i ∙( x i− x́ ) 2 ∑ f i ∙( xi −μ)2

3 ( x́−Me ) 3(μ−Me) 3 ( x́−Me ) 3(μ−Me)

También podría gustarte

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.