Esta1 Se
Esta1 Se
Esta1 Se
Distribución de frecuencia
Una gráfica de barras o un diagrama de barras, es una gráfica para representar los datos cualitativos
de una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. En uno de los ejes
de la gráfica (por lo general en el horizontal), se especifican las etiquetas empleadaspara las clases (ca-
tegorı́as). Para el otro eje de la gráfica (el vertical) se usa una escala para frecuencia, frecuencia relativa
o frecuencia porcentual. Después, empleando un ancho de barra fijo, se dibuja sobre cada etiqueta de
las clases una barra que se extiende hasta la frecuencia, frecuencia relativa o frecuencia porcentual de
la clase. Cuando se tienen datos cualitativos, las barras deben estar separadas para hacer énfasis en
que cada clase está separada.
La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia relativa y de
frecuencia porcentual de datos cualitativos. Para elaborar una gráfica de pastel, primero se dibuja un
cı́rculo que representa todos los datos. Después se usa la frecuencia relativa para subdividir el cı́rculo
en sectores, o partes, que corresponden a la frecuencia relativa de cada clase.
Ejemplo 1: Cinco refrescos muy conocidos son Coca cola clásica (Coke Classic), Coca cola de dieta
(Diet Coke), Dr. Pepper, Pepsi y Sprite. Suponga que los datos de la siguiente tabla muestran los
refrescos que fueron comprados en una muestra de 50 ventas de refresco.
Solución:
1
1. Para elaborar una distribución de frecuencia con estos datos, se cuenta el número de veces que
aparece cada refresco en la tabla. La Coca cola clásica (Coke Classic) aparece 19 veces, la Coca
cola de dieta (Diet Coke) 8 veces, Dr. Pepper 5 veces, Pepsi 13 veces y Sprite 5 veces. Esto queda
resumido en la distribución de frecuencias de la siguiente tabla.
Refrescos f fr %
Coke Classic 19 0.38 38
Diet Coke 8 0.16 16
Dr. Pepper 5 0.10 10
Pepsi 13 0.26 26
Sprite 5 0.10 10
3. Por ejemplo, como un cı́rculo tiene 360 grados y Coca cola clásica presenta una frecuencia re-
lativa de 0.38, el sector de la gráfica de pastel correspondiente a Coca cola clásica resultará de
0,38(360) = 136,8 grados. El sector del pastel para Coca cola de dieta constará de 0,16(360) = 57,6
grados. Mediante cálculos semejantes para las demás clases se obtiene la gráfica de pastel de la
figura ??. Los números que aparecen en cada sector pueden ser frecuencia,frecuencia relativa o
frecuencia porcentual.
Distribución de frecuencia
Una distribución de frecuencia es un resumen de datos tabular que presenta el número de elementos
(frecuencia) en cada una de las clases disyuntas. Esta definición es válida tanto para datos cualitativos
como cuantitativos.
2
Histograma
Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se hace con datos
previamente resumidos mediante una distribución de frecuencia, de frecuencia relativa o de frecuen-
cia porcentual. Un histograma se construye colocando la variable de interés en el eje horizontal y la
frecuencia, la frecuencia relativa o la frecuencia porcentual en el eje vertical. La frecuencia, frecuencia
relativa o frecuencia porcentual de cada clase se indica dibujando un rectángulo cuya base está de-
terminada por los lı́mites de clase sobre el eje horizontal y cuya altura es la frecuencia, la frecuencia
relativa o la frecuencia porcentual correspondiente.
Solución:
1. Diagrama de Tallo y Hoja para las calificaciones
Regla de Sturges
k = 1 + 3,322 log(n)
k = 1 + 3,322 log(20) ≈ 5,32 ≈ 5
Xmax − Xmin
A=
k
94 − 55
A= = 7,8 ≈ 8
5
Distribución de frecuencias
Calificaciones mi f fr F Fr %
[55, 63) 59 4 0.2 4 0.2 20
[63, 71) 67 4 0.2 8 0.4 20
[71, 79) 75 3 0.15 11 0.55 15
[79, 87) 83 4 0.2 15 0.75 20
[87, 95) 91 5 0.25 20 1.0 25
3
3. Histograma de frecuencia absoluta para los datos.
2. Construir un histograma.
Solución:
1. Pasos para construir una distribución de frecuencias agrupadas
25 28 32 33 35 36 38 42 44 44
47 48 48 49 51 52 53 56 57 58
58 59 61 63 66 67 69 72 76 78
2) Hallar el rango
Rango = 78 − 25 = 53
Regla de Sturges
k = 1 + 3,322log(n)
k = 1 + 3,322log(30) ≈ 6
4) Determinar el ancho del intervalo
Xmax − Xmin
A=
k
78 − 25
A= ≈9
6
Variable mi f fr F Fr %
[25, 34) 29,5 4 0.13 4 0.13 13
[34, 43) 38.5 4 0.13 8 0.27 13
[43, 52) 47.5 7 0.23 15 0.50 23
[52, 61) 56.5 7 0.23 22 0.73 23
[61, 70) 65.5 5 0.17 27 0.9 17
[70, 79) 74.5 3 0.1 30 1.0 10
4
2. Histograma de los datos
Medidas de localización
Media
La medida de localización más importante es la media, o valor promedio, de una variable. La media
proporciona una medida de localización central de los datos. Si los datos son datos de una muestra, la
media se denota x; si los datos son datos de una población, la media se denota con la letra griega µ.
NOTACIÓN P
xi
Media muestral: x =
n
P
xi
Media poblacional: µ =
N
Definición 3. La mediana m de un conjunto de n mediciones es el valor de x que cae en la posición
media cuando las mediciones son ordenadas de menor a mayor.
MEDIANA
Ordenar los datos de menor a mayor (en forma ascendente).
Definición 4. La moda es la categorı́a que se presenta con más frecuencia o el valor de x que se
presenta con más frecuencia.
16 7 2 6 4 1 7 1 1 1
1 1 1 1 2 4 6 7 7 16
Como n = 10 es par, se localizan los dos valores de enmedio: 2 y 4. La mediana es el promedio de estos
dos valores.
5
2+4
Mediana = =3
2
Moda
La moda es 1.
Medidas de dispersión
Definición 5. El rango, R, de un conjunto de n mediciones se define como la diferencia entre la
medición más grande y la más pequeña.
Definición 6. La varianza de una población de N mediciones es el promedio de los cuadrados de
las desviaciones de las mediciones alrededor de su media µ. La varianza poblacional se denota con σ 2
y está dada por la fórmula P
2 (xi − µ)
σ =
N
Definición 7. La varianza de una muestra de n mediciones es la suma de las desviaciones cuadradas
de las mediciones alrededor la media x̄ dividida entre (n − 1). La varianza muestral se denota con s2
y está dada por la fórmula
(xi − x̄)2
P
2
s =
n−1
Definición 8. La desviación estándar de un conjunto de mediciones es igual a la raı́z cuadrada
positiva de la varianza.
Notación
n : número de mediciones en la muestra.
s2 : varianza muestral
√
s= s2 : desviación muestral estándar
Determine
1. Cuál compañı́a ofrece más café en sus botes, y
2. Cuál compañia llena sus botes más consistentemente.
Solución:
Media para la muestra A
12,02 + 12,08 + 11,99 + 11,96 + 11,99
xA = = 12,008
5
Varianza para la muestra A
(12,02 − 12,008)2 + (12,08 − 12,008)2 + (11,99 − 12,008)2 (2) + (11,96 − 12,008)2
s2 = ≈ 0,00207
4
Desviación estándar para la muestra A
p
s= 0,00207 ≈ 0,0455
6
Media para la muestra B
12,40 + 12,21 + 12,36 + 12,22 + 12,27
xB = = 12,292
5
Varianza para la muestra B
(12,40 − 12,292)2 + (12,21 − 12,292)2 + (12,36 − 12,292)2 + (12,22 − 12,292)2 + (12,27 − 12,292)2
s2 =
4
= 0,00717
1. Como xB es mayor que xA , se infiere que la compañı́a B muy probablemente ofrece más café por
bote.
2. Como sA es menor que sB , se infiere que la compañı́a A parece más consistente (menor desviación
estándar).
Ejercicios Propuestos
1. En un estudio sobre el peso (en Kg) de niños recién nacidos en una determinada región, se tomó
una muestra de 200 niños, siendo los datos obtenidos agrupados en 5 clases de amplitud 0.5. Se
elaboró la siguiente tabla incompleta:
Peso mi f fr F Fr
[1.5, 2) 10
[2, 2.5) 0,225
[2.5, 3) 0,7
[3, 3.5) 35
[3.5, 4)
a) Completa la tabla
b) ¿Qué porcentaje de niños tienen un peso superior a 2.5 kg e inferior a 3.0 kg?
2. Se registran las siguientes mediciones para el tiempo de secado (en horas) de cierta marca de
pintura esmaltada.
123 116 122 110 175 126 125 111 118 117
2 5 6 8 9 11 15
5. Dos marcas de baterı́as de automóviles, ambas con garantı́as de 6 años, se muestrearon y probaron
en condiciones controladas. Cinco baterı́as de cada marca fallaron después de los números de
meses indicados a continuación.
7
Marca A: 74, 65, 70, 64, 71
Marca B: 69, 70, 62, 72, 60