Esta1 Se

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Universidad de Pamplona

Facultad de Ciencias Básicas


Departamento de Matemáticas
Estadı́stica I

Resumen de datos cualitativos

Distribución de frecuencia

Definición 1. DISTRIBUCIÓN DE FRECUENCIA


Una distribución de frecuencia es un resumen tabular de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases disyuntas (que no se sobreponen).

Representación gráfica de variables cualitativas


En estudio estadı́stico, las representaciones gráficas ayudan a tener una visualización clara y precisa
de cada una de las categorı́as de la variable. En las variables cualitativas los diagramas más utilizados
son el diagrama de barras y el diagrama circular.

Una gráfica de barras o un diagrama de barras, es una gráfica para representar los datos cualitativos
de una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. En uno de los ejes
de la gráfica (por lo general en el horizontal), se especifican las etiquetas empleadaspara las clases (ca-
tegorı́as). Para el otro eje de la gráfica (el vertical) se usa una escala para frecuencia, frecuencia relativa
o frecuencia porcentual. Después, empleando un ancho de barra fijo, se dibuja sobre cada etiqueta de
las clases una barra que se extiende hasta la frecuencia, frecuencia relativa o frecuencia porcentual de
la clase. Cuando se tienen datos cualitativos, las barras deben estar separadas para hacer énfasis en
que cada clase está separada.

La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia relativa y de
frecuencia porcentual de datos cualitativos. Para elaborar una gráfica de pastel, primero se dibuja un
cı́rculo que representa todos los datos. Después se usa la frecuencia relativa para subdividir el cı́rculo
en sectores, o partes, que corresponden a la frecuencia relativa de cada clase.

Ejemplo 1: Cinco refrescos muy conocidos son Coca cola clásica (Coke Classic), Coca cola de dieta
(Diet Coke), Dr. Pepper, Pepsi y Sprite. Suponga que los datos de la siguiente tabla muestran los
refrescos que fueron comprados en una muestra de 50 ventas de refresco.

1. Elaborar una distribución de frecuencias.

2. Elaborar un diagrama de barras.

3. Elaborar un diagrama de pastel.

Solución:

1
1. Para elaborar una distribución de frecuencia con estos datos, se cuenta el número de veces que
aparece cada refresco en la tabla. La Coca cola clásica (Coke Classic) aparece 19 veces, la Coca
cola de dieta (Diet Coke) 8 veces, Dr. Pepper 5 veces, Pepsi 13 veces y Sprite 5 veces. Esto queda
resumido en la distribución de frecuencias de la siguiente tabla.

Refrescos f fr %
Coke Classic 19 0.38 38
Diet Coke 8 0.16 16
Dr. Pepper 5 0.10 10
Pepsi 13 0.26 26
Sprite 5 0.10 10

2. Gráfica de barras para las ventas de refrescos

3. Por ejemplo, como un cı́rculo tiene 360 grados y Coca cola clásica presenta una frecuencia re-
lativa de 0.38, el sector de la gráfica de pastel correspondiente a Coca cola clásica resultará de
0,38(360) = 136,8 grados. El sector del pastel para Coca cola de dieta constará de 0,16(360) = 57,6
grados. Mediante cálculos semejantes para las demás clases se obtiene la gráfica de pastel de la
figura ??. Los números que aparecen en cada sector pueden ser frecuencia,frecuencia relativa o
frecuencia porcentual.

Figura 1: Gráfica de pastel para las ventas de refrescos

Resumen de datos cuantitativos

Distribución de frecuencia
Una distribución de frecuencia es un resumen de datos tabular que presenta el número de elementos
(frecuencia) en cada una de las clases disyuntas. Esta definición es válida tanto para datos cualitativos
como cuantitativos.

2
Histograma
Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se hace con datos
previamente resumidos mediante una distribución de frecuencia, de frecuencia relativa o de frecuen-
cia porcentual. Un histograma se construye colocando la variable de interés en el eje horizontal y la
frecuencia, la frecuencia relativa o la frecuencia porcentual en el eje vertical. La frecuencia, frecuencia
relativa o frecuencia porcentual de cada clase se indica dibujando un rectángulo cuya base está de-
terminada por los lı́mites de clase sobre el eje horizontal y cuya altura es la frecuencia, la frecuencia
relativa o la frecuencia porcentual correspondiente.

Ejemplo 2: Las calificaciones en un examen de 100 puntos se registraron para 20 estudiantes:


61 93 91 86 55 63 86 82 76 57
94 89 67 62 72 87 68 65 75 84

1. Construya una gráfica de tallo y hoja para estas mediciones.

2. Construir una distribución de frecuencias.

3. Construya un histograma de frecuencia absoluta para los datos.

Solución:
1. Diagrama de Tallo y Hoja para las calificaciones

Tallo Hojas Número de estudiantes


5 5 7 2
6 1 2 3 5 7 8 6
7 2 5 6 3
8 2 4 6 6 7 9 6
9 1 3 4 3

2. Pasos para construir una distribución de frecuencias agrupadas

1) Ordenar los datos de menor a mayor


55 57 61 62 63 65 67 68 72 75
76 82 84 86 86 87 89 91 93 94
2) Hallar el rango
Rango = 94 − 55 = 39

3) Determinar el número de intervalos

Regla de Sturges

k = 1 + 3,322 log(n)
k = 1 + 3,322 log(20) ≈ 5,32 ≈ 5

4) Determinar el ancho del intervalo

Xmax − Xmin
A=
k
94 − 55
A= = 7,8 ≈ 8
5
Distribución de frecuencias
Calificaciones mi f fr F Fr %
[55, 63) 59 4 0.2 4 0.2 20
[63, 71) 67 4 0.2 8 0.4 20
[71, 79) 75 3 0.15 11 0.55 15
[79, 87) 83 4 0.2 15 0.75 20
[87, 95) 91 5 0.25 20 1.0 25

3
3. Histograma de frecuencia absoluta para los datos.

Ejemplo 3: La demanda diaria, en unidades de un producto, durante 30 dı́as de trabajo es:


38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56

1. Construir una distribución de frecuencias.

2. Construir un histograma.

Solución:
1. Pasos para construir una distribución de frecuencias agrupadas

1) Ordenar los datos de menor a mayor

25 28 32 33 35 36 38 42 44 44
47 48 48 49 51 52 53 56 57 58
58 59 61 63 66 67 69 72 76 78

2) Hallar el rango
Rango = 78 − 25 = 53

3) Determinar el número de intervalos

Regla de Sturges

k = 1 + 3,322log(n)
k = 1 + 3,322log(30) ≈ 6
4) Determinar el ancho del intervalo

Xmax − Xmin
A=
k
78 − 25
A= ≈9
6
Variable mi f fr F Fr %
[25, 34) 29,5 4 0.13 4 0.13 13
[34, 43) 38.5 4 0.13 8 0.27 13
[43, 52) 47.5 7 0.23 15 0.50 23
[52, 61) 56.5 7 0.23 22 0.73 23
[61, 70) 65.5 5 0.17 27 0.9 17
[70, 79) 74.5 3 0.1 30 1.0 10

4
2. Histograma de los datos

Medidas de localización

Media
La medida de localización más importante es la media, o valor promedio, de una variable. La media
proporciona una medida de localización central de los datos. Si los datos son datos de una muestra, la
media se denota x; si los datos son datos de una población, la media se denota con la letra griega µ.

Definición 2. La media aritmética o promedio de un conjunto de n mediciones es igual a la suma


de las mediciones dividida entre n.

NOTACIÓN P
xi
Media muestral: x =
n
P
xi
Media poblacional: µ =
N
Definición 3. La mediana m de un conjunto de n mediciones es el valor de x que cae en la posición
media cuando las mediciones son ordenadas de menor a mayor.

MEDIANA
Ordenar los datos de menor a mayor (en forma ascendente).

1. Si el número de observaciones es impar, la mediana es el valor de enmedio.

2. Si el número de observaciones es par, la mediana es el promedio de las dos observaciones de


enmedio.

Definición 4. La moda es la categorı́a que se presenta con más frecuencia o el valor de x que se
presenta con más frecuencia.

Ejemplo 4: Con los siguientes datos

16 7 2 6 4 1 7 1 1 1

Encuentre la media, la mediana y la moda.


Solución:
Media
16 + 7 + 2 + 6 + 4 + 1 + 7 + 1 + 1 + 1
x= = 4,6
10
Mediana
Ordenando los datos de menor a mayor

1 1 1 1 2 4 6 7 7 16
Como n = 10 es par, se localizan los dos valores de enmedio: 2 y 4. La mediana es el promedio de estos
dos valores.

5
2+4
Mediana = =3
2
Moda

La moda es 1.

Medidas de dispersión
Definición 5. El rango, R, de un conjunto de n mediciones se define como la diferencia entre la
medición más grande y la más pequeña.
Definición 6. La varianza de una población de N mediciones es el promedio de los cuadrados de
las desviaciones de las mediciones alrededor de su media µ. La varianza poblacional se denota con σ 2
y está dada por la fórmula P
2 (xi − µ)
σ =
N
Definición 7. La varianza de una muestra de n mediciones es la suma de las desviaciones cuadradas
de las mediciones alrededor la media x̄ dividida entre (n − 1). La varianza muestral se denota con s2
y está dada por la fórmula
(xi − x̄)2
P
2
s =
n−1
Definición 8. La desviación estándar de un conjunto de mediciones es igual a la raı́z cuadrada
positiva de la varianza.
Notación
n : número de mediciones en la muestra.

s2 : varianza muestral

s= s2 : desviación muestral estándar

N : número de mediciones en la población



σ= σ 2 : desviación poblacional estándar

Ejemplo 5: Dos compañias, A y B, venden botes de café instantáneo de 12 onzas. Se seleccionaron


aleatoriamente 5 botes de cada compañia disponibles en el mercado, y se pesó cuidadosamente su
contenido, con los siguientes resultados.

A: 12,02, 12,08, 11,99, 11,96, 11,99


B: 12,40, 12,21, 12,36, 12,22, 12,27

Determine
1. Cuál compañı́a ofrece más café en sus botes, y
2. Cuál compañia llena sus botes más consistentemente.
Solución:
Media para la muestra A
12,02 + 12,08 + 11,99 + 11,96 + 11,99
xA = = 12,008
5
Varianza para la muestra A
(12,02 − 12,008)2 + (12,08 − 12,008)2 + (11,99 − 12,008)2 (2) + (11,96 − 12,008)2
s2 = ≈ 0,00207
4
Desviación estándar para la muestra A
p
s= 0,00207 ≈ 0,0455

6
Media para la muestra B
12,40 + 12,21 + 12,36 + 12,22 + 12,27
xB = = 12,292
5
Varianza para la muestra B

(12,40 − 12,292)2 + (12,21 − 12,292)2 + (12,36 − 12,292)2 + (12,22 − 12,292)2 + (12,27 − 12,292)2
s2 =
4
= 0,00717

Desviación estándar para la muestra B


p
s= 0,00717 ≈ 0,0847

1. Como xB es mayor que xA , se infiere que la compañı́a B muy probablemente ofrece más café por
bote.

2. Como sA es menor que sB , se infiere que la compañı́a A parece más consistente (menor desviación
estándar).
Ejercicios Propuestos
1. En un estudio sobre el peso (en Kg) de niños recién nacidos en una determinada región, se tomó
una muestra de 200 niños, siendo los datos obtenidos agrupados en 5 clases de amplitud 0.5. Se
elaboró la siguiente tabla incompleta:

Peso mi f fr F Fr
[1.5, 2) 10
[2, 2.5) 0,225
[2.5, 3) 0,7
[3, 3.5) 35
[3.5, 4)

a) Completa la tabla
b) ¿Qué porcentaje de niños tienen un peso superior a 2.5 kg e inferior a 3.0 kg?

2. Se registran las siguientes mediciones para el tiempo de secado (en horas) de cierta marca de
pintura esmaltada.

3.4 2.5 4.8 2.9 3.6


2.8 3.3 5.6 3.7 2.8
4.4 4.0 5.2 3.0 4.8

Suponga que las mediciones constituyen una muestra aleatoria simple.

a) ¿Cuál es el tamaño de la muestra anterior?


b) Calcule la media de la muestra para estos datos.
c) Calcule la mediana de la muestra.

3. Un fabricante de componentes electrónicos se interesa en determinar el tiempo de vida de cierto


tipo de baterı́a. La que sigue es una muestra, en horas de vida:

123 116 122 110 175 126 125 111 118 117

Encuentre la media y la mediana de la muestra.

4. Obtenga a) el rango y b) la desviación estándar de la siguiente muestra.

2 5 6 8 9 11 15

5. Dos marcas de baterı́as de automóviles, ambas con garantı́as de 6 años, se muestrearon y probaron
en condiciones controladas. Cinco baterı́as de cada marca fallaron después de los números de
meses indicados a continuación.

7
Marca A: 74, 65, 70, 64, 71
Marca B: 69, 70, 62, 72, 60

a) Calcule las medias de ambas muestras.


b) Calcule las desviaciones estándar de ambas muestras.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy