Analisis de Datos
Analisis de Datos
Analisis de Datos
Y MEDIDaS DE
tENDENCIa CENtRal
Escanea este código QR y verás la
COMPETENCIA MATEMÁTICA M1 Y M2 clase en video de este capítulo.
https://mor.cl/23/m20.html
1. AN ÁL I S I S D E DATO S
La estadística descriptiva es una rama de la matemática que emplea métodos y técnicas que
se utilizan en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de
un conjunto de datos de una determinada población de interés.
La población es un conjunto de individuos o elementos que poseen alguna variable cualitativa
o cuantitativa (característica) común que se quiere estudiar. Las poblaciones pueden ser finitas
o infinitas. Por lo general la población de interés suele ser de gran tamaño y por lo tanto su
estudio requeriría de mucho tiempo y recursos. Es por ello que se suele tomar una muestra.
Una muestra es un subconjunto de la población, que idealmente nos sirve de referencia para
hacernos una idea de lo que pasa con esa población. Una buena muestra es aquella que logre
representar o parecerse en sus características a la población completa y que por tanto nos
permite hacer inferencias de la misma, sin tener el registro de todos sus individuos. Este tipo de
muestra es la que conocemos como muestra representativa.
Una encuesta es una forma de recabar información, la cual se realiza sobre la muestra (o sobre
la población), con el fin de obtener opiniones, características, mediciones, etc.
a. Tabulación de datos
Cuando recabamos la información, ésta debe ser ingresada en tablas para que su interpretación
sea más simple. A este proceso se le llama tabulación de datos. Dependiendo del tipo y
características de los datos (variables cualitativas o variables cuantitativas), estos se pueden
tabular en tablas sin intervalos o con intervalos, según las necesidades del caso.
Variables Cuantitativas: Son aquellas que se pueden contar o medir. Las variables cuantitativas
se dividen a su vez en:
2 Continuas: Son aquellas que pueden tomar cualquier valor real, tales como la estatura, la
masa, el tiempo de espera en una fila, etc.
2 Discretas: Son aquellas que tienen restricciones numéricas, por ejemplo: el número de hijos
(no podemos tener 3,87 hijos), la cantidad de amigos, etc.
Variables Cualitativas: Son aquellas que obedecen a características no numéricas de la
población. Se dividen en:
2 Ordinales: Son variables que se pueden jerarquizar y dar un orden. Por ejemplo: Nivel
Socioeconómico, Nivel educacional, Rango militar, etc.
2 Nominales: Son características sin una jerarquía, tales como el nombre de una persona, el
color favorito, etc.
520
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
x f F fr Fr
1 2 2 20 % 20 %
2 3 5 30 % 50 %
3 5 10 50 % 100 %
n = 10
Intervalo MC f
[0 , 100[ 50 20
[100 , 200[ 150 30
[200 , 300[ 250 50
En la tabla anterior, se utilizó una agrupación en tres categorías, lo que implica el uso de tres intervalos. El primer
intervalo [0 , 100[ tiene límite inferior 0, y este valor está incluido en el intervalo, a diferencia del límite superior 100 que no
está incluido. Como su frecuencia es 20, hay 20 datos mayores o iguales a 0 y menores a 100.
f f f
A%
E%
B%
C%
x x x
i. Histogramas
Son gráficos que se usan para representar datos agrupados en intervalos.
f
Ejemplo: El siguiente histograma muestra las estaturas
(en cm) de un grupo de personas, considerando
intervalos de la forma ]a , b]. 16
De este gráfico se puede deducir que 12 personas 14
tienen una estatura mayor a 130 cm y menor o igual 12
a 140 cm. 10
La cantidad de datos es : n = 12 + 14 + 16 + 10 = 52
130 140 150 160 170 Estatura
( cm )
Intervalo f MC
Para interpretar un histograma y hacer cálculos a partir
de la información que entrega, puede ser útil ]130 , 140] 12 135
transformarlo a tabla: ]140 , 150] 14 145
]150 , 160] 16 155
]160 , 170] 10 165
Tre Fru e
s L i l la
he
h o Pi ñ
favorito.
C
522
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
ro
et
valor (o categoría) de la variable de estudio. El ángulo del centro de
M
cada sector circular es directamente proporcional a la cantidad
120º
de elementos en cada categoría.
ro
200º 40º
ic
M
ci
Ejemplo: Si de 90 personas, 30 eligen viajar en metro, 50 personas
Bi
eligen viajar en micro y 10 eligen viajar en bicicleta, los sectores circulares
tendrán ángulos del centro iguales a 120º, 200º y 40º respectivamente.
Ejemplos
1. En la tabla adjunta se muestra la distribución del tiempo de duración de cierta cantidad de
ampolletas. ¿ Cuál de las siguientes relaciones es verdadera?
Habilidad: Argumentar. (DEMRE 2018)
Tiempo de Frecuencia
Frecuencia
duración en Frecuencia acumulada
acumulada
miles de horas porcentual
[ 1 ; 1,15 [ A D 25 %
[ 1,15 ; 1,3 [ B E 87 %
[ 1,3 ; 1,45 ] C F 100 %
A) F < D + E
B) F<C
C) B < C
D) A < C
2. En la tabla adjunta se muestran algunos datos sobre la cantidad de horas de conexión a internet por
el total de los estudiantes de un curso durante una semana. ¿ Cuál de las siguientes afirmaciones es
verdadera?
Habilidad: Argumentar. (DEMRE 2019)
N° estu- Frec.
Horas
A ) El curso tiene 24 estudiantes. diantes relativa (%)
B) Más de la mitad de los estudiantes se conectó a [0 , 6[ 8
internet a lo más 12 horas.
[ 6 , 12 [ 40%
C ) La mitad de los estudiantes se conectó a internet
entre 0 y 12 horas. [ 12 , 18 [ 12 30%
3. En la tabla adjunta se muestra, en intervalos, el tiempo que los usuarios utilizaron un computador de
una biblioteca durante un fin de semana.
Habilidad: Representar. (DEMRE 2020)
Tiempo en Número de
minutos usuarios
[0 , 5[ 45
[5 , 10[ 38
[10 , 15[ 30
[15 , 20[ 45
[20 , 25[ 36
[25 , 30] 15
4. En la ojiva de la figura adjunta se muestra la distribución de los puntajes de 300 estudiantes en una
prueba, donde los intervalos del gráfico son de la forma [a , b[, excepto el último que es de la forma
[c , d]. ¿Cuál de las siguientes afirmaciones es siempre verdadera?
Habilidad: Representar. (DEMRE 2020)
5
350 450 550 650 750 850 Puntaje
524
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
6. En la tabla adjunta se muestra la distribución de todos los datos del ausentismo laboral que se registra
durante un año en una empresa.
Habilidad: Argumentar. (DEMRE 2020)
Frecuencia acumulada
Altura en metros Frecuencia
28 [0 , 10[ R
25
20 [10 , 20[ S
[20 , 30[ T
10
[30 , 40] Q
10 20 30 40
Altura en metros
A ) R = 5 , S = 15 , T = 25 y Q = 35
B) R = 10 , S = 30 , T = 60 y Q = 100
C ) R = 10 , S = 20 , T = 30 y Q = 40
D ) R = 10 , S = 10 , T = 5 y Q = 3
8. En la tabla adjunta se muestra la distribución de las horas sin suministro eléctrico de un grupo de
casas de una villa.
Se sabe que el promedio, la mediana y la moda de las horas sin suministro eléctrico son iguales y
que hay un valor único para la moda.
¿Cuál de los siguientes gráficos representa las condiciones dadas en el enunciado?
Habilidad: Representar. (DEMRE 2022)
A) Cantidad de B) Cantidad de
casas afectadas casas afectadas
Q
P=Q=R P=R
1 2 3 1 2 3
Horas sin suministro eléctrico Horas sin suministro eléctrico
C) Cantidad de D) Cantidad de
casas afectadas casas afectadas
R
P=R Q
Q P
1 2 3 1 2 3
Horas sin suministro eléctrico Horas sin suministro eléctrico
9. En la tabla adjunta se muestra la distribución de la escala de valoración de las notas de los estudiantes
de un curso.
Escala de Cantidad de
Notas
valoración estudiantes
Insuficiente [1 , 4[ 9
Suficiente [4 , 5[ 16
Bueno [5 , 6[ 5
Muy bueno [6 , 7[ 6
526
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
10. El gráfico circular de la figura adjunta muestra los resultados de una encuesta aplicada a 300
estudiantes sobre su nivel de acuerdo sobre la implementación de salas de computación en su
colegio.
Habilidad: Argumentar. (DEMRE 2021)
29 % 30 %
Algo en 2%
desacuerdo 2% 37 %
No contesta
Ni de acuerdo
Ni en desacuerdo
3
A ) La frecuencia relativa de los que contestan “Muy de acuerdo” es
10
B) La frecuencia de los que contestaron “Ni de acuerdo ni en desacuerdo” supera en 8 estudiantes
a los que contestaron “Algo de acuerdo”
528
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
ii. Moda
Es el dato con mayor frecuencia.
Ejemplo: Calcular la moda de los datos representados en la tabla.
2 es el dato ( x ) con mayor frecuencia
x f
(10), es decir, 2 es el dato que más se
0 4 repite.
1 7
2 10 Moda = 2
3 8
iii. Mediana
Al igual que para datos sin agrupar, para determinar la mediana hay que conocer el dato
central o los dos datos centrales para promediarlos, dependiendo de si la cantidad de datos es
impar o par, respectivamente. Para eso, primero se debe conocer la cantidad de datos n (suma
de las frecuencias), luego tendremos dos opciones:
n+1
2 Para n impar, se calcula y resultará un número entero. Ese resultado, será la posición
2
que ocupa la mediana, por lo que aun falta encontrar el dato que ocupa esa posición.
Para esto, se usa la Frecuencia acumulada como se muestra en los ejemplos.
n n
2 Para n par, se calcula y + 1, y estos resultados serán las posiciones de dos datos que
2 2
debemos promediar. Para encontrar esos datos, se usa la Frecuencia acumulada como se
muestra en los ejemplos.
Ejemplos:
Calcular la mediana de los datos representados en cada tabla.
a) n = 13 (n impar)
x f F
n+1 = 7 buscar el dato que ocupa la posición 7,
13 2 2 2
14 4 6 utilizando la Frecuencia acumulada.
15 5 11
15 2 13
x f F
En este grupo se tienen los datos que ocupan la
13 2 2
posición 1 y 2.
En este grupo se tienen los datos desde la posición 3
14 4 6
hasta la 6.
En este grupo se tienen los datos desde la posición 7
15 5 11
hasta la 11.
En este grupo se tienen los datos desde la posición 12
15 2 13
hasta la 13.
Por lo tanto, el dato que ocupa la posición 7 se encuentra en el 3º grupo, donde están los datos
iguales a 15. Mediana = 15
b) n = 90 (n par)
x f F
n = 45 y n + 1 = 46 promediar el dato que
1 21 21 2 2
2 27 48 ocupa la posición 45 con el dato que ocupa la
3 30 78 posición 46.
4 12 90
x f F
En este grupo se tienen los datos desde la posición 1
1 21 21
hasta la 21.
En este grupo se tienen los datos desde la posición 22
2 27 48
hasta la 48.
En este grupo se tienen los datos desde la posición 49
3 30 78
hasta la 78.
En este grupo se tienen los datos desde la posición 79
4 12 90
hasta la 90.
Por lo tanto, el dato que ocupa la posición 45 es 2 y el dato que ocupa la posición 46, también
es 2. El promedio entre 2 y 2: X = 2 + 2 = 4 = 2 . Mediana = 2
2 2
Observación: En los casos cuya cantidad de datos n sea un valor razonablemente pequeño, se
pueden escribir los datos por extensión y luego calcular la mediana, esto es:
Para el ejemplo a), que son 13 datos, éstos se pueden escribir:
13, 13, 14, 14, 14, 14, 15, 15, 15, 15, 15, 16, 16
y buscando el dato central, determinamos la mediana igual a 15.
MC 1 $ f1 + MC 2 $ f2 + MC 3 $ f3 + ... + MC k $ fk
X= n para n = f1 + f2 + f3 + ... + fk
530
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
[35 , 45[ 30 90
[45 , 55] 20 110
n = 110
n = 55 " buscar el intervalo que contiene
2
al dato que ocupa la posición 55.
Ejemplos
11. Al observar los grupos de datos P y Q de la tabla adjunta, se puede deducir que :
Habilidad: Representar. (DEMRE 2015)
P 10 12 13 13 15 16
Q 10 12 13 13 15 17
12. Si la tabulación del peso de 50 niños recién nacidos se muestra en la tabla adjunta, ¿ cuál de las
siguientes afirmaciones es verdadera?
Habilidad: Argumentar. (DEMRE 2016)
Peso ( Kg ) Nº de niños
A ) La mediana se encuentra en el tercer intervalo. 2,5 – 2,9 5
B) Un 20% de los recién nacidos pesó 4 kg. 3,0 – 3,4 23
C ) Un 5% de los recién nacidos pesó entre 2,5 y 2,9 kg. 3,5 – 3,9 12
D ) El intervalo modal es 3,0 – 3,4. 4,0 – 4,4 10
13. La tabla adjunta muestra algunos datos que corresponden a una encuesta sobre el porcentaje
de satisfacción por un producto, que manifestó el total de personas encuestadas. ¿ Cuál de las
siguientes afirmaciones es verdadera?
Habilidad: Argumentar. (DEMRE 2017)
Frecuencia
Porcentajes Frecuencia
Acumulada
[ 0 , 60 [ 0
[ 60 , 65 [ 5 5
[ 65 , 70 [
[ 70 , 75 [ 8 18
[ 75 , 80 [ 7
[ 80 , 85 [ 46
[ 85 , 90 [ 4
[ 90 , 100 ] 0
532
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
14. En la tabla adjunta se agrupan los resultados de haber consultado a un grupo de personas respecto
a la cantidad de primos que tiene. Según los datos de la tabla, ¿ cuál de las siguientes afirmaciones
se puede deducir ?
Habilidad: Argumentar. (DEMRE 2018)
Marca de Frecuencia
Nº Primos x i· f i
clase ( x ) ( f i)
[0 , 3[ 1,5 5 7,5
[3 , 6[ 4,5 12 54
[6 , 9[ 7,5 16 120
[ 9 , 12 [ 10,5 13 136,5
[ 12 , 15 [ 13,5 9 121,5
[ 15 , 18 [ 16,5 8 132
[ 18 , 21 [ 19,5 5 97,5
[ 21 , 24 ] 22,5 2 45
Total: 714
A ) El intervalo modal es [ 21 , 24 [.
B) La media de la variable es 714 primos.
C ) El intervalo donde se encuentra la mediana de la variable es [ 9 , 12 [.
D ) Un 10 % de los consultados tiene más de 18 primos.
15. En el gráfico de la figura adjunta se muestra la distribución de la masa en gramos de los recién
nacidos, según sexo, en una clínica de maternidad, durante un año. Si los hombres recién nacidos
son 140 y las mujeres recién nacidas son 150, ¿ cuál de las siguientes afirmaciones se puede deducir
a partir de la información entregada ?
Habilidad: Argumentar. (DEMRE 2019)
Hombres Mujeres
Masa en gramos
12 [ 4.500 , 5.000 ] 10
18 [ 4.000 , 4.500 [ 15
22 [ 3.500 , 4.000 [ 27
31 [ 3.000 , 3.500 [ 35
19 [ 2.500 , 3.000 [ 21
15 [ 2.000 , 2.500 [ 16
13 [ 1.500 , 2.000 [ 14
10 [ 1.000 , 1.500 [ 12
Frecuencia Frecuencia
16. En las tablas adjuntas se muestran los resultados obtenidos en dos muestras para la variable M, con
p < q < r. Si m es la media aritmética de la muestra A y n es la media aritmética de la muestra B y
las medianas de las muestras A y B son s y t, respectivamente, ¿ cuál de las siguientes relaciones es
verdadera ?
Habilidad: Argumentar. (DEMRE 2019)
Muestra A Muestra B
Variable Variable
A) m > n , s = t Frecuencia Frecuencia
M M
B) m>n , s<t p 3 p 5
C) m < n , s > t
q 5 q 3
D) m < n , s = t
r 4 r 4
17. En la tabla adjunta se muestran las notas por asignatura obtenidas por Rodrigo y Mariel.
Habilidad: Argumentar. (DEMRE 2021)
Si P y Q representan los promedios de las notas de Rodrigo y Mariel, respectivamente, R y S son las
medianas de sus respectivas notas, ¿cuál de las siguientes relaciones es verdadera?
A) P = Q y R > S
B) P>Q y R<S
C) P = Q y R < S
D) P < Q y R = S
18. El contador de la empresa de bolsas plásticas “Plástibol”, va a calcular el promedio de gastos por
viaje para abastecer las sucursales de distintas localidades que se realizó en un día determinado.
Para lo anterior considera solo los datos de la siguiente tabla:
Habilidad: Representar. (DEMRE 2021)
El contador sabe que para calcular ese promedio de gastos por viaje para estas localidades
debe sumar el total de la bencina, el total del peaje y el total del mantenimiento y luego realizar
una división.
Si se consideran los datos de la tabla, ¿por cuánto debe dividir la suma obtenida?
A ) Por 3
B) Por 4
C ) Por 5
D ) Por 15
534
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20
19. El dinero que tienen reunido en total tres amigas es $210.000. Se sabe que Claudia aportó el doble
que María, y que Yasna aportó el doble que Claudia. ¿Cuál es el promedio del dinero aportado por
Claudia y Yasna?
Habilidad: Resolver Problemas. (DEMRE 2022)
A ) $90.000
B) $70.000
C ) $45.000
D ) $35.000
20. En la siguiente tabla se muestra la distribución de las edades, en años, de un grupo de niños:
Edad Frecuencia
2 5
3 6
4 9
5 3
A ) 3,5 años
B) 4 años
C ) 7,5 años
D ) 9 años