Analisis de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

EJE | PROBABILIDAD Y ESTADÍSTICA


“Todo parece imposible
CAPÍTULO 20 hasta que se hace”
— NELSON MANDELA —
aNÁlISIS DE DatoS ABOGADO, ACTIVISTA Y FILÁNTROPO SUDAFRICANO

Y MEDIDaS DE
tENDENCIa CENtRal
Escanea este código QR y verás la
COMPETENCIA MATEMÁTICA M1 Y M2 clase en video de este capítulo.
https://mor.cl/23/m20.html

1. AN ÁL I S I S D E DATO S
La estadística descriptiva es una rama de la matemática que emplea métodos y técnicas que
se utilizan en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de
un conjunto de datos de una determinada población de interés.
La población es un conjunto de individuos o elementos que poseen alguna variable cualitativa
o cuantitativa (característica) común que se quiere estudiar. Las poblaciones pueden ser finitas
o infinitas. Por lo general la población de interés suele ser de gran tamaño y por lo tanto su
estudio requeriría de mucho tiempo y recursos. Es por ello que se suele tomar una muestra.
Una muestra es un subconjunto de la población, que idealmente nos sirve de referencia para
hacernos una idea de lo que pasa con esa población. Una buena muestra es aquella que logre
representar o parecerse en sus características a la población completa y que por tanto nos
permite hacer inferencias de la misma, sin tener el registro de todos sus individuos. Este tipo de
muestra es la que conocemos como muestra representativa.
Una encuesta es una forma de recabar información, la cual se realiza sobre la muestra (o sobre
la población), con el fin de obtener opiniones, características, mediciones, etc.

a. Tabulación de datos
Cuando recabamos la información, ésta debe ser ingresada en tablas para que su interpretación
sea más simple. A este proceso se le llama tabulación de datos. Dependiendo del tipo y
características de los datos (variables cualitativas o variables cuantitativas), estos se pueden
tabular en tablas sin intervalos o con intervalos, según las necesidades del caso.
Variables Cuantitativas: Son aquellas que se pueden contar o medir. Las variables cuantitativas
se dividen a su vez en:
2 Continuas: Son aquellas que pueden tomar cualquier valor real, tales como la estatura, la
masa, el tiempo de espera en una fila, etc.
2 Discretas: Son aquellas que tienen restricciones numéricas, por ejemplo: el número de hijos
(no podemos tener 3,87 hijos), la cantidad de amigos, etc.
Variables Cualitativas: Son aquellas que obedecen a características no numéricas de la
población. Se dividen en:
2 Ordinales: Son variables que se pueden jerarquizar y dar un orden. Por ejemplo: Nivel
Socioeconómico, Nivel educacional, Rango militar, etc.
2 Nominales: Son características sin una jerarquía, tales como el nombre de una persona, el
color favorito, etc.

520
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

i. Tablas de frecuencias para datos no agrupados


2 Variable. Es una característica de la población que resulta de interés. Ésta puede ser cualitativa
o cuantitativa.
2 Dato(x). Corresponde a un valor de la variable.
2 Frecuencia o frecuencia absoluta ( f ). Número de veces que se repite el dato.
2 Frecuencia acumulada o Frecuencia absoluta acumulada ( F). Esta frecuencia tiene utilidad
cuando estudiamos variables cuantitativas o cualitativas ordinales. Se obtiene sumando las
frecuencias de todos los valores inferiores o iguales al valor considerado, es decir, se suman
ordenadamente las frecuencias absolutas hasta la que ocupa la última posición. El valor de
la última frecuencia acumulada corresponde al total de datos (n).
2 Frecuencia relativa ( f r ). Se obtiene dividiendo la frecuencia absoluta por el total de datos. Se
puede expresar en fracción, decimal o porcentaje. Para expresar en porcentaje, el cociente
obtenido se multiplica por 100 y recibe el nombre de frecuencia porcentual o frecuencia
relativa porcentual.
2 Frecuencia relativa acumulada (Fr). Se obtiene sumando las frecuencias relativas de todos
los valores inferiores o iguales al valor considerado, es decir, se suman ordenadamente las
frecuencias relativas hasta la que ocupa la última posición. El valor de la última frecuencia
relativa acumulada es siempre 1; si está expresada en porcentaje, será 100%.
2 Rango. Es la diferencia entre el valor máximo y el valor mínimo de los datos.
2 Cantidad de datos (n). Se obtiene sumando las frecuencias absolutas.

Ejemplo: Tabla de frecuencias de datos no agrupados:

x f F fr Fr
1 2 2 20 % 20 %
2 3 5 30 % 50 %
3 5 10 50 % 100 %
n = 10

ii. Tablas de frecuencias para datos agrupados en intervalos


2 Intervalo. Representa un conjunto de números que se encuentran entre dos valores dados,
llamados límites del intervalo.
2 Límite inferior y límite superior del intervalo. Son los límites izquierdo y derecho respectivamente
de cada intervalo. Éstos pueden o no estar incluidos en el intervalo, dependiendo de cada
ejercicio.
2 Amplitud de un intervalo. Es la diferencia entre el límite superior y el límite inferior del intervalo
independiente del tipo de intervalo.
2 Marca de clase (MC). Es un valor que representa al intervalo y se calcula promediando los
límites de dicho intervalo; es decir, se suman los límites inferior y superior, y el resultado se
divide en dos. Cada intervalo tendrá su propia marca de clase.
2 Frecuencia o frecuencia absoluta ( f ). Cantidad de datos que se encuentran en el intervalo.
2 Rango. No existe universalidad en el cálculo del rango en tablas con intervalos, ya que al no
conocer específicamente los valores de los datos, existe más de un método para determinar
una buena aproximación para este (por ejemplo: diferencia entre la mayor y la menor marca
de clase; o diferencia entre el mayor límite superior y el menor límite inferior de los intervalos).
No obstante lo anterior, siempre podremos asegurar que el rango será menor o igual que la
diferencia entre el límite superior del último intervalo y el límite inferior del primer intervalo.
Las frecuencias acumuladas y relativas se calculan de la misma manera que en tablas para datos
no agrupados.

Ejemplo: Tabla de frecuencias de datos agrupados en intervalos.

Intervalo MC f
[0 , 100[ 50 20
[100 , 200[ 150 30
[200 , 300[ 250 50

En la tabla anterior, se utilizó una agrupación en tres categorías, lo que implica el uso de tres intervalos. El primer
intervalo [0 , 100[ tiene límite inferior 0, y este valor está incluido en el intervalo, a diferencia del límite superior 100 que no
está incluido. Como su frecuencia es 20, hay 20 datos mayores o iguales a 0 y menores a 100.

Matemática Para Nacional 521


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

b. Representación gráfica e interpretación de gráficos


La representación gráfica de una distribución de frecuencias nos permite ver de manera clara
y ordenada un determinado estudio estadístico. Hay varios tipos de gráficos, siendo los más
comunes: histogramas, gráfico de barras, polígono de frecuencias o gráfico de líneas y gráfico
de torta o circular.

Histograma Gráfico de barras Poligonal de Gráfico circular o de


frecuencias o gráfico torta
de líneas

f f f

A%
E%

B%
C%

x x x

i. Histogramas
Son gráficos que se usan para representar datos agrupados en intervalos.
f
Ejemplo: El siguiente histograma muestra las estaturas
(en cm) de un grupo de personas, considerando
intervalos de la forma ]a , b]. 16
De este gráfico se puede deducir que 12 personas 14
tienen una estatura mayor a 130 cm y menor o igual 12
a 140 cm. 10

La cantidad de datos es : n = 12 + 14 + 16 + 10 = 52
130 140 150 160 170 Estatura
( cm )

Intervalo f MC
Para interpretar un histograma y hacer cálculos a partir
de la información que entrega, puede ser útil ]130 , 140] 12 135
transformarlo a tabla: ]140 , 150] 14 145
]150 , 160] 16 155
]160 , 170] 10 165

ii. Gráfico de Barras f

El gráfico de barras, a diferencia del histograma, se 50


usa para representar variables cuantitativas discretas, 36
y variables cualitativas, razón por la cual pueden estar 25
las barras separadas. 12

Ejemplo: El siguiente gráfico de barras muestra la x


s
co a

Tre Fru e
s L i l la
he
h o Pi ñ

distribución de los niños según el sabor de su helado


la
t
ec

favorito.
C

iii. Polígono de frecuencias


El gráfico poligonal de frecuencias, nos permite
representar lo mismo que un gráfico de barras, pero
tiene como principal ventaja, que se pueden mostrar
dos o más poblaciones de manera simultánea. Es por
tanto un gráfico muy útil para comparar.

Ejemplo: En la figura, vemos la evolución del Dólar y el


Euro en los últimos 3 meses.

522
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

iv. Gráfico de Torta o Circular.


El gráfico circular tiene por objeto mostrar proporcionalmente cuál es
la porción de la población (círculo completo) asociada a cada

ro
et
valor (o categoría) de la variable de estudio. El ángulo del centro de

M
cada sector circular es directamente proporcional a la cantidad
120º
de elementos en cada categoría.

ro
200º 40º

ic
M

ci
Ejemplo: Si de 90 personas, 30 eligen viajar en metro, 50 personas

Bi
eligen viajar en micro y 10 eligen viajar en bicicleta, los sectores circulares
tendrán ángulos del centro iguales a 120º, 200º y 40º respectivamente.

Ejemplos
1. En la tabla adjunta se muestra la distribución del tiempo de duración de cierta cantidad de
ampolletas. ¿ Cuál de las siguientes relaciones es verdadera?
Habilidad: Argumentar. (DEMRE 2018)

Tiempo de Frecuencia
Frecuencia
duración en Frecuencia acumulada
acumulada
miles de horas porcentual
[ 1 ; 1,15 [ A D 25 %
[ 1,15 ; 1,3 [ B E 87 %
[ 1,3 ; 1,45 ] C F 100 %

A) F < D + E
B) F<C
C) B < C
D) A < C

2. En la tabla adjunta se muestran algunos datos sobre la cantidad de horas de conexión a internet por
el total de los estudiantes de un curso durante una semana. ¿ Cuál de las siguientes afirmaciones es
verdadera?
Habilidad: Argumentar. (DEMRE 2019)
N° estu- Frec.
Horas
A ) El curso tiene 24 estudiantes. diantes relativa (%)
B) Más de la mitad de los estudiantes se conectó a [0 , 6[ 8
internet a lo más 12 horas.
[ 6 , 12 [ 40%
C ) La mitad de los estudiantes se conectó a internet
entre 0 y 12 horas. [ 12 , 18 [ 12 30%

D ) El 4% de los estudiantes se conectó a internet Más de 18 4


más de 18 horas.

Matemática Para Nacional 523


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

3. En la tabla adjunta se muestra, en intervalos, el tiempo que los usuarios utilizaron un computador de
una biblioteca durante un fin de semana.
Habilidad: Representar. (DEMRE 2020)

Tiempo en Número de
minutos usuarios
[0 , 5[ 45
[5 , 10[ 38
[10 , 15[ 30
[15 , 20[ 45
[20 , 25[ 36
[25 , 30] 15

Según los datos de la tabla, ¿cuál de las siguientes afirmaciones es verdadera?

A ) Hubo un total de 200 usuarios ese fin de semana.


B) Los intervalos modales son [0 , 5[ y [15 , 20[.
C ) Hubo 158 usuarios que utilizaron un computador a lo menos 20 minutos.
D ) La mediana se encuentra en el intervalo [15 , 20[.

4. En la ojiva de la figura adjunta se muestra la distribución de los puntajes de 300 estudiantes en una
prueba, donde los intervalos del gráfico son de la forma [a , b[, excepto el último que es de la forma
[c , d]. ¿Cuál de las siguientes afirmaciones es siempre verdadera?
Habilidad: Representar. (DEMRE 2020)

A ) Solo 49 estudiantes obtuvieron menos de Frecuencia acumulada porcentual


650 puntos
100
B) 181 estudiantes obtiene más de 650 puntos
C ) La mediana de los puntajes se encuentra 81
en el intervalo [750 , 850]
D ) Un 25% de los estudiantes obtiene menos de 49
550 puntos
25

5
350 450 550 650 750 850 Puntaje

5. En la tabla adjunta se muestra la distribución de las edades, en años, de un grupo de personas.


Habilidad: Argumentar. (DEMRE 2021)

Intervalo Frecuencia Frecuencia relativa porcentual


[12 , 18[ 8 16
[18 , 24[ 14
[24 , 30[
[30 , 36[ 18
[36 , 42] 3

Según los datos de la tabla, ¿cuál de las siguientes afirmaciones es verdadera?

A ) La marca de clase del intervalo de mayor frecuencia es 33 años.


B) Un 44% de las personas tiene menos de 24 años.
C ) El grupo en total tiene 100 personas.
D ) Exactamente, un 38% de las personas tiene menos de 30 años.

524
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

6. En la tabla adjunta se muestra la distribución de todos los datos del ausentismo laboral que se registra
durante un año en una empresa.
Habilidad: Argumentar. (DEMRE 2020)

Cantidad de días Cantidad de Frecuencia relativa de la


de ausencias trabajadores cantidad de trabajadores
[0 , 3[ 15 Q
[3 , 6[ 5 0,2
[6 , 9[ P 0,12
[9 , 12] 2 R

Según los datos de la tabla, ¿cuál de las siguientes afirmaciones es verdadera?

A ) Hubo un total de 25 ausencias durante ese año.


B) Un 60% de los trabajadores se ausentó menos de 3 días ese año.
C ) 20 trabajadores faltaron 6 días a su trabajo ese año.
D ) P = 6.

7. En el gráfico de la figura adjunta se muestra la frecuencia acumulada de las alturas, en metros, de


los edificios construidos el último año en una determinada comuna, donde los intervalos son de
la forma [a , b[ y el último de la forma [c , d]. A partir de la información presentada en el gráfico se
construye la siguiente tabla de frecuencias.
Habilidad: Representar. (DEMRE 2021)

Frecuencia acumulada
Altura en metros Frecuencia

28 [0 , 10[ R
25
20 [10 , 20[ S
[20 , 30[ T
10
[30 , 40] Q
10 20 30 40
Altura en metros

¿Cuáles son los valores de R, S, T y Q?

A ) R = 5 , S = 15 , T = 25 y Q = 35
B) R = 10 , S = 30 , T = 60 y Q = 100
C ) R = 10 , S = 20 , T = 30 y Q = 40
D ) R = 10 , S = 10 , T = 5 y Q = 3

Matemática Para Nacional 525


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

8. En la tabla adjunta se muestra la distribución de las horas sin suministro eléctrico de un grupo de
casas de una villa.

Horas sin suministro Cantidad de casas


eléctrico afectadas
1 P
2 Q
3 R

Se sabe que el promedio, la mediana y la moda de las horas sin suministro eléctrico son iguales y
que hay un valor único para la moda.
¿Cuál de los siguientes gráficos representa las condiciones dadas en el enunciado?
Habilidad: Representar. (DEMRE 2022)

A) Cantidad de B) Cantidad de
casas afectadas casas afectadas

Q
P=Q=R P=R

1 2 3 1 2 3
Horas sin suministro eléctrico Horas sin suministro eléctrico

C) Cantidad de D) Cantidad de
casas afectadas casas afectadas

R
P=R Q
Q P

1 2 3 1 2 3
Horas sin suministro eléctrico Horas sin suministro eléctrico

9. En la tabla adjunta se muestra la distribución de la escala de valoración de las notas de los estudiantes
de un curso.

Escala de Cantidad de
Notas
valoración estudiantes
Insuficiente [1 , 4[ 9
Suficiente [4 , 5[ 16
Bueno [5 , 6[ 5
Muy bueno [6 , 7[ 6

¿Cuál de las siguientes afirmaciones se deduce de la tabla?


Habilidad: Argumentar. (DEMRE 2022)

A ) Hay 11 estudiantes que obtuvieron una nota mayor que 5.


B) 4,5 es la nota de mayor frecuencia.
C ) Un 25 % de los estudiantes fue valorado con un Insuficiente.
D ) Por lo menos un estudiante consiguió nota 7.

526
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

10. El gráfico circular de la figura adjunta muestra los resultados de una encuesta aplicada a 300
estudiantes sobre su nivel de acuerdo sobre la implementación de salas de computación en su
colegio.
Habilidad: Argumentar. (DEMRE 2021)

Algo de acuerdo Muy de acuerdo

29 % 30 %

Algo en 2%
desacuerdo 2% 37 %

No contesta
Ni de acuerdo
Ni en desacuerdo

¿Cuál de las siguientes afirmaciones es verdadera?

3
A ) La frecuencia relativa de los que contestan “Muy de acuerdo” es
10
B) La frecuencia de los que contestaron “Ni de acuerdo ni en desacuerdo” supera en 8 estudiantes
a los que contestaron “Algo de acuerdo”

C ) El nivel de acuerdo de la encuesta es bimodal

D ) 2 estudiantes no contestan la encuesta

Matemática Para Nacional 527


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

2. ME DI DA S D E T E N D E N C I A CEN TRAL ( M TC)


Las medidas de tendencia central son indicadores que intentan centralizar en un valor único la
información de una población o muestra. Estas son: La Media aritmética (o promedio), la Moda
y la Mediana.

a. MTC para datos sin agrupar


i. Media
La media aritmética o promedio aritmético (X), es el cuociente entre la suma de todos los datos
y el número de datos.

Si se tienen n datos: x1 , x2 , x3 , ... , xn, su Ejemplo:


media aritmética es: El promedio de los datos

x + x 2 + x 3 + ... + x n 11, 3, 17, 21, 0, 2 es:


X= 1
n X = 11 + 3 + 17 + 21 + 0 + 2
6
54
X=
6
X=9
ii. Moda
Es el valor del dato que más se repite. Un conjunto de datos puede tener 1 moda (Unimodal),
más de una moda (Polimodal o Multimodal) o no tener moda (Amodal).
Ejemplos:
2 El conjunto { 2 , 3 , 4 , 4 , 6 , 6 , 6 , 8 , 9 } tiene una moda igual a 6.
2 El conjunto { 2 , 3 , 4 , 4 , 6 , 6 , 8 , 8 , 9 } tiene más de una moda: 4, 6, y 8.
2 El conjunto { 2 , 2 , 4 , 4 , 9 , 9 } no tiene moda, ya que no hay dato que se repita más que
el resto.
iii. Mediana
La mediana de un conjunto de datos ordenados de menor a mayor, corresponde al valor que
divide al conjunto de datos en dos: la mitad mayor y la mitad menor. Se puede interpretar que
la mitad de los datos es menor o igual a la mediana, y que la mitad de los datos es mayor o
igual a la mediana.
Si se tienen n datos, se tienen dos posibilidades:
2 Para n impar: la mediana corresponde al dato que ocupa la posición central de los datos.
2 Para n par: la mediana corresponde al promedio entre los dos datos centrales.
Ejemplo:
2 La mediana del conjunto {2, 3, 4, 4, 7, 8, 8, 8, 9} es 7, ya que es el dato que ocupa la
posición central.
2 La mediana del conjunto {2, 3, 4, 4, 7, 9, 9, 12} es 5,5 ya que corresponde al promedio
entre 4 y 7, que son los dos datos centrales.

b. MTC para datos en tabla sin intervalos


i. Media
La media aritmética o promedio (X) se calcula sumando todos los productos entre el dato y
su frecuencia respectiva, para luego dividir este resultado por el número total de datos n. Si
se tienen n datos que se agrupan en k valores diferentes: x1 , x 2 , x3 , ... , x k, y sus respectivas
frecuencias f1 , f2 , f3 , ... , fk, entonces la media aritmética se calcula como:
x 1 $ f1 + x 2 $ f2 + x 3 $ f3 + ... + x k $ fk
X= n para n = f1 + f2 + f3 + ... + fk

528
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

Ejemplo: Calcular el promedio de los datos representados en la tabla.


n = 10 + 12 + 9 + 5 = 36
x f
6 10 X = 6 $ 10 + 7 $ 12 + 8 $ 9 + 9 $ 5
36
7 12 X = 60 + 84 + 72 + 45
36
8 9
X = 261
9 5 36
X = 7, 25

ii. Moda
Es el dato con mayor frecuencia.
Ejemplo: Calcular la moda de los datos representados en la tabla.
2 es el dato ( x ) con mayor frecuencia
x f
(10), es decir, 2 es el dato que más se
0 4 repite.
1 7
2 10 Moda = 2
3 8

iii. Mediana
Al igual que para datos sin agrupar, para determinar la mediana hay que conocer el dato
central o los dos datos centrales para promediarlos, dependiendo de si la cantidad de datos es
impar o par, respectivamente. Para eso, primero se debe conocer la cantidad de datos n (suma
de las frecuencias), luego tendremos dos opciones:
n+1
2 Para n impar, se calcula y resultará un número entero. Ese resultado, será la posición
2
que ocupa la mediana, por lo que aun falta encontrar el dato que ocupa esa posición.
Para esto, se usa la Frecuencia acumulada como se muestra en los ejemplos.
n n
2 Para n par, se calcula y + 1, y estos resultados serán las posiciones de dos datos que
2 2
debemos promediar. Para encontrar esos datos, se usa la Frecuencia acumulada como se
muestra en los ejemplos.
Ejemplos:
Calcular la mediana de los datos representados en cada tabla.
a) n = 13 (n impar)
x f F
n+1 = 7 buscar el dato que ocupa la posición 7,
13 2 2 2
14 4 6 utilizando la Frecuencia acumulada.
15 5 11
15 2 13

x f F
En este grupo se tienen los datos que ocupan la
13 2 2
posición 1 y 2.
En este grupo se tienen los datos desde la posición 3
14 4 6
hasta la 6.
En este grupo se tienen los datos desde la posición 7
15 5 11
hasta la 11.
En este grupo se tienen los datos desde la posición 12
15 2 13
hasta la 13.

Por lo tanto, el dato que ocupa la posición 7 se encuentra en el 3º grupo, donde están los datos
iguales a 15. Mediana = 15

Matemática Para Nacional 529


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

b) n = 90 (n par)
x f F
n = 45 y n + 1 = 46 promediar el dato que
1 21 21 2 2
2 27 48 ocupa la posición 45 con el dato que ocupa la
3 30 78 posición 46.
4 12 90

x f F
En este grupo se tienen los datos desde la posición 1
1 21 21
hasta la 21.
En este grupo se tienen los datos desde la posición 22
2 27 48
hasta la 48.
En este grupo se tienen los datos desde la posición 49
3 30 78
hasta la 78.
En este grupo se tienen los datos desde la posición 79
4 12 90
hasta la 90.

Por lo tanto, el dato que ocupa la posición 45 es 2 y el dato que ocupa la posición 46, también
es 2. El promedio entre 2 y 2: X = 2 + 2 = 4 = 2 . Mediana = 2
2 2

Observación: En los casos cuya cantidad de datos n sea un valor razonablemente pequeño, se
pueden escribir los datos por extensión y luego calcular la mediana, esto es:
Para el ejemplo a), que son 13 datos, éstos se pueden escribir:
13, 13, 14, 14, 14, 14, 15, 15, 15, 15, 15, 16, 16
y buscando el dato central, determinamos la mediana igual a 15.

c. MTC para datos agrupados en tabla con intervalos


i. Media
La media aritmética o promedio (X) se calcula sumando todos los productos entre la marca
de clase y la frecuencia respectiva de cada intervalo, para luego dividir este resultado por el
número total de datos. Si se tienen n datos, que se dividen en k intervalos distintos con marcas
de clase: MC1 , MC2 , MC3 , ... , MCk y frecuencias f1 , f2 , f3 , ... , fk , la media aritmética se calcula
como sigue :

MC 1 $ f1 + MC 2 $ f2 + MC 3 $ f3 + ... + MC k $ fk
X= n para n = f1 + f2 + f3 + ... + fk

Ejemplo: Calcular el promedio de los datos representados en la siguiente tabla.


n = 8 + 12 + 7 + 3
Intervalo f MC
n = 30
[1 , 3[ 8 2
[3 , 5[ 12 4 X = 2 $ 8 + 4 $ 12 + 6 $ 7 + 8 $ 3
30
[5 , 7[ 7 6
[7 , 9] 3 8 X = 16 + 48 + 42 + 24
30

Suponiendo, que no me dan las Marcas de X = 130


Clase calculadas, éstas se tienen que calcular 30
para cada intervalo:
X = 4, 3
MC = 1 + 3 = 2 , MC = 3 + 5 = 4 , ...
1 2 2 2

530
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

ii. Intervalo modal


La moda corresponde al dato con mayor frecuencia o datos con mayor frecuencia, si es que
existe. Es decir, el o los datos que más se repiten. En el caso de las tablas con datos agrupados
en intervalos, no conocemos el valor de cada dato, solo sabemos la cantidad de datos que
se encuentran en cada intervalo. Por esta razón, no podemos conocer el dato que más se
repite, es decir no podemos determinar la moda; solo podemos conocer el o los intervalos con
mayor frecuencia. Es decir, el o los intervalos que contienen mayor cantidad de datos, lo que
llamamos “intervalo modal”. Esto no significa que la moda se encuentre necesariamente en el
intervalo modal, recordemos que no conocemos el valor de cada dato.
Tenemos entonces que el intervalo modal corresponde al intervalo con mayor frecuencia.
Podría ser más de uno; o ninguno si es que todas las frecuencias son iguales.
Ejemplo: Dada la siguiente tabla, determinar el intervalo modal.

El intervalo modal es [20 , 30[ ya que tiene la


Intervalo f
mayor frecuencia (8).
[10 , 20[ 2
[20 , 30[ 8
[30 , 40[ 6
[40 , 50] 1

iii. Intervalo que contiene a la mediana


El intervalo que contiene a la mediana corresponde al intervalo que contiene al dato en la
posición central o a los dos datos centrales, dependiendo si la cantidad de datos es impar o
n
par, respectivamente. Por lo tanto, para determinar este intervalo, se debe calcular y buscar
2 n
el intervalo que tiene el dato que ocupa esa posición, usando la Frecuencia acumulada. Si
2
resulta un número decimal, este se aproxima al entero mayor más cercano.
Ejemplo: Dada la siguiente tabla, determinar el intervalo que contiene a la mediana.

El 2º intervalo contiene a los datos desde


Intervalo f F
la posición 19 hasta la posición 60. Por
[15 , 25[ 18 18 lo tanto, el intervalo que contiene a la
[25 , 35[ 42 60 mediana es [25 , 35[ .

[35 , 45[ 30 90
[45 , 55] 20 110
n = 110
n = 55 " buscar el intervalo que contiene
2
al dato que ocupa la posición 55.

Ejemplos
11. Al observar los grupos de datos P y Q de la tabla adjunta, se puede deducir que :
Habilidad: Representar. (DEMRE 2015)

P 10 12 13 13 15 16
Q 10 12 13 13 15 17

A ) Solo las medias aritméticas y las modas de P y Q son iguales


B) Las medias aritméticas y las medianas de P y Q son iguales
C ) Las medianas y las modas de P y Q son iguales
D ) Las medias aritméticas, las medianas y las modas de P y Q son iguales

Matemática Para Nacional 531


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

12. Si la tabulación del peso de 50 niños recién nacidos se muestra en la tabla adjunta, ¿ cuál de las
siguientes afirmaciones es verdadera?
Habilidad: Argumentar. (DEMRE 2016)
Peso ( Kg ) Nº de niños
A ) La mediana se encuentra en el tercer intervalo. 2,5 – 2,9 5
B) Un 20% de los recién nacidos pesó 4 kg. 3,0 – 3,4 23
C ) Un 5% de los recién nacidos pesó entre 2,5 y 2,9 kg. 3,5 – 3,9 12
D ) El intervalo modal es 3,0 – 3,4. 4,0 – 4,4 10

13. La tabla adjunta muestra algunos datos que corresponden a una encuesta sobre el porcentaje
de satisfacción por un producto, que manifestó el total de personas encuestadas. ¿ Cuál de las
siguientes afirmaciones es verdadera?
Habilidad: Argumentar. (DEMRE 2017)

Frecuencia
Porcentajes Frecuencia
Acumulada
[ 0 , 60 [ 0
[ 60 , 65 [ 5 5
[ 65 , 70 [
[ 70 , 75 [ 8 18
[ 75 , 80 [ 7
[ 80 , 85 [ 46
[ 85 , 90 [ 4
[ 90 , 100 ] 0

A ) Un 50% de los encuestados tiene una satisfacción que pertenece al intervalo [ 75 , 80 [


B) Ninguna de las personas encuestadas tiene un 100% de satisfacción por el producto
C ) 100 personas contestaron la encuesta
D ) El intervalo modal es [ 70 , 75 [

532
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

14. En la tabla adjunta se agrupan los resultados de haber consultado a un grupo de personas respecto
a la cantidad de primos que tiene. Según los datos de la tabla, ¿ cuál de las siguientes afirmaciones
se puede deducir ?
Habilidad: Argumentar. (DEMRE 2018)

Marca de Frecuencia
Nº Primos x i· f i
clase ( x ) ( f i)
[0 , 3[ 1,5 5 7,5
[3 , 6[ 4,5 12 54
[6 , 9[ 7,5 16 120
[ 9 , 12 [ 10,5 13 136,5
[ 12 , 15 [ 13,5 9 121,5
[ 15 , 18 [ 16,5 8 132
[ 18 , 21 [ 19,5 5 97,5
[ 21 , 24 ] 22,5 2 45
Total: 714

A ) El intervalo modal es [ 21 , 24 [.
B) La media de la variable es 714 primos.
C ) El intervalo donde se encuentra la mediana de la variable es [ 9 , 12 [.
D ) Un 10 % de los consultados tiene más de 18 primos.

15. En el gráfico de la figura adjunta se muestra la distribución de la masa en gramos de los recién
nacidos, según sexo, en una clínica de maternidad, durante un año. Si los hombres recién nacidos
son 140 y las mujeres recién nacidas son 150, ¿ cuál de las siguientes afirmaciones se puede deducir
a partir de la información entregada ?
Habilidad: Argumentar. (DEMRE 2019)

Hombres Mujeres
Masa en gramos
12 [ 4.500 , 5.000 ] 10
18 [ 4.000 , 4.500 [ 15
22 [ 3.500 , 4.000 [ 27
31 [ 3.000 , 3.500 [ 35
19 [ 2.500 , 3.000 [ 21
15 [ 2.000 , 2.500 [ 16
13 [ 1.500 , 2.000 [ 14
10 [ 1.000 , 1.500 [ 12

Frecuencia Frecuencia

A ) El intervalo modal tanto en mujeres como en hombres, es el mismo.


B) La mediana de las masas de las mujeres y la mediana de las masas de los hombres se
encuentran en distinto intervalo.
C ) La masa más frecuente tanto en mujeres como en hombres, es 3.250 gramos.
D ) Ocurrieron menos nacimientos de mujeres que de hombres en esa clínica durante ese año.

Matemática Para Nacional 533


Capítulo 20 | Análisis de Datos y Medidas de Tendencia Central

16. En las tablas adjuntas se muestran los resultados obtenidos en dos muestras para la variable M, con
p < q < r. Si m es la media aritmética de la muestra A y n es la media aritmética de la muestra B y
las medianas de las muestras A y B son s y t, respectivamente, ¿ cuál de las siguientes relaciones es
verdadera ?
Habilidad: Argumentar. (DEMRE 2019)
Muestra A Muestra B
Variable Variable
A) m > n , s = t Frecuencia Frecuencia
M M
B) m>n , s<t p 3 p 5
C) m < n , s > t
q 5 q 3
D) m < n , s = t
r 4 r 4

17. En la tabla adjunta se muestran las notas por asignatura obtenidas por Rodrigo y Mariel.
Habilidad: Argumentar. (DEMRE 2021)

Asignatura Rodrigo Mariel


Lenguaje 5,2 5,8
Matemática 4,8 5,2
Inglés 5,0 4,0
Ciencias Sociales 6,0 4,5
Ciencias Naturales 4,0 5,5

Si P y Q representan los promedios de las notas de Rodrigo y Mariel, respectivamente, R y S son las
medianas de sus respectivas notas, ¿cuál de las siguientes relaciones es verdadera?

A) P = Q y R > S
B) P>Q y R<S
C) P = Q y R < S
D) P < Q y R = S

18. El contador de la empresa de bolsas plásticas “Plástibol”, va a calcular el promedio de gastos por
viaje para abastecer las sucursales de distintas localidades que se realizó en un día determinado.
Para lo anterior considera solo los datos de la siguiente tabla:
Habilidad: Representar. (DEMRE 2021)

Gastos por un viaje


Localidades Bencina ($) Peajes ($) Mantenimiento del vehículo ($)
San Antonio 8.550 4.500 1.710
Valparaíso 9.020 3.600 1.804
Rancagua 5.380 2.300 1.076
Litueche 9.800 1.900 1.960
Total 32.750 12.300 6.550

El contador sabe que para calcular ese promedio de gastos por viaje para estas localidades
debe sumar el total de la bencina, el total del peaje y el total del mantenimiento y luego realizar
una división.
Si se consideran los datos de la tabla, ¿por cuánto debe dividir la suma obtenida?

A ) Por 3
B) Por 4
C ) Por 5
D ) Por 15

534
Análisis de Datos y Medidas de Tendencia Central | Capítulo 20

19. El dinero que tienen reunido en total tres amigas es $210.000. Se sabe que Claudia aportó el doble
que María, y que Yasna aportó el doble que Claudia. ¿Cuál es el promedio del dinero aportado por
Claudia y Yasna?
Habilidad: Resolver Problemas. (DEMRE 2022)

A ) $90.000
B) $70.000
C ) $45.000
D ) $35.000

20. En la siguiente tabla se muestra la distribución de las edades, en años, de un grupo de niños:

Edad Frecuencia
2 5
3 6
4 9
5 3

¿Cuál es la mediana de la edad de este grupo de niños?


Habilidad: Representar. (DEMRE 2022)

A ) 3,5 años
B) 4 años
C ) 7,5 años
D ) 9 años

Matemática Para Nacional 535

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy