15-Taller12 Estadistica PDF
15-Taller12 Estadistica PDF
15-Taller12 Estadistica PDF
Iniciación al Cálculo
Elementos de Estadística
Pedro Vicente Esteban Duarte
Presentación
La estadística es una rama de las matemáticas que se ocupa de la recolección, procesamiento y análisis
de la información para hacer inferencias que ayudan en la toma de decisiones en diversos campos del
conocimiento, como la Sociología, la Psicología, la Política, la Física, la Química, entre otras.
Su estudio y comprensión se hace cada vez más necesario desde los primeros años de escolaridad, pues
fortalece el pensamiento aleatorio y sistemas de datos, que se ocupa de los problemas en los que para su
solución es necesario pensar en términos de probabilidades.
Objetivo general
Estudiar los conceptos básicos sobre la recolección, procesamiento e inferencia de datos cualitativos y
cuantitativos.
Objetivos específicos
Encontrar los estadísticos (moda, media, mediana, rango, varianza, desviación estándar) para conjun-
tos de datos.
Agrupar datos de acuerdo con sus características.
Los conceptos expuestos y los ejercicios planteados permiten comprender conceptos fundamentales de la
estadística básica.
Universidad EAFIT Pedro Vicente Esteban Duarte
1. Recolección de la información
Desde la antigüedad, se tienen registros de recolección de información con diversos fines: censar una po-
blación, militares, rendimiento de las cosechas, cría del ganado, entre otros. De ello se tienen registros en
arcilla cocida y papiros, en civilizaciones como la de Babilonia, de Egipto, de Grecia, entre otras1 .
En el Siglo XV III, los datos relacionados con el censo y otras actividades propias del comercio se denomi-
naron “datos del estado”. El término estadística fue introducido, en el siglo X IX , por el inglés John Sinclair
(1754-1835). A través de la historia, son muchos los matemáticos que han contribuido en la construcción de
de la teoría y en el análisis de los resultados de las aplicaciones que se hacen de esta rama del conocimiento
a diversas ciencias2 .
La recolección de la información parte de los intereses que se tengan para realizar un estudio, en relación
con una población, el tipo de variables y de los datos que se quieren observar, la cantidad de datos que se
quieren recolectar, la capacidad de procesamiento que se tenga, los recursos humanos y financieros con que
se cuente para llevar a buen término el análisis de los datos.
En periódicos, revistas, libros de texto, radio y televisión se encuentran muchos ejemplos de la forma de
recolectar la información, del procesamiento de la misma y los fines con la que se usa.
Los estudios, en los que se requiere del análisis estadístico, comienzan por la recolección de la información,
sobre una o varias características de interés de un conjunto de datos. La unidad básica de información es el
dato y el conjunto de datos conforman la muestra que va a ser analizada. Con la muestra se construyen los
estadísticos, que son los valores, que permiten hacer inferencias sobre la población de la que se extraen los
datos.
Población: cualquier conjunto de referencia sobre el que se hace una observación. Los estudiantes de un
colegio, los compañeros de clase, las notas obtenidas en un examen de matemáticas, los hinchas de un
1 Best, Joel (2001). Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists. University
2
Universidad EAFIT Pedro Vicente Esteban Duarte
equipo de fútbol que van a ver un partido al estadio, las personas que utilizan una determinada marca
de zapatos, entre otros. El tamaño de la población, se denota generalmente por la letra N mayúscula.
Variable de interés: es la característica que interesa observar en una población. En una misma población
un investigador puede estar interesado en observar varias características, cada una de esas caracterís-
ticas es una variable. En un colegio, puede ser de interés las notas de los estudiantes en cada una de
las áreas de estudio: Matemáticas, Sociales, Ciencias, entre otras.
Tipos de variables: las variables pueden ser cualitativas o cuantitativas. Las cualitativas son aquellas que
describen cualidades, alto, bajo, rojo, verde, bueno, malo, regular, primero, segundo, entre otras. Las
cuantitativas son las que como resultado se obtienen valores numéricos con los que tiene sentido
realizar operaciones aritméticas: kilogramos, metros, el resultado de la nota en un examen, la estatura
de una persona, el dinero que tiene alguien en el bolsillo, entre otras.
Dato: cualquier resultado de la observación de la variable de interés. Por ejemplo, para las notas de mate-
máticas en un determinado colegio, si al encuestar un alumnos dice que obtuvo un 7, ese es un dato
para la variable observada.
Muestra: cualquier subconjunto de la población. Si la población son los estudiantes de un colegio, los
siguientes subconjuntos, dependiendo el estudio que se quiera realizar, pueden ser una muestra: los
estudiantes que llegaron tarde el primer lunes del último mes, los estudiantes del grado octavo, los
que llegan a pie al colegio, los que viven en barrios distintos en los que esta ubicado el colegio, entre
otros. El tamaño de la muestra se denota por la letra n minúscula.
Estadístico: es el resultado de cualquier procedimiento que se haga con los datos.
Ejemplo
Un colegio, en el grado octavo, cuenta con 60 estudiantes, se quieren observar algunas características de
este grupo. Para ello, se entrevista a 10 estudiantes, seleccionados al azar y, se les pregunta por la nota en
español y el deporte que practicaron en el último período académico. Los resultados obtenidos fueron los
siguientes:
Nota de español: 7, 8, 9, 6, 5, 7, 7, 9, 5, 6.
Deporte que práctica: voleibol, fútbol, patinaje, atletismo, fútbol, fútbol, voleibol, atletismo, karate, fútbol.
La población objeto de estudio son los alumnos del grado octavo de un colegio en particular. Note que el
tamaño de la población es de 60, por lo tanto N = 60.
Variables de interés:
1. De acuerdo con el enunciado del ejercicio, la nota de español del grupo objeto de estudio, es una
variable cuantitativa. Las notas se pueden sumar, sacar promedios, entre otros.
2. De acuerdo con el enunciado del ejercicios, el deporte que practican los alumnos del grupo objeto de
estudio, es una variable cualitativa. No tiene sentido sumar, sacar promedios, entre otras operaciones,
con los deportes reportados.
3
Universidad EAFIT Pedro Vicente Esteban Duarte
La muestra son los diez estudiantes seleccionados al azar, su tamaño es: n = 10.
Los datos son cada una de las respuesta dadas por los estudiantes del curso.
Para la variable cuantitativa, cada una de las notas reportadas por los alumnos entrevistados corresponden
a los datos.
Para la variable cualitativa, cada uno de los deportes que los alumnos reportaron que habían practicado
durante el período académico corresponden a los datos.
Notas de español: 5, 5, 6, 6, 7, 7, 7, 8, 9, 9.
A partir de esta actividad se puede decir que la diferencia en la nota de español es de 4 unidades. Este valor
se obtiene de realizar una operación aritmética con los datos recolectados, por lo tanto es un estadístico.
Otro puede ser el 7, que es la nota que más se repite en la muestra. Como se puede observar, a partir de los
datos de una muestra se pueden obtener varios estadísticos.
Si se organizan en orden alfabético los deportes practicados, por el grupo de estudiantes observados, se
tiene:
atletismo, atletismo, fútbol, fútbol, fútbol, fútbol, karate, patinaje, voleibol, voleibol
El deporte más practicado por los estudiantes observados es el fútbol, que sirve como un estadístico de la
muestra. Esto se obtuvo a partir de observar características de la muestra recolectada.
Al observar los resultados y ver que la nota que más reportaron los estudiantes es 7 y que hay más estudian-
tes por debajo de esa nota que por encima, se infiere que los estudiantes necesitan refuerzo en español para
los temas de ese período.
Es posible que al ver los resultados del área de deportes decida promover más la práctica de los deportes
menos populares.
Como se puede observar, recolectar y organizar la información sobre poblaciones y variables de interés, le
ayuda a las personas que toman decisiones a estructurar y asignar, de una mejor manera, los recursos que
tienen a su disposición, para el bien de una comunidad o para el mejoramiento de los procesos que se siguen
en una empresa.
4
Universidad EAFIT Pedro Vicente Esteban Duarte
Si se tiene una muestra cuantitativa x1 , x2 , x3 , ..., xi, ..., xn de tamaño n, la media o promedio de la muestra
está dada por:
n
xi x1 + x2 + ... + xi + ... + xn
x=∑ =
i=1 n n
La media (x) permite hacer inferencias acerca de los datos de la población de la que proviene la muestra,
puesto que no siempre es posible tener todos los datos de la población.
Por ejemplo, en un grupo de octavo hay 30 estudiantes que presentaron el examen del período de mate-
máticas, se seleccionaron aleatoriamente 6 estudiantes y se les preguntó por su resultados, obteniendo lo
siguiente:
8, 6, 7, 8, 8, 5
6
xi 5 + 6 + 7 + 8 + 8 + 8
x=∑ = =7
i=1 6 6
Se puede interpretar que x = 7, es un resultado cercano al promedio de las notas de toda la población
observada.
a. La media (x) es un valor que se encuentra entre el dato menor y el dato mayor.
5
Universidad EAFIT Pedro Vicente Esteban Duarte
b. La media es muy sensible a datos pequeños. Si en nuestro ejemplo, se hubieran seleccionado solamente
los estudiantes que perdieron el examen la media no sería un valor representativo de las notas del grupo
de estudiantes.
c. La media es muy sensible a datos grandes. Si en nuestro ejemplo, se hubieran seleccionado solamente
los estudiantes que ganaron el examen la media no sería un valor representativo de las notas del grupo
de estudiantes.
Ejercicio
a. $ 635
b. $ 618.57
c. $ 617.20
d. $ 611
La mediana es el dato que se encuentra en el centro de una muestra ordenada, note que para hallarla, los
datos deben ser cuantitativos. Para encontrarlo hay que organizar los datos de menor a mayor o de menor a
mayor. Se tienen dos casos:
Si el tamaño de la muestra es impar, la Me es el dato que se encuentra en todo el centro de los datos después
de ordenarlos. Por ejemplo x1 , x2 , x3 , x4 , x5 , la mediana es x3 .
Si el tamaño de la muestra es par, la Me es el promedio de los dos tatos que están en el centro. Por ejemplo,
si la muestra está dada por x1 , x2 , x3 , x4 , x5 , x6 la mediana es x3 +x
2 . Note que en este caso, la mediana no es
4
un dato de la muestra.
La mediana indica que dato se encuentra en el centro de la muestra y por lo tanto da información sobre la
cantidad de datos que están a la izquierda o a la derecha de ese valor en la muestra.
6
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. $ 630
b. $ 625
c. $ 620
d. $ 610
Ejercicio
a. $ 630.5
b. $ 625
c. $ 622
d. $ 622.5
La moda (Mo ) es el dato que más se repite (que tiene mayor la frecuencia) en la muestra. Si dos datos
diferentes tienen la mayor frecuencia en la muestra, se dice que la muestra es bimodal.
Por ejemplo, para la muestra de las ocho tiendas que venden jabón de barra, se recolectaron los siguientes
datos:
7
Universidad EAFIT Pedro Vicente Esteban Duarte
Por lo tanto la moda es Mo = 630, que es el dato que más se repite en la muestra tomada.
A la entrada al estadio se observan los tipos de comidas rápidas que consumen las personas que ingresan
a ver un partido de fútbol. Se tomó una muestra de tamaño 8 y se observó lo siguiente: hamburguesa,
hamburguesa, perro, perro, hamburguesa, perro, hamburguesa, salchipapa. A partir de esta muestra se puede
afirmar que la moda es la "hamburguesa", que es la comida rápida que más consumen los hinchas del equipo
al que van a ver jugar.
Ejercicio
b. 7 minutos.
c. 5 minutos.
Los valores media (x), mediana, (Me ), moda (Mo ), son estadísticos que se clasifican como de tendencia
central. Otros estadísticos como el rango, la varianza y la desviación estándar indican medidas de dispersión
de la muestra.
Rango R de una muestra cuantitativa es la diferencia entre el mayor y menor dato de la muestra. Es una
medida de la dispersión de los datos de la muestra.
R = xmax − xmin
Para la muestra de la tardanza de los estudiantes al Colegio: 15, 5, 6, 6, 7, 8, 10, 9, 2, 7, se tiene que
R = xmax − xmin = 15 − 2 = 13
8
Universidad EAFIT Pedro Vicente Esteban Duarte
minutos.
Este valor indica que entre la menor y la mayor tardanza hay 13 minutos de diferencia.
Note que para datos cualitativos no tiene sentido hablar del rango de una muestra.
Ejercicio
a. $ 10
b. $ 15
c. $ 20
d. $ 30
La varianza de los datos de una muestra, es una medida de dispersión y se puede calcular en relación
a diferentes valores: a la media, la mediana, la moda, o cualquier otro valor de interés de la muestra.
Generalmente se hace con relación a la media de la muestra. Si la muestra es de tamaño n, la varianza está
dada por:
n
(xi − x)2
s2 = ∑
i=1 n
o por
n
(xi − x)2
s2 = ∑
i=1 n − 1
Se puede definir como el “casi promedio” de los cuadrados de las desviaciones ((xi − x)2 ) de los datos con
respecto a la media (x) muestral.
Si se utiliza la segunda fórmula, lo que se está indicando es que se está teniendo en cuenta los “grados de
libertad” de la muestra. Esto indica que para calcular la varianza ya se ha utilizado un vez los datos (para
9
Universidad EAFIT Pedro Vicente Esteban Duarte
calcular x) por lo tanto se ha perdido un grado de libertad. En la calculadora o en el Excel r para calcular
este estadístico, se utiliza la segunda fórmula. En los ejemplos que siguen y en los problemas planteados,
se utilizará, también, la segunda fórmula.
n
(xi − X )2
σ2 = ∑
i=1 N − 1
Calcular estadísticos para toda la población resulta “casi” imposible en la mayoría de los casos. Es por ello
que se hacen inferencias para toda la población a partir de los estadísticos muestrales.
Note que la varianza muetral se denota por s2 y la poblacional por σ2 , la media muestral por x y la pobla-
cional por X. Siempre hay que estar atentos a lo que se quiere calcular.
Por ejemplo, para un grupo de octavo de 30 estudiantes que presentaron el examen del período de Mate-
máticas, se seleccionaron aleatoriamente 6 estudiantes y se les preguntó por su resultados obteniendo lo
siguiente:
8, 6, 7, 8, 8, 5
6
xi 5 + 6 + 7 + 8 + 8 + 8
x=∑ = =7
i=1 6 6
n
(xi − x)2 (8 − 7)2 + (6 − 7)2 + (7 − 7)2 + (8 − 7)2 + (8 − 7)2 + (5 − 7)2 8
s2 = ∑ = = = 1.6
i=1 n − 1 6−1 5
Note que la varianza tiene unidades cuadradas, que en la mayoría de las aplicaciones no tiene sentido
práctico. Por ello, se utiliza la desviación estándar como una unidad de la medida de la dispersión de los
datos de una muestra.
10
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. $ 121.42
b. $ 600
c. $ 615
d. $ 120.15
2.6. Cuartiles
Son medidas de posición que dividen en cuatro partes porcentuales iguales a una distribución ordenada de
datos. Esto quiere decir, que si se van a encontrar los cuartiles para una muestra específica hay que ordenar
los datos.
25 % 25 % 25 % 25 %
Q1 Q2 Q3
Como puede observarse en la gráfica, los tres cuartiles, dividen los datos en cuatro partes iguales, en las que
entre cada uno de ellos está el 25 % de los datos de la muestra.
Esto quiere decir que el 25 % de los datos son menores o iguales que Q1 . El 50 % de los datos son menores
o iguales que Q2 . El 75 % de los datos son menores o iguales que Q3 .
n
Qk = k
4
Ejemplo
11
Universidad EAFIT Pedro Vicente Esteban Duarte
Se tomó una muestra aleatoria de tamaño 20 de la temperatura en grados centígrados a las dos de la tarden
en el Centro de Medellín. Los datos obtenidos fueron los siguientes:
18, 25, 27, 19, 30, 22, 23, 24, 27, 29, 21, 30, 31, 17, 28, 27, 22, 23, 25, 26, 19
Q1 = 1 20
4 = 5, quiere decir que el quinto dato, en la muestra ordenada, corresponde con el primer cuartil.
20
Q2 = 2 = 10, quiere decir que el décimo dato, en la muestra ordenada, corresponde con el segundo
4
cuartil.
Q3 = 3 20 4 = 15, quiere decir que el dato en la posición quince, en la muestra ordenada, corresponde con
el tercer cuartil.
17, 18, 19, 19, 21, 22, 22, 23, 23, 24, 25, 25, 26, 27, 27, 27, 28, 29, 30, 30, 31
Q1 = 21, que es el dato que está en la posición 5 en la muestra ordenada. Se puede interpretar que el 25 %
de los días observados, la temperatura en Medellín, a las 2 de la tarde era menor a 21 grados centígrados.
Q2 = 24, que es el dato que está en la posición 10 en la muestra ordenada. Se puede interpretar que el 50 %
de los días observados, la temperatura en Medellín, a las 2 de la tarde era menor a 24 grados centígrados.
Q3 = 27, que es el dato que está en la posición quince en la muestra ordenada. Se puede interpretar que
el 75 % de los días observados, la temperatura en Medellín a las 2 de la tarde era menor a 27 grados
centígrados.
12
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. 3, 5, 9
b. 2, 4, 8
c. 4, 5, 9
d. 3, 5, 8
s
n
(xi − x)2
s= ∑ n
i=1
o por
s
n
(xi − x)2
s= ∑
i=1 n − 1
La desviación estándar tiene las mismas unidades de la variable observada. Se utiliza para encontrar los
datos que se encuentra a una, dos, tres o más desviaciones estándar de la media. En lo que sigue, se utilizará
la segunda fórmula para encontrar la desviación estándar de una muestra.
13
Universidad EAFIT Pedro Vicente Esteban Duarte
3s 2s s x s 2s 3s
Por ejemplo, para un grupo de octavo de 30 estudiantes, que presentaron el examen del período de mate-
máticas, se seleccionaron aleatoriamente 6 estudiantes y se les preguntó por su resultados obteniendo lo
siguiente:
8, 6, 7, 8, 8, 5
6
xi 5 + 6 + 7 + 8 + 8 + 8
x=∑ = =7
i=1 6 6
n
(xi − x)2 (8 − 7)2 + (6 − 7)2 + (7 − 7)2 + (8 − 7)2 + (8 − 7)2 + (5 − 7)2 8
s2 = ∑ = = = 1.6
i=1 n − 1 6−1 5
√ √
La desviación estándar es s = s2 = 1.6 = 1.26
La media de la muestra es x = 7. Como la varianza se calculó con respecto a la media muestral, este valor
se coloca en el centro de la línea.
14
Universidad EAFIT Pedro Vicente Esteban Duarte
Por lo tanto, los valores de la muestra que están a una distancia de una desviación estándar de la media
muestral son lo que están en el intervalo:
x − s < xi < x + s ⇒ 7 − 1.26 < xi < 7 + 1.26 ⇒ 5.74 < xi < 8.26
De acuerdo con lo observado en la muestra dada, los valores encontrados son: 6, 7, 8, 8 y 8. Note que la
mayoría de los valores están a una desviación estándar de la media. Esto indica que la mayoría de los datos
están agrupados alrededor de la media, a una desviación estándar.
Los que están a dos desviaciones estándar de la media, están en los intervalos, dados por 4.48 < xi < 5.74
o 8.26 < xi < 9.52. En este ejemplo, el único dato que cumple estas condiciones es x = 5.
Los intervalos que están a tres desviaciones estándar de la media son 1.22 < xi < 4.48 o 9.52 < xi < 10.78.
Para los datos analizados, ninguno se encuentra a tres desviaciones de la media.
Recordar que el rango, la varianza muestral (s2 ) y la desviación estándar (s) son medidas de la dispersión
de los datos.
Por ejemplo, si para el mismo grupo de estudiantes, los resultados de la encuesta hubieran sido los siguien-
tes: 5, 10, 8, 6, 9, 4. Al encontrar la media, el rango, la varianza y la desviación estándar se obtienen los
siguientes resultados:
El rango es R = 10 − 4 = 6 que es mayor que el anterior que fue de 3. Indicando una mayor dispersión de
los datos.
La varianza muestral, s2 = 5.6, que comparada con la anterior (s2 = 1.6), lo que confirma una mayor
dispersión de los datos.
La desviación estándar muestral, s = 2.36 es mayor que la anterior que era s = 1.26, indicando una mayor
dispersión de los datos de la muestra.
Al colocar la media, la primera, segunda y tercera desviaciones estándar muestrales sobre una recta se
obtiene:
Los datos de la muestra, que están a una desviación estándar de la media son: 5, 6, 8 y 9.
15
Universidad EAFIT Pedro Vicente Esteban Duarte
Los datos de la muestra, que están a dos desviación estándar de la media son: 4 y 10
Ejemplo
En una institución educativa se tomó una muestra al azar, de tamaño n = 30, y se les preguntó a los alumnos
sobre las notas obtenidas en el área del lenguaje, para el segundo período académico. Los datos recolectados
fueron los siguientes:
2, 10, 4, 5, 6, 7, 9, 3, 7, 4, 7, 9, 10, 2, 1, 5, 6, 7, 8, 8, 8, 4, 9, 2, 4, 7, 6, 5, 7, 9
Resolver cada uno de los siguientes aspectos relacionados con la muestra dada:
c. La moda
d. La mediana
e. El rango
f. La varianza
g. La desviación estándar
h. Los datos de la muestra que están a una, dos y tres desviaciones estándar de la media.
Solución
a. La variable dada es cuantitativa, pues tiene sentido realizar operaciones aritméticas con los datos sumi-
nistrados. La variable observada es: la calificación obtenida en el área de lenguaje de una muestra de 30
estudiantes en una institución educativa.
b. La media muestral está dada por:
n
xi
x=∑ = 6.03
i=1 n
lo cual indica que en promedio los estudiantes, en el segundo período académico, ganaron el área de
lenguaje, pero con una nota baja. Esto debería alertar a los profesores del área para tomar medidas
correctivas y mejorar los procesos evaluativos, de enseñanza, entre otros.
c. La moda es el dato que más se repite en la muestra. Este es Mo = 7, indica que la mayoría de los
estudiantes en la muestra, tienen esta nota como calificación.
16
Universidad EAFIT Pedro Vicente Esteban Duarte
d. La mediana de la muestra, es el dato que se encuentra en el centro. Como la muestra es de tamaño n = 30,
que es par, se deben de tomar los datos que están en el centro y encontrar su promedio. Al ordenar los
datos se obtiene:
1, 2, 2, 2, 3, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10
Los dos datos que están resaltados en negro son los que se encuentran en el centro de la muestra después
de ordenarla. Por lo tanto Me = 6+7
2 = 6.5. Este valor no se encuentra en los datos analizados. Indica que
a la derecha de 6.5 hay la misma cantidad de datos que a la izquierda del mismo valor.
e. El rango es la diferencia entre el dato mayor y el dato menor. En este caso, entre 10 y 1. Por lo tanto
R = 10 − 1 = 9, que indica que la muestra es dispersa.
f. La varianza esta dada por:
30
2 (xi − x)2
s =∑ = 6.44
i=1 30 − 1
esto indica que los datos recolectados son dispersos. Al encontrar los intervalos para la primera, segunda
y tercera desviación estándar con respecto a la media y graficarlos se obtiene:
h. Los datos de la muestra que están a una, dos y tres desviaciones estándar de la media.
A una desviación estándar de la media muestral, están los datos que se encuentran en el intervalo:
3.5 < xi < 8.56, estos son: 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8
Los que están a dos desviaciones estándar de la media muestral son los que están en el intervalo: 0.97 <
xi < 3.5 unido 8.56 < xi < 11.09, estos son: 1, 2, 2, 2, 3, 9, 9, 9, 9, 10, 10
No hay datos que se encuentren a tres desviaciones estándar de la media muestral.
i. Los estadísticos asociados con una muestra aleatoria son herramientas valiosas en la toma de decisiones,
para las personas del área de la que proviene la muestra, en este caso, del área de lenguaje de una
institución educativa. Los profesores pueden tomar acciones para que las notas no estén tan dispersas,
subir más el promedio, entre otras.
17
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejemplo
En una encuesta realizada a 30 estudiantes de una escuela femenina, acerca del color de la blusa que prefie-
ren usar el fin de semana. Se obtuvieron los siguientes resultados:
Azul, Verde, Amarillo, Azul, Azul, Verde, Verde, Amarillo, Rojo, Rojo, Rojo, Verde, Verde, Azul, Azul,
Amarillo, Negro, Negro, Verde, Verde, Rojo, Azul, Azul, Verde, Azul, Verde, Negro, Anaranjado, Negro,
Verde
b. De acuerdo con el tipo de variable, encuentre los estadísticos que son pertinentes.
Solución
a. La variable observada es: El color de la blusa que prefieren usar las estudiantes de una escuela los fines
de semana. La variable es cualitativa, pues no es posible realizar, con los datos y operaciones aritméticas
que tengan sentido matemático.
b. De acuerdo con los datos suministrados, el estadístico pertinente es la moda. Para poder mirar, con
facilidad los datos que se repiten, los organizamos de acuerdo con el orden alfabético, de donde se
obtiene:
Amarillo, Amarillo, Amarillo, Anaranjado, Azul, Azul, Azul, Azul, Azul, Azul, Azul, Azul, Negro,
Negro, Negro, Negro, Rojo, Rojo, Rojo, Rojo, Verde, Verde, Verde, Verde, Verde, Verde, Verde, Verde,
Verde,Verde
Al realizar el recuento se observa que el color que más se repite es el “Verde”, por lo tanto, ese color es
la moda.
Cuando se tienen muestras grandes, es preferible utilizar técnicas de agrupamiento de los datos. Estas
técnicas permiten realizar distintos gráficos que pueden ser útiles para presentar e interpretar la información,
bien sea de tipo cualitativo o cuantitativo.
Observación
Hay datos que pueden presentarse como números, pero en realidad representan datos cualitativos.
Por ejemplo: 10 , 20 , 30 40 , ..., que pueden ser los lugares en los que llegaron los corredores en una compe-
tencia atlética. Hay que tener cuidado con el tipo de dato que se presenta para saber los estadísticos que se
pueden calcular a partir de ellos.
18
Universidad EAFIT Pedro Vicente Esteban Duarte
Para agrupar los datos de una muestra aleatoria, hay que tener en cuenta si estos son cualitativos o cuanti-
tativos.
Si los datos son cualitativos, se puede formar una categoría o clase por cada una de las cualidades de los
datos de la muestra, por ejemplo, si corresponden a:
a. Colores: cada uno de los colores de la muestra puede ser una categoría o clase.
b. Si corresponden a “bueno”, “regular” o “malo”, los datos que correspondan a una de estas características
puede formar una categoría o clase.
Si los datos son cuantitativos, se pueden formar intervalos para agruparlos. Cada uno de los intervalos
definidos forman una categoría o clase.
Observación
Hay que tener en cuenta que tanto para variables cualitativas o cuantitativas, un mismo dato o valor no
puede pertenecer a dos categorías o clases distintas. Es decir, al definir las clases, estas deben ser disyuntas.
Existen varias fórmulas para calcular el número de clases (Nc ) para datos cuantitativos. Si la muestra es de
tamaño n, se tiene las siguientes formas:
a. A partir de la regla de Sturges, que propone que el número de clases para agrupar los datos de una
muestra de tamaño n está dado por Nc = 1 + 3.332 log10 (n).
Así, por ejemplo, para una muestra cuantitativa de tamaño n = 30, el número de clases a utilizar es:
Nc = 1 + 3.332 log10 (30) = 1 + (3.332)(1.477) = 5.9 clases. La persona encargada de procesar la infor-
mación debe tomar la decisión de considerar 5 ó 6 clases.
c. Otro criterio para calcular el número de clases, para agrupar los datos de una muestra de tamaño n, es
que si 20 ≤ n ≤ 100, el número máximo de clases es 5.
19
Universidad EAFIT Pedro Vicente Esteban Duarte
d. Al encontrar el número de clases y comenzar a ubicar los datos en cada una de las clases, se sugiere que
no quede ninguna clase sin datos.
Observación
Como se puede apreciar, el cálculo de clases es un método empírico y una buena distribución de los datos
está asociada con la experiencia del investigador, del tipo de datos y de los fines para los que se va a utilizar
la información.
A partir de la determinación del número de clases hay que calcular el ancho (Ac) de cada una de ellas. Para
esto se divide el rango (R) de la muestra, entre el número de clases definidas, esto es:
Rango R
Ac = =
Número de clases Nc
Luego de determinar el número de clases y del ancho de las clases se procede a calcular cada una de las
clases. Para ello se parte del dato menor.
Para calcular las clases se construyen intervalos que tengan el ancho (Ac ) de la clase determinado, partiendo
del dato menor encontrado en la muestra.
En el primer intervalo a construir se tiene como extremo inferior el dato menor de la muestra y como
extremo superior, el dato menor más el ancho de la clase. Hay que determinar cuál de los extremos es
abierto y cuál cerrado. Cabe recordar que los intervalos no deben de tener valores en común, puesto que un
dato no puede ser ubicado en dos clases distintas. Para calcular las otras clases se procede de igual forma.
Ejemplo
En una institución educativa se tomo una muestra al azar, de tamaño n = 30, y se les pregunto a los alumnos
sobre las notas obtenidas en el área del lenguaje para el segundo período académico. Los datos recolectados
fueron los siguientes:
2, 10, 4, 5, 6, 7, 9, 3, 7, 4, 7, 9, 10, 2, 1, 5, 6, 7, 8, 8, 8, 4, 9, 2, 4, 7, 6, 5, 7, 9
20
Universidad EAFIT Pedro Vicente Esteban Duarte
Determine:
a. El rango R de la muestra.
b. El número de clases Nc .
Solución
a. El rango R de la muestra está dado por la diferencia entre el dato mayor, menos el dato menor. El dato
mayor es 10 y el menor 1.
R = 10 − 1
b. Para calcular el número de clases Nc , se parte del tamaño de la muestra, en este caso n = 30. Si se utiliza
la fórmula de Sturges, se tiene que Nc = 1 + 3.332 log10 (30) = 1 + (3.332)(1.477) = 5.9
Ahora, si se determina a partir de la raíz cuadrada del tamaño de la muestra se tiene que:
√
Nc = 30 = 5.47
Si se tiene en cuenta que el tamaño de la muestra es n = 30, que es un número entre 20 y 100, se sugiere
no tener más de 5 clases.
Por lo tanto, se toma Nc = 6
c. El ancho de las clases está dado por el cociente entre el rango y el número de clases.
R 9
AC = = = 1.8
Nc 5
d. Determine las clases.
Para la construcción, teniendo en cuenta que las clases deben ser disyuntas, se tomará la convención de
que el extremo izquierdo es cerrado y el derecho abierto.
Cálculo de la primera clase
Se parte del dato menor, en este caso es 1. Este valor se toma como el extremo inferior de la primera
clase. El extremo superior es el dato menor más el ancho de clase, esto es 1 + Ac = 1 + 1.8 = 2.8
Por lo tanto, la primera clase está determinada por el intervalo [1, 2.8)
Cálculo de la segunda clase
Para la segunda clase, se toma como extremo inferior, el extremo superior de la primera clase, esto es
2.8. Para el extremo superior se le suma el ancho de la clase, esto es 1.8 + Ac = 1.8 + 1.8 = 3.6.
21
Universidad EAFIT Pedro Vicente Esteban Duarte
Para determinar las otras clases se procede de igual forma, de dónde se tiene que:
Primera clase: [1, 1.8)
Segunda clase: [1.8, 3.6)
Tercera clase: [3.6, 5.4)
Cuarta clase: [5.4, 7.2)
Quinta clase: [7.2, 9)
Como se puede observar en la muestra, los datos con valores 9 o 10 no están dentro de ninguna de las
clases construidas. En un estudio estadístico, hay que tener en cuenta todos los datos suministrados. Para
incluirlos, se tiene dos posibilidades: (a) ampliar la última clase, que en este caso sería [7.2, 10], pero
quedaría con muchos datos, (b) con los datos excluidos crear una nueva clase, en este caso sería [9, 10].
En este ejemplo se decidió utilizar la segunda opción expuesta. Note que en todas las clases hay datos.
Para continuar estudiando la muestra, se colocan las clases en una tabla como la siguiente:
Clase
[1, 1.8)
[1.8, 3.6)
[3.6, 5.4)
[5.4, 7.2)
[7.2, 9)
[9, 10]
Totales
Note que al tabular las clases, estas se ubican de arriba hacia abajo, en el orden en que se fueron construyen-
do. Esto es muy importante, puesto el buen análisis de los resultados obtenidos se basa en hacer los proceso
ordenadamente.
Después de determinar las clases hay que contar los datos que hay en cada una de ellas. Para ello se hace un
recuento, que se puede hacer más fácilmente a partir del ordenamiento de los datos suministrados. Esto es:
1, 2, 2, 2, 3, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 9, 9, 10, 10
De esta forma, para la primera clase se cuentan los datos que están en el intervalo [1, 1.8), que en este caso
es únicamente el 1.
Para la segunda clase, se cuentan todos los datos que están en el intervalo [1.8, 3.6), que corresponden a los
datos iguales a 2 y a 3.
22
Universidad EAFIT Pedro Vicente Esteban Duarte
Clases Recuento
[1, 1.8) |
[1.8, 3.6) ||||
[3.6, 5.4) |||||||
[5.4, 7.2) |||||||||
[7.2, 9) |||
[9, 10] ||||||
Totales 30
La frecuencia simple fi se encuentra para cada una de las clases, que se han determinado para la muestra
dada, es el número de datos que hay en cada una de las clases. En el ejemplo, anterior para la clase [5.4, 7.2)
la frecuencia relativa es f = 9, que es el resultado del recuento de los datos que están en ese intervalo. La
tabla se puede seguir ampliando de la siguiente manera:
Clases Recuento fi
[1, 1.8) | 1
[1.8, 3.6) |||| 4
[3.6, 5.4) ||||||| 7
[5.4, 7.2) ||||||||| 9
[7.2, 9) ||| 3
[9, 10] |||||| 6
Totales 30 30
Para la frecuencia simple se pueden realizar gráficas de barras horizontales o verticales, denominadas his-
togramas de frecuencias. Hacer uno de los dos tipos de estos dos gráficos está en función de la información
que se tenga y de la forma como el investigador prefiera presentarla. Si se realiza un histograma vertical, en
el eje horizontal se escriben las clases y en el vertical las frecuencias de cada una de ellas, como se muestra
en la Figura 2. Note la facilidad con la que se puede leer la información al graficarla.
23
Universidad EAFIT Pedro Vicente Esteban Duarte
La frecuencia simple acumulada Fi , para una clase cualquiera, es la suma de todas las frecuencias simples
de las clases anteriores más la frecuencia simple de la clase que se está observando.
Por ejemplo, Fi par la clase [3.6, 5.4) es las suma de 1 +4 +7 = 12 que es la suma de las frecuencias simples
de las clases que son anteriores a ella, más la frecuencia simple de la misma clase. Los resultados obtenidos
se muestran en la siguiente tabla:
Clases Recuento fi Fi
[1, 1.8) | 1 1
[1.8, 3.6) |||| 4 5
[3.6, 5.4) ||||||| 7 12
[5.4, 7.2) ||||||||| 9 21
[7.2, 9) ||| 3 24
[9, 10] |||||| 6 30
Totales 30 30
24
Universidad EAFIT Pedro Vicente Esteban Duarte
La frecuencia relativa ( fr ), se obtiene al dividir cada una de las frecuencias simples ( fi ) por el número de
datos de la muestra.
La frecuencia relativa acumulada (Fr ) se obtiene dividiendo cada una de las frecuencias acumuladas por el
número de datos de la muestra. Note que la mayor frecuencia relativa acumulada es 1, que corresponde a la
última clase.
Clases Recuento fi Fi fr Fr
[1, 1.8) | 1 1 1/30 1/30
[1.8, 3.6) |||| 4 5 4/30 5/30
[3.6, 5.4) ||||||| 7 12 7/30 12/30
[5.4, 7.2) ||||||||| 9 21 9/30 21/30
[7.2, 9) ||| 3 24 3/30 24/30
[9, 10] |||||| 6 30 6/30 30/30
Totales 30 30
Tanto la frecuencia relativa porcentual ( fr %), como la frecuencia relativa acumulada porcentual (Fr %), se
obtienen multiplicando las respectivas frecuencias por 100.
7
Por ejemplo para la clase [3.6, 5.4), la frecuencia relativa fr = 30 , por lo tanto la frecuencia relativa porcen-
tual es fr % = fr (100) = 23.333, lo que significa que el porcentaje de los datos de la muestra que están en
esta clase es el 23.333 por ciento.
Para la misma clase, por ejemplo para la clase [3.6, 5.4), la frecuencia relativa acumulada porcentual es
12
Fr % = Fr (100) esto es Fr % = Fr (100) = 30 (100) = 0.4(100) = 40, lo que significa que el 40 por ciento de
los datos de la muestra están en esta clase unida a los datos de las anteriores.
Al completar la tabla con estos nuevos valores se obtiene (ver Tabla 1):
25
Universidad EAFIT Pedro Vicente Esteban Duarte
Clases Recuento fi Fi fr Fr fr % Fr %
Totales 30 30
Para la frecuencia relativa porcentual, un tipo de gráfica que se utilizan son las llamadas “tortas” en las que
es más fácil observar el porcentaje de tiene cada una de las clases.
A partir de completar una tabla como está se pueden hacer muchas preguntas relativas a la muestra y sus
respuestas se pueden extrapolar a toda la población.
26
Universidad EAFIT Pedro Vicente Esteban Duarte
Así, por ejemplo, ¿cuál es el porcentaje de alumnos que obtuvieron notas de 6 ó 7? Para encontrar la
respuesta a esta pregunta, se observa que estas notas pertenecen a la clase [5.4, 7.2) que su frecuencia relativa
9 9
( fr ) es fr = 30 . Es preferible entregarla en términos de porcentajes, por lo que se tiene fr % = 30 (100) = 30.
Lo que significa que el 30 % de los alumnos de la muestra tienen notas de 6 ó 7. Si la muestra está bien
tomada y es representativa de la población, este resultado se puede generalizar a toda la población diciendo:
que el 30 % de los alumnos de la institución educativa, en el área de español, aproximadamente, obtuvieron
una nota de 6 ó 7.
Otra pregunta que se podría formular es: ¿qué porcentaje de estudiantes perdió la prueba de español en el
segundo período? La respuesta se puede obtener a partir de la frecuencia relativa acumulada porcentual. Para
ello se observa que que las notas xi ≤ 5 están en la unión de las clases [1, 1.8), [1.8, 3.6) y [3.6, 5.4). Toda la
frecuencia relativa acumulada porcentual (Fr %), se encuentra en la clase [3.6, 5.4). Es decir, (Fr %) = 40,
lo que indica que el 40 por ciento de los estudiantes en la muestra, perdieron la prueba de español en el
segundo período. Como en le caso anterior, si la muestra esta bien tomada y es representativa del Área
de Lenguaje, se puede afirmar que aproximadamente el 40 % de los estudiantes de esa institución, en el
segundo período perdieron el Área de Lenguaje.
Ejercicio
b. 30 por ciento.
c. 40 por ciento.
d. 70 por ciento.
Ejercicio
27
Universidad EAFIT Pedro Vicente Esteban Duarte
Para agrupar datos de una muestra aleatoria cualitativa, fundamentalmente, se siguen los mismos pasos que
para una muestra cuantitativa. Las clases se definen a partir de las cualidades de la muestra. Si son colores,
cada uno de los colores puede definirse como una clase, si son preferencias por equipos de fútbol, cada uno
de los equipos puede definirse como una clase, el investigador debe de tener claro las cualidades que quiere
observar en un conjunto de datos y de esta forma tener criterios para agrupar los datos.
Ejemplo
En una encuesta realizada a 30 estudiantes de una escuela femenina, acerca del color de la blusa que prefie-
ren usar el fin de semana. Se obtuvieron los siguientes resultados:
Azul, Verde, Amarillo, Azul, Azul, Verde, Verde, Amarillo, Rojo, Rojo, Rojo, Verde, Verde, Azul, Azul,
Amarillo, Negro, Negro, Verde, Verde, Rojo, Azul, Azul, Verde, Azul, Verde, Negro, Anaranjado, Negro,
Verde
c. Encuentre la frecuencia de que las niñas usen blusa azul el fin de semana.
d. Encuentre la frecuencia relativa de las niñas que usan blusa verde o roja el fin de semana.
Solución
28
Universidad EAFIT Pedro Vicente Esteban Duarte
Clases Recuento fi Fi fr Fr fr % Fr %
Totales 30 30
d. La frecuencia relativa de las niñas que usan blusa verde o roja el fin de semana, es la frecuencia relativa
de las niñas que usan blusa verde más las que usan blusa roja. Esto es:
10 4
frv + frr = (100) + (100) = 33.333 + 13.333 = 46.666
30 30
Una interpretación es que los fines de semana, las niñas del colegio, utilizan blusa azul o roja, aproxi-
madamente, en un 46.666 por ciento.
Ejercicio
b. 10 por ciento.
d. 40 por ciento.
29
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
4. Actividades de ejercitación
En un colegio se tomó una muestra aleatoria de tamaño 50. Se le preguntó a los alumnos por su apreciación
acerca de la calidad del mismo. Los resultados obtenidos fueron los siguientes:
Bueno, Regular, Bueno, Excelente, Excelente, Regular, Regular, Bueno, Bueno, Bueno, Bueno, Malo,
Bueno, Bueno, Bueno, Excelente, Excelente, Malo, Bueno, Bueno, Excelente, Excelente, Excelente, Bueno,
Bueno, Bueno, Regular, Excelente, Malo, Regular, Regular, Bueno, Malo, Regular, Excelente, Bueno,
Bueno, Malo, Bueno, Regular, Excelente, Excelente, Malo, Bueno, Regular, Excelente, Excelente, Malo,
Malo, Bueno
c. Complete la Tabla 3.
d. La frecuencia relativa de los estudiantes que tienen una apreciación “Excelente” del colegio es
e. La frecuencia relativa de los estudiantes que tienen una apreciación “Regular” del colegio es
f. La frecuencia acumulada de los estudiantes que tienen una apreciación “Regular” del colegio es
30
Universidad EAFIT Pedro Vicente Esteban Duarte
Clases Recuento fi Fi fr Fr fr % Fr %
Excelente
Bueno
Regular
Malo
Totales
g. La frecuencia relativa porcentual de los estudiantes que tienen una apreciación “Mala” del colegio es
h. La frecuencia acumulada porcentual de los estudiantes que tienen una apreciación “Buena” del colegio
es
En un grado noveno de una institución educativa, hay diversas opiniones sobre cuál es el mejor jugador de
la Selección Colombia. A Jaime se le ocurrió hacer una encuesta sobre las preferencias de sus compañeros,
obteniendo los resultados que se muestran en la Tabla 4.
d. Complete la Tabla 4.
e. Encuentre la frecuencia relativa para “James” y “Cuadrado”. De una intepretación de cada uno de los
resultados.
31
Universidad EAFIT Pedro Vicente Esteban Duarte
Clases Recuento fi Fi fr Fr fr % Fr %
Cuadrado |||| ||
Bonilla ||||
Totales
4.2.1. Histograma
En el siguiente histograma de la Figura 3, página 33, se presenta el control de peso de 50 recién nacidos.
32
Universidad EAFIT Pedro Vicente Esteban Duarte
Clases Recuento fi Fi fr Fr fr % Fr %
(0, 1]
(1, 2]
(2, 3]
(3, 4]
(4, 5]
Totales
33
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
Se le preguntó a 200 estudiantes sobre su materia preferida. El gráfico en la Figura 4, de la página 34,
representa los resultados obtenidos:
c. Según el diagrama circular indicar la cantidad de estudiantes que prefieren cada materia.
d. Realiza un diagrama de barras horizontales sobre la preferencia de materias utilizando los datos del
ejercicio anterior.
f. Organiza las materias en orden de preferencia, iniciando por la materia que menos gusta, hasta la que
más agrado representa para los estudiantes. ¿Cuál materia queda en la mitad?
34
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
La siguiente gráfica muestra los resultados obtenidos en un estudio sobre lo que ahorra semanalmente cada
uno de los jóvenes de un curso.
5. Reglas de conteo
En diferentes actividades de la vida diaria es necesario saber de cuántas maneras o formas se puede realizar
una actividad o proceso. Algunas preguntas que normalmente se hacen las personas son: (a) De cuántas
maneras puedo seleccionar números en el Baloto, (b) si tengo cinco camisas, tres pantalones y dos pares
de zapatos, ¿de cuántas formas diferentes me puedo vestir?, (c) en el campeonato de fútbol, ¿de cuántas
formas posibles se pueden seleccionar los ocho equipos que llegan a las semifinales?, entre otras.
35
Universidad EAFIT Pedro Vicente Esteban Duarte
n1 × n2 × n3
maneras diferentes. Note que la regla se puede aplicar para cualquier número de procesos en los que sepa-
mos el número de formas diferentes en las que se puede realizar cada uno.
Ejemplo
Luis tiene 5 pantalones diferentes, 6 correas, 4 camisas y 3 pares de tenis. Encuentre el número de formas
diferentes en las que se puede vestir.
Solución
Por lo tanto, el número de formas diferentes en las que se puede vestir es:
n1 × n2 × n3 × n4 = 5 × 6 × 4 × 3 = 360
Note que con un número reducido de prendas de vestir, puede estar casi todo un año sin repetir la forma de
vestir.
36
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. 12
b. 16
c. 9
d. 4
Si se desea realizar una actividad que tiene formas alternativas para ejecutarse, en la que cada una de ellas
puede hacer de maneras diferentes, se aplica el principio aditivo. Esto es, si la forma alternativa A1 se puede
realizar de n1 maneras diferentes, la A2 se puede realizar de n2 formas diferentes, la A3 se puede realizar de
n3 formas diferentes. Entonces la actividad se puede realizar de n1 + n2 + n3 . formas diferentes.
Ejemplo
Juan va a comprar un coche, le gustan el Mazda (M), el Renault (R) o el Kia (K). Para el Mazda puede
seleccionar el 2, el 3 ó el 6, con los colores rojo, azul o negro. El Renault puede seleccionar entre Clio,
Logan o Sandero con colores verde o azul. Para el Kia puede seleccionar entre el Sportage o Sorento con
colores azulo negro. Encuentre las posibilidades de comprar uno de estos vehículos.
Solución
Las formas alternativas son cada una de las marcas: Mazda, Renault o Kia.
Un Mazda se puede seleccionar de 3 por 3 maneras ( tres modelos y tres colores). Es decir que m = 3×3 = 9.
Un Renault se puede seleccionar de 3 por 2 maneras (tres modelos y dos colores). Es decir que r = 3×2 = 6.
Un Kia se puede seleccionar de 2 por 2 maneras (dos modelos y dos colores). Es decir que k = 2 × 2 = 4.
Por lo tanto, teniendo en cuenta las condiciones dadas Juan tiene m+r +k = 9+6+4 = 19 formas diferentes
de seleccionar un vehículo.
37
Universidad EAFIT Pedro Vicente Esteban Duarte
Note que para encontrar el número de posibilidades de realizar las formas alternativas se aplicó el principio
multiplicativo.
Ejercicio
a. 3
b. 6
c. 15
d. 30
Aunque el factorial de un número no es una regla de conteo, este concepto se utiliza para encontrar permu-
taciones o combinaciones de conjuntos de datos. Si n es un entero mayor que cero el factorial de n (n!), es
el producto de todos los enteros positivos menores o iguales que n. Esto es :
Ejercicios
a. 5! = 5 × 4 × 3 × 2 × 1 = 120
7! 7×6×5!
b. 5! = 5! = 42
38
Universidad EAFIT Pedro Vicente Esteban Duarte
Note que para simplificar expresiones que contengan factorial, este se puede expresar como:
n! = n(n − 1)!
Ejercicio
10!
Al expandir 10! y simplificar , se obtiene, respec-
7!
tivamente
a. 1.500.700 y 720
b. 3.628.800 y 720
c. 10.000 y 72
d. 3.628.800 y 1000
Los conceptos de permutaciones y combinaciones ayudan a establecer el número de maneras en las que
se puede realizar una tarea, dependiendo si importa o no el orden. Para ello es necesario establecer en que
casos se aplican las permutación las combinaciones.
Permutación: aquí importa el orden y la posición de un elemento en un arreglo. Por ejemplo, seleccionar
el primer, segundo, tercero y cuarto puestos en un campeonato de voleibol de playa jugado entre 10
equipos.
Combinación: se utiliza en arreglos de elementos en donde no interesa el lugar o posición que ocupa cada
uno de los elementos que lo conforman. Por ejemplo, seleccionar 5 niños de la clase de matemáticas
para representar al grupo en un concurso.
5.4.1. Permutaciones
Se tienen 7 alumnos que están concursando para obtener los tres primeros lugares en un concurso de len-
guaje. ¿De cuántas maneras se pueden seleccionar el primero, segundo y terceros lugares?
39
Universidad EAFIT Pedro Vicente Esteban Duarte
Para ocupar el segundo lugar, después de que se selecciona el primero, solo quedan 6 posibilidades.
Para el tercer lugar, después de seleccionar el primero y el segundo, solo quedan 5 posibilidades.
Al aplicar el Principio multiplicativo se tiene que el número de posibilidades de seleccionar los tres primeros
lugares es 7 × 6 × 5 = 210 maneras posibles.
n!
P(n, r) = nPr =
(n − r)!
Ejemplo
En una carrera automovilística compiten 6 autos. El orden de largada se hace totalmente al azar. Encontrar
el número de posibilidades para seleccionar el orden de la largada.
En este caso importan el orden, por lo tanto se trata de una permutación. Note que n = 6 y r = 6. Todos los
seis autos van a competir. Por lo tanto se tiene que
6! 6! 6!
P(6, 6) = 6P6 = = = = 6(5)(4)(3)(2) = 720
(6 − 6)! 0! 1
Ejercicio
a. 200, 6
b. 8, 3
c. 40.320, 336
d. 336, 40320
40
Universidad EAFIT Pedro Vicente Esteban Duarte
5.4.2. Combinaciones
En un arreglo de tamaño n en el que se quieren extraer r elementos (r ≤ n) en los que no importa el orden,
un elemento pude ocupar cualquiera de las r posibles posiciones. La primera la puede ocupar de r maneras,
la segunda de r − 1 maneras, continuando con este razonamiento, el elemento puede ocupar cualquiera de
las r posiciones de r! maneras. Por lo tanto la fórmula para calcular combinaciones de un arreglo de tamaño
n tomando r elementos es
n n!
= C(n, r) = nCr =
r r!(n − r)!
nPr
C(n, r) =
r!
A partir de la igualdad anterior se puede observar como las combinaciones de r elementos tomados de
n, pueden ser obtenidas a partir de las permutaciones de r elementos tomados de entre n, esto se debe a
que como en las combinaciones no importa el orden de los elementos. Al dividir las permutaciones de
los n elementos entre r!, se está eliminando el orden y por lo tanto transformando las permutaciones en
combinaciones.
Ejemplo
Un grupo de 10 estudiantes de una institución educativa, quiere enviar una representación de 4 de ellos para
hablar con el rector acerca de la realización de un campeonato interno de fútbol. Encuentre el número de
formas en las que se pueden seleccionar a los 4 representantes.
Solución
En este caso no importa el orden. No se están definiendo cargos o diferentes responsabilidades dentro
del grupo que va a representar, por lo tanto la solución se encuentra a partir del uso de la fórmula de las
combinaciones. Aquí, se tiene que n = 10 y r = 4, por lo tanto:
10 10! 10!
= C(10, 4) = 10C4 = = = 210
4 4!(10 − 4)! 4!6!
Formas posibles de seleccionar a los cuatro representantes que hablarán con el rector.
41
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. 4
b. 15.504
c. 5
d. 16.823
Las reglas de conteo son muy importantes en la estadística y la probabilidad. Se debe practicar los suficiente
para poder distinguir entre los diferentes casos que se puedan presentar. A continuación se exponen algunos
ejemplos adicionales:
a. Combinaciones
a. Si se cuenta con 10 alumnos que voluntariamente quieren formar parte del comité de convivencia de
un colegio, ¿de cuántas maneras se pueden seleccionar a seis de ellos?
b. Permutaciones
En un colegio hay 10 equipos de fútbol. Si entre todos ellos juegan un torneo, y tienen las mismas posi-
bilidades de ganar el campeonato, cuántas maneras existen para estar entre los cuatro primeros lugares.
Solución
En un campeonato de fútbol, ningún equipo participante puede ocupar dos lugares a la vez, por lo tanto,
obtener un lugar u otro en la tabla de posiciones son eventos disjuntos. Una forma de solucionar el
ejercicio es aplicando el principio multiplicativo, que dice que si una tarea se puede hacer de n maneras
diferentes y otra tarea distinta se puede hacer de m formas diferentes, las dos tareas se pueden hacer de
n por m maneras diferentes, es decir, nm maneras.
Primer puesto: Se puede obtener de diez (10) maneras diferentes. Hay diez equipos en el campeonato.
Segundo puesto: Al haber un primer puesto ocupado, quedan nueve (9) posibilidades para el segundo.
Tercer puesto: Al continuar con el mismo razonamiento, hay ocho (8) posibilidades de ser ocupado.
Cuarto puesto: Hay siete (7) manera de ser ocupado.
Por lo tanto, seleccionar los cuatro primeros puesto de un campeonato de fútbol, en el que participan 10
equipos se puede hacer de
10 × 9 × 8 × 7 = 5040
42
Universidad EAFIT Pedro Vicente Esteban Duarte
maneras diferentes.
En este caso, el orden que ocupen los equipos si importa, por lo tanto, otra forma de solucionar el
problema es aplicando la fórmula de las permutaciones directamente, es decir:
n!
P(n, r) = nPr =
(n − r)!
en dónde n es el número de elementos del conjunto del que se quieren seleccionar r sin repetición.
En nuestro caso, n = 10 el número de equipos que participan en el campeonato. r = 4, el número de
equipos que se seleccionan para los primeros 4 lugares. Note que ningún equipo puede ocupar dos
lugares. Por lo tanto:
10! 10! 10 × 9 × 8 × 7 × 6 × 5 × 4 × 3 × 2 × 1
P(10, 4) = 10P4 = = = = 10 × 9 × 8 × 7 = 5040
(10 − 4)! 6! 6×5×4×3×2×1
maneras diferentes.
Solución
En este caso, no importa el orden. Cada uno de los estudiantes seleccionados tiene el mismo grado
de importancia: pertenecer a comité. Por lo tanto, el número de formas posibles de hacer la selección
corresponde a una combinación. En este, caso n = 10, el número de todos los estudiantes que quieren
participar. r = 6, el número de estudiantes que se pueden escoger, luego se aplica la fórmula:
n!
C(n, r) = nCr =
r!(n − r)!
Al reemplazar los valores dados, se obtiene:
10! 10! 10 × 9 × 8 × 7 × 6! 10 × 9 × 8 × 7
C(10, 6) = 10C6 = = = = = 5 × 3 × 2 × 7 = 210
6!(10 − 6)! 6! × 4! 6! × 4 × 3 × 2 × 1 4×3×2×1
Por lo tanto hay 210 formas diferentes de seleccionar los miembros de dicho comité.
b. Si entre los 10 alumnos hay 4 mujeres, ¿cuántos de los grupos del comité tendrán a 3 mujeres?
Solución
43
Universidad EAFIT Pedro Vicente Esteban Duarte
De los 10 alumnos hay seis hombres. Si el comité, debe estar conformado por 3 mujeres, entonces se
deben seleccionar tres hombres. En este caso, no importa el orden. Por lo tanto el problema se soluciona
aplicando combinaciones.
Maneras de seleccionar 3 hombres de un total de 6 es C(6, 3) = 6C3 = 20.
Maneras de seleccionar 3 mujeres de un total de 4 es C(4, 3) = 4C3 = 4.
Como elegir a hombres o a mujeres son eventos independientes, para encontrar el total de formas de
seleccionar el comité, con las condiciones dadas, se obtiene aplicando el principio de multiplicación, es
decir:
6! 4!
C(6, 3) ×C(4, 3) = × = 20 × 4 = 80
3!(6 − 3)! 3!(3 − 3)!
Formas diferentes de seleccionar el comité con las condiciones pedidas, es decir, que en el comité hayan
tres mujeres.
c. ¿Cuántos de los grupos del comité contarán con 3 mujeres por lo menos?
Para que en el comité hayan tres mujeres por lo menos, la posibilidad son que hayan comités con 3 ó
con 4 mujeres. Por lo tanto se deben de seleccionar todas las posibilidades de seleccionar comités con 3
mujeres y comités con 4 mujeres y luego sumarlos.
Note que seleccionar comités con 3 mujeres es la solución del problema anterior, luego la respuesta es
C(6, 3) ×C(4, 3) = 80.
Para seleccionar comités con exactamente cuatro mujeres se tiene que tener en cuenta que, en este caso,
los comités contarían solamente con dos hombres, por lo tanto, el número de posibilidades de seleccionar
este tipo de comités es:
C(6, 2) ×C(4, 4) = 15 × 1 = 15
Que es el número de comités que se pueden seleccionar en el que hayan como mínimo 3 mujeres.
44
Universidad EAFIT Pedro Vicente Esteban Duarte
Conclusión
Las reglas de conteo tienen muchas posibilidades de uso. Depende, fundamentalmente, del tipo de ejer-
cicio que se plantea y la forma de solucionarlo.
En cada caso, hay que leer detenidamente para poder seleccionar adecuadamente la regla a aplicar.
La probabilidad es una rama de la matemática que cuantifica numéricamente la posibilidad de que un evento
o suceso ocurra bajo determinadas condiciones. Hay que tener en cuenta que el hecho que se le asigne un
valor a la posibilidad de ocurrencia de un evento eso no quiere decir que siempre que se den esas mismas
condiciones el suceso tiene que ocurrir.
Determinísticos: Aquellos que bajo las mismas condiciones el resultado esperado siempre es el mismo.
Por ejemplo, lanzar una piedra hacia arriba. En este caso se espera que la piedra siempre retorne a la
tierra.
Probabilísticos: Son los eventos en los que a pesar de tener las mismas condiciones el resultado del ex-
perimento no se sabe con anticipación. Por ejemplo, si una persona lanza una piedra varias veces, la
distancia a la que cae no es la misma en cada acción.
Determinísticos y probabilísticos: Son aquellos en que una parte del experimento tiene un resultado de-
terminado y otra es probabilístico. Por ejemplo el costo del recibo de la energía que paga un hogar
mes a mes. La parte determinística está dada por los costos fijos que cobran las empresas públicas por
el mantenimiento de la red eléctrica y la parte probabilística está dada por el costo de los kilovatios
hora que consume el hogar mes a mes. Note que no siempre es el mismo consumo.
Ejercicios
Encuentre en su entorno diferentes fenómenos que cumplan con las características de ser determinísticos o
probabilísticos o que sean de las dos formas a la vez.
Para estudiar el tema de probabilidades hay que comprender dos conceptos previos, estos son: espacio
muestral y evento o suceso.
Espacio muestral
45
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejemplos
Lanzar una moneda al aire es un experimento aleatorio, los resultados posibles son cara (c) o sello (s). Por
lo tanto el espacio muestral se puede definir como el conjunto S = {c, s}.
Otro ejemplo clásico es lanzamiento de un dado y observar el número que queda en la cara superior. El
espacio muestral está dado por: D = {1, 2, 3, 4, 5, 6}
Ejercicio
Evento
Ejemplos
Para el caso del lanzamiento de una moneda los eventos posibles son 0,/ {c}, {s}, {c,s}. Recordar que el
conjunto vacío 0/ es subcojunto de culquier cojunto. Un conjunto es su subconjunto del mismo conjunto.
Cuando el evento es el conjunto vacío (0)
/ se dice que es el evento imposible. Todo el espacio muestral es
un evento seguro.
Para espacios muestrales M finitos de tamaño n, el número posible de eventos es 2n que es el cardinal
(número de elementos), del conjunto de partes de M que es P(M).
son todos los subconjuntos posibles del espacio muestral, por lo tanto, todos los eventos que se pueden
definir.
Definir claramente el espacio muestral de un experimento aleatorio y sus eventos es un requisito fundamen-
tal para poder calcular correctamente las probabilidades asociadas.
46
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. P(A) = {{a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}}
b. P(A) = {0,
/ {a}, {b}, {c}, {a, b}, {a, c}, {b, c}}
c. P(A) = {0,
/ {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}}
d. P(A) = {0,
/ {a}, {b}, {c}, {a, b}, {b, a}, {b, c}, {a, b, c}}
Ejercicio
a. 64
b. 32
c. 20
d. 6
6.1. La probabilidad
Subjetiva: ocurre cuando se le asigna una probabilidad de ocurrencia a un evento o suceso de acuerdo con
la experiencia, la opinión personal o la intuición, que tiene una persona en relación con un suceso o
evento. Por ejemplo, Juan puede afirmar que hay una probabilidad del 60 % de que a las tres de la
tarde del sábado esté lloviendo. Observe que parte de la opinión o experiencia que tiene Juan de la
observación del clima en una determinada época del año.
Clásica o a priori: si un suceso puede ocurrir de n maneras mutuamente excluyentes e igualmente proba-
bles y r de ellas poseen una característica A, entonces:
47
Universidad EAFIT Pedro Vicente Esteban Duarte
Empírica o frecuencial: surge de la experimentación que se realiza en las diferentes ramas del conoci-
miento, como la Física, la Química, la Matemática, la Biología, las Ciencias Sociales, entre otras. Al
realizar un experimento aleatorio, se obtienen muchos resultados que muestran frecuencia de ocu-
rrencia. Así, si un experimento aleatorio, se ha realizado n veces y el resultado (suceso) A ha ocurrido
r
r veces, la probabilidad de A, está dada por P(A) = .
n
Por ejemplo, si se encuestan a 30 personas acerca de sus gustos por diferentes tipos de deportes y 5
manifestaron preferencias por el fútbol, se tiene que el número de veces que se realizó el experimento
(hacer la encuesta) es 30, por lo tanto n = 30. Las personas que respondieron la encuesta y manifes-
taron preferencias (frecuencia) por el fútbol es de cinco, luego r = 5. Si se define el suceso A como
5 1
el gustos por el fútbol, P(A) = = .
30 6
Al calcular la probabilidad de un evento o suceso, se deben de tener en cuenta las siguientes propiedades:
b. Para un experimento aleatorio, a cada uno de sus resultados se le asigna una probabilidad entre 0 y 1. Es
decir, si Ai es un resultado de un experimento 0 ≤ P(Ai ) ≤ 1, para toda i.
e. Si Ai y A j , son eventos disjuntos (no tienen elementos en común) P(Ai ∪ A j ) = P(Ai ) + P(A j ), P(Ai ∩
A j) = 0
Ejemplo
Si se lanza un dado legal y se anota el número que aparece en la cara superior, el espacio muestral es
D = {1, 2, 3, 4, 5, 6}. Si Ai es el suceso de que aparezca el número i, encuentre las siguientes probabilidades:
P(A1 ), P(A3 ∪ A4 ) y P(A2 ∩ A5 ).
Solución
48
Universidad EAFIT Pedro Vicente Esteban Duarte
A1 es el evento que indica que al lanzar un dado y observar la cara superior se obtuvo el número 1. Por lo
tanto, los casos favorables es 1, luego r = 1. Los casos posibles son 6, luego n = 6 que es el tamaño del
1
espacio muestral o casos favorables. Por lo tanto P(A1 ) = .
6
A3 y A4 son eventos disjuntos. En el experimento, no puede ocurrir que se obtengan los nú-
mero 3 y 4 al mismo tiempo al lanzar el dado bajo las condiciones dadas. Por lo tanto
1 1 1
P(A3 ∪ A4 ) = P(A3 ) + P(A4) = + = .
6 6 3
A2 y A5 son eventos disjuntos. En el experimento, no puede ocurrir que se obtengan los número 3 y
5 al mismo tiempo al lanzar el dado, bajo las condiciones dadas, de donde A2 ∩ A5 = 0.
/ Por lo tanto
/ = 0.
P(A3 ∩ A4 ) = P(0)
Ejemplo
En el grado octavo de una institución educativa, hay 75 alumnos que compiten en diferentes equipos. En
fútbol, el equipo está conformado por 25 alumnos, de los cuales también juegan basquet, cuyo equipo esta
conformado por 15 estudiantes. Los 40 restantes, compiten en otras disciplinas. Encuentre la probabilidad
de que un estudiante:
Solución
El espacio muestral son los 75 estudiantes que compiten (C) en las disciplinas en las que participan en el
grado octavo. Por lo tanto n = 75, que es el tamaño del espacio muestral. De acuerdo con el ejercicio se
pueden definir los siguientes eventos:
Para encontrar el tamaño de cada evento se puede hacer a partir de un diagrama de Venn, de la siguiente
manera:
49
Universidad EAFIT Pedro Vicente Esteban Duarte
Figura:
a. El evento “Compite en fútbol y basquet” está dado por F ∩ B. De acuerdo con la gráfica ??, el número
de posibilidades de particiapar en los dos eventos es de 5. Por lo tanto, la probabilidad está dada por:
5 1
P(F ∩ B) = = = 0.2
25 5
b. El evento “Compite en fútbol o basquet”, se puede expresar como F ∪ B, que de acuerdo con la figura
tiene 35 posibilidades a favor. Por lo tanto la probabilidad de que un estudiante esté compitiendo en uno
de estos dos deporte, está dada por:
25 15 5 35 7
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = + − = = ≈ 0.466
75 75 75 75 15
c. El evento “Compite solamente en fútbol” está dado por F − B, que tiene 20 casos favorables. Por lo
tanto, la probabilidad está dada por:
20 4
P(F − B) = P(SF) = = ≈ 0.266
75 15
d. El evento “Compite solamente en basquet” esta dado por B − F, que tiene 10 casos favorables. Por lo
tanto, la probabilidad esta dada por:
10 2
P(B − B) = P(SB) = = ≈ 0.133
75 15
e. El evento “Compite en otro deporte diferente a fútbol o basquet” esta dado por C − (F ∪ B), este evento
tiene 40 casos favorables. Otra forma es teniendo en cuenta que los estudiantes juegan otros deportes
está dado por (F ∪ B)c . De dónde se tiene que la probabilidad está dada por:
40 8
P(C − (F ∪ B)) = = ≈ 0.533
75 15
50
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
Ejercicio
a. 0.4
b. 0.65
c. 0.3
d. 0.8
51
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. 0.45
b. 0.65
c. 0.25
d. 0.7
Ejercicio
a. 0.45
b. 0.65
c. 0.3
d. 0.6
52
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. 1
b. 0.725
c. 0.185
d. 0.6
Ejercicio
a. 0.9
b. 0.725
c. 0.275
d. 0.625
53
Universidad EAFIT Pedro Vicente Esteban Duarte
Ejercicio
a. 0.24
b. 0.8
c. 0.275
d. 0.7
Ejercicio
a. 0.24
b. 0.18
c. 0.275
d. 0.185
7. Ejercicios
1. La siguiente variable corresponde a una variable cuantitativa
A. Comida favorita
B. Color de los ojos de tus compañeros de clase
C. Número de alumnos de un colegio
D. Estado de ánimo de un grupo de empleados en una empresa
54
Universidad EAFIT Pedro Vicente Esteban Duarte
a. 9 6.5
b. 10 6.2
c. 10 6.5
d. 9 6.2
5. Las estaturas en metros de un grupo de 15 estudiantes son: 1.7, 1.5, 1.7, 1.0, 1.6, 1.2, 1.6, 1.4,
1.8, 1.8, 1.5, 1.4, 1.6, 1.6, 1.5. Entonces, la media y la varianza de la muestra son respectivamente
iguales a
a. 1.5266 0, 0433
b. 1.5266 0, 0464
c. 1.6666 0, 0464
d. 1.5266 0, 0550
a. 8 6
b. 4 7
c. 8 7
d. 8 8
7. En cierta región los registros que se tomaron a 10 familias, sobre el número de hijos fueron: 3, 8, 2,
5, 3, 1, 4, 2, 5, 2. La moda y la mediana son respectivamente iguales a
a. 3 3.0
b. 3 3.5
c. 2 3.0
d. 2 3.3
55
Universidad EAFIT Pedro Vicente Esteban Duarte
8. En una escuela rural, diez estudiantes obtuvieron en español los siguientes puntajes:
4, 7, 8, 5, 2, 2, 3, 5, 3, 5. La media y la moda son respectivamente iguales a:
a. 4.4 3
b. 3.6 5
c. 4.0 2
d. 4.4 5
9. Las calificaciones que obtuvieron en sociales diez estudiantes, en una escuela para niños, fueron las
siguientes: 9.0, 2.0, 3.0, 8.0, 3.0, 8.0, 3.0, 6.0, 4.0, 5.0. La mediana y la media son respecti-
vamente iguales a
a. 3.0 5.0
b. 3.0 5.1
c. 4.5 5.1
d. 4.5 6.0
10. Suponga que las calificaciones que obtuvieron en matemáticas diez estudiantes, en una institución educa-
tiva, fueron las siguientes: 9, 2, 8, 2, 7, 4, 5, 4, 4, 5. La mediana y la moda son respectivamente
iguales a:
a. 4.8 4
b. 4.5 4
c. 4.5 2
d. 5.5 4
56
Universidad EAFIT Pedro Vicente Esteban Duarte
11. El peso en kilogramos de quince productos cárnicos en un supermercado son: 2.5, 2.0, 1.0, 1.3,
1.8, 1.7, 1.6, 1.4, 1.5, 1.5, 2.4, 2.5, 1.7, 1.3, 1.5. Entonces la media y la desviación estándar
de la muestra son respectivamente iguales a
a. 1.7133 1.7022
b. 1.7133 0.4395
c. 1.6 6.4549
d. 1.7133 0.1936
12. El peso en kilogramos de quince productos cárnicos en un supermercado son: 2.5, 2.0, 1.0, 1.3,
1.8, 1.7, 1.6, 1.4, 1.5, 1.5, 2.4, 2.5, 1.7, 1.3, 1.5. Entonces el número de datos que están a
menos de una desviación estándar es tal que
a. Es menor que 4
b. Está entre 4 y 6
c. Está entre 6 y 10
d. Es mayor que 10
13. En una prueba a diez estudiantes, se obtuvieron las siguientes calificaciones en matemáticas: 5, 8, 6,
7, 4, 8, 10, 7, 10, 9. La media y las calificaciones que están a una desviación estándar de la media
son respectivamente iguales a
a. 7; 6, 7, 7, 8, 8, 9
b. 7.4; 6, 7, 7, 8, 8, 9
c. 7.4; 7, 7, 8, 8, 9
d. 7.4; 6, 7, 7, 8, 8
57
Universidad EAFIT Pedro Vicente Esteban Duarte
14. En una prueba a diez estudiantes, se obtuvieron las siguientes calificaciones en matemáticas: 5, 8, 6,
7, 4, 8, 10, 7, 10, 9. El porcentaje de alumnos sacaron calificaciones que están a una desviación
estándar de la media es
a. 60 %
b. 40 %
c. 50 %
d. 80 %
15. En una prueba a diez estudiantes, se obtuvieron las siguientes calificaciones en biología: 5, 8, 6, 7,
4, 8, 10, 7, 10, 9. La media y las calificaciones que están a dos desviación estándar de la media
son respectivamente iguales a
a. 7; 4, 5, 10, 10
b. 7.4; 4, 5, 6, 7, 7, 8, 8, 9, 10, 10
c. 7; 4, 5, 6, 7, 7, 8, 8, 9, 10, 10
d. 7.4; 4, 5, 10, 10
16. En un campeonato participan seis equipos. El total de posibilidades en que puede terminar el campeonato
es igual a
a. 15
b. 46656
c. 720
d. 32
58
Universidad EAFIT Pedro Vicente Esteban Duarte
17. En un campeonato participan siete equipos. El total de posibilidades en que puede terminar el campeo-
nato es igual a
a. 49
b. 5040
c. 720
d. 490
18. En un campeonato participan ocho equipos, de los cuales únicamente clasifican cuatro. El total de posi-
bles clasificaciones que se pueden presentar es igual a
a. 70
b. 1680
c. 840
d. 256
19. De un grupo de 8 personas conformado por 5 hombres y 3 mujeres, se requiere conformar un comité de
5 personas, conformado por 3 hombres y 2 mujeres. El número de posibilidades está dado por
a. 56
b. 36
c. 40
d. 30
20. De un grupo de 10 personas conformado por 6 hombres y 4 mujeres, se requiere conformar un comité
de 5 personas, en donde el número de mujeres pueden ser 2 o 3. El número de posibilidades está dado
por
a. 112
b. 60
c. 180
d. 120
59
Universidad EAFIT Pedro Vicente Esteban Duarte
21. Para realizar un procedimiento de control de calidad en una fábrica, se revisan al azar 4 de 10 productos
para examinar y determinar si son defectuosos. El número de muestras posibles es igual a
a. 720
b. 210
c. 120
d. 40
22. En una rifa se utilizan de manera aleatoria 4 letras de un grupo de 9 letras diferentes, para determinar el
ganador. El número de posibles selecciones es igual a
a. 210
b. 630
c. 3024
d. 126
23. En cierto cruce, un vehículo tiene tres opciones: a) dar vuelta a la izquierda, b) dar vuelta a la derecha, y c)
seguir de largo. La probabilidad de que los vehículos den vuelta a la izquierda es de 0.25, la probabilidad
que los vehículos den vuelta a la derecha es de 0.20. Entonces la probabilidad de que los vehículos sigan
de largo es igual a
a. 0.45
b. 0.55
c. 0.75
d. 0.80
24. Se requiere conformar comités de dos físicos y de dos químicos, sabiendo que se disponen de cuatro
químicos y tres físicos. El número de posibles comités es igual a
a. 21
b. 42
c. 9
d. 18
25. En la tabla aparece el registro acerca del número de caries de cada uno de los estudiantes de un grupo de
20.
60
Universidad EAFIT Pedro Vicente Esteban Duarte
a. 5
b. 2.1
c. 2.2
d. 8.8
26. En la tabla aparece el registro acerca del número de caries de cada uno de los estudiantes de un grupo de
20.
a. 1.2526
b. 1.0241
c. 1.1192
d. 1.0909
27. En la tabla aparece el registro acerca del número de caries de cada uno de los estudiantes de un grupo de
20.
a. 10 %
b. 20 %
c. 30 %
d. 40 %
61
Universidad EAFIT Pedro Vicente Esteban Duarte
28. En la tabla aparece el registro acerca del número de caries de cada uno de los estudiantes de un grupo de
20.
a. 45 %
b. 70 %
c. 65 %
d. 30 %
29. Las calificaciones obtenidas por un grupo de 16 estudiantes sobre un examen de física aparecen en la
siguiente tabla.
6 7 3 8
10 1 5 9
7 7 3 6
10 9 6 8
a. 20 %
b. 28 %
c. 25 %
d. 30 %
62
Universidad EAFIT Pedro Vicente Esteban Duarte
30. Las calificaciones obtenidas por un grupo de 16 estudiantes sobre un examen de física, aparecen en la
siguiente tabla.
6 7 3 8
10 1 5 9
7 7 3 6
10 9 6 8
El porcentaje de estudiantes que registraron una nota a menos de una desviación estándar de la media es
igual a
a. 71.24 %
b. 31.25 %
c. 65.42 %
d. 68.75 %
31. El número de maneras en que se pueden colocar siete bolas, donde hay cuatro bolas rojas y tres bolas
verdes, es igual a
a. 35
b. 12
c. 144
d. 6
32. Se ha encargado la impresión de un documento a una imprenta, la cual imprime 18 documentos de-
fectuosos de cada 150. La probabilidad de que al elegir un documento, éste salga defectuoso es igual
a
a. 0.82
b. 0.18
c. 0.12
d. 0.88
63
Universidad EAFIT Pedro Vicente Esteban Duarte
33. En cierta fábrica se ha medido la longitud de 16 piezas de características similares. Los registros en cm.
son los siguientes: 6.2, 11.5, 12.3, 12.1, 8.8, 7.5, 5.5, 5.9, 6.6, 8.3, 9.8, 10.4, 12.8, 12.4,
12.5, 7.2. En la siguiente tabla aparecen los registros en cuatro clases.
Al completar la tablas se tiene que la frecuencia relativa correspondiente a los registros que están en la
clase [7, 9) es igual a
a. 0.20
b. 0.25
c. 0.30
d. 0.50
34. En cierta fábrica se ha medido la longitud de 16 piezas de características similares. Los registros en cm.
son los siguientes: 12.3, 12.1, 8.8, 7.5, 5.5, 5.9, 6.2, 6.6, 8.3, 9.8, 10.4, 12.8, 12.4, 11.5,
12.5, 7.2. En la siguiente tabla aparecen los registros en cuatro clases.
Al completar la tablas se tiene que la frecuencia relativa porcentual, correspondiente a los registros que
están en la clase [11, 13] es igual a
a. 25 %
b. 0.25 %
c. 0.375 %
d. 37.5 %
64
Universidad EAFIT Pedro Vicente Esteban Duarte
35. En un registro sobre un grupo de personas alcohólicas se tiene que el 35 % tienen el padre alcohólico,
mientra que el 25 % de los mismos tienen la madre alcohólica. Si se sabe que el 50 % tienen al menos
uno de los padres alcohólico, entonces el porcentaje de personas que tienen ambos padres alcohólicos es
igual a
a. 25 %
b. 20 %
c. 15 %
d. 10 %
36. En un registro sobre un grupo de personas alcohólicos se tiene que el 50 % tienen el padre alcohólico,
mientras que el 35 % de los mismos tienen la madre alcohólica. Si se sabe que el 70 % tienen al menos
uno de los padres alcohólico, entonces el porcentaje de personas que tienen el padre alcohólico y la
madre no alcohólica es igual a
a. 35 %
b. 20 %
c. 15 %
d. 10 %
37. En un examen, el 25 % de los hombres lo perdieron, así mismo el 10 % de las mujeres lo perdieron.
Sabiendo que 40 estudiantes presentaron el examen y 7 estudiantes lo perdieron, el número de mujeres
que ganaron el examen es igual a
a. 10
b. 18
c. 12
d. 15
65
Universidad EAFIT Pedro Vicente Esteban Duarte
38. En un examen de español el 20 % de los hombres perdieron el examen, mientras que el 25 % de las
mujeres perdieron el examen. Sabiendo que 40 estudiantes presentaron el examen y 9 estudiantes lo
perdieron, el número de hombres que ganaron el examen is igual a
a. 16
b. 15
c. 12
d. 20
Ventas (millones) 5 3 4 6
Empresas 3 4 6 5
40. En un campeonato participan 6 equipos, de los cuales únicamente clasifican cuatro. El número de posi-
bilidades de que clasifique un equipo entre los primeros cuatro es igual a
a. 256
b. 30
c. 15
d. 360
66
Universidad EAFIT Pedro Vicente Esteban Duarte
41. Dados los números 1, 2, 3, 4, y 5, la cantidad de los posibles números que se pueden formar de 3 dígitos,
sin repetir dígito, es igual a
a. 10
b. 60
c. 30
d. 120
42. Dados 8 bombillos, de los cuales, 5 son rojos y 3 son verdes, el número posible de arreglos de 8 bombillos
que se pueden realizar es igual a
a. 28
b. 42
c. 56
d. 112
43. De un grupo de 10 personas se eligen 4 para tomar una foto en forma lineal, respetando el orden, el
número de disposiciones posibles es igual a
a. 420
b. 210
c. 151200
d. 5040
44. De un grupo de 10 personas se eligen 4 para tomar una foto en forma lineal, sin importar el orden, el
número de disposiciones posibles es igual a
a. 420
b. 210
c. 2520
d. 5040
67
Universidad EAFIT Pedro Vicente Esteban Duarte
45. En una reunión de 10 socios se pretende elegir a tres de estos socios, para los cargos de un Presidente,
un Secretario y un Tesorero. El número de posibles elecciones es igual a
a. 360
b. 1000
c. 120
d. 720
46. En una reunión de 10 socios se pretende elegir a una comisión conformada por cuatro de estos socios.
El número de posibles comisiones es igual a
a. 210
b. 5040
c. 256
d. 10000
47. En una reunión de 10 socios se pretende elegir a una comisión conformada por cuatro de estos socios.
El número de posibles comisiones es igual a
a. 210
b. 5040
c. 256
d. 10000
48. Se dispone de cinco bolas de colores: roja, verde, amarilla, blanca y negra. El número de maneras en que
se pueden dividir las cinco bolas en dos grupos, uno con dos bolas y otro con tres bolas, es igual a
a. 60
b. 10
c. 36
d. 50
68
Universidad EAFIT Pedro Vicente Esteban Duarte
49. Se dispone de 9 jugadores para conformar equipos de Básquetbol de 5 jugadores, donde los jugadores
pueden desempeñar cualquier puesto en el equipo. El número de equipos que se pueden conformar es
igual a
a. 59049
b. 15120
c. 252
d. 126
50. En una bolsa hay cinco bolas de colores: roja, verde, amarilla, blanca y negra. Si se extraen de la bolsa
tres, el número de formas diferentes en que pueden aparecer es igual a
a. 20
b. 30
c. 60
d. 10
51. El número de permutaciones diferentes que se pueden formar con todas las letras de la palabra INDIVI-
DUO es igual a
a. 120
b. 30240
c. 60480
d. 720
52. El número de permutaciones diferentes que se pueden formar con todos los dígitos del número 314141
es igual a
a. 60
b. 120
c. 30
d. 720
Índice
1. Recolección de la información 2
69
Universidad EAFIT Pedro Vicente Esteban Duarte
2.6. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4. Actividades de ejercitación 30
4.2.1. Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
70
Universidad EAFIT Pedro Vicente Esteban Duarte
5. Reglas de conteo 35
5.4.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.4.2. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.1. La probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7. Ejercicios 54
8. Bibliografía 71
8. Bibliografía
1. Anderson, Sweeney, Williams. (2008). Estadística para Administración y Economía. Décima edición.
Cengage Learning, México.
2. Newbod, P. (1998). Estadística para los negocios y la economía. Cuarta Edición. Prentice Hall, México.
3. García A., Miguel A. (2005). Introducción a la teoría de la probabilidad. Ciencia y Tecnología, Fondo
de cultura económica, México.
71