01 - Fundamentos PDF
01 - Fundamentos PDF
01 - Fundamentos PDF
Fundamentos y Definiciones
1.1. Introducción
Para comprender de mejor manera los ejercicios que realizaremos debemos manejar los
conceptos de: Población, tamaño de la población, muestra y variable.
Muestra (n). - Es una fracción significativa de la población que se escoge en base a diferentes
técnicas.
Ejemplos: La edad de las personas, la velocidad del viento, la viscosidad de un fluido como la
sangre, la frecuencia del sonido, la calidad de un producto terminado.
Dentro del concepto de variable se pueden dar un sinnúmero de clasificaciones, pero para el
caso de nuestro estudio podemos distinguir los siguientes tipos y subtipos:
Continuas Nominales
Discretas Ordinales
Variables cuantitativas.- Son aquellas que expresan un cantidad y que adquieren un valor
numérico.
En el contexto de las variables cuantitativas podemos mencionar las continuas y las discretas.
Variables cualitativas.- Son aquellas que expresan una cualidad y que adquieren un valor no
numérico.
Ejemplos: el estado civil de una persona, el color de su cabello, el género de las películas.
Variables ordinales.- Son aquellas que tienen un orden o jerarquía, e incluso el ordenamiento
es indispensable, o al menos es altamente recomendable con el fin de facilitar los análisis
posteriores.
Recopilación Interpretación
Organización Análisis de la
de datos en de la
de datos Información
bruto Información
Los datos en bruto se refieren a los valores de las variables que se han tomado de una
población o muestra en particular y que aún se encuentran desordenados. Al organizar los
datos les estamos convirtiendo en información útil, con lo que por sí sola ya permite dilucidar
parámetros descriptivos importantes. Luego se la analiza a través del cálculo de ciertas
medidas, coeficientes e indicadores obteniendo otros valores más decidores e informativos, lo
que conlleva a una interpretación muy objetiva de los fenómenos y predicciones que se hacen
en una población.
Frecuencia absoluta (𝑓𝑖 ).- Se refiere al número de apariciones que tiene un mismo valor de
una variable. La suma de todas las frecuencias absolutas siempre debe ser igual a N.
Ejemplo 1.4.1:
Datos en bruto:
Solución:
En primer lugar, es necesario tener claro cuál es la población, el tamaño de la población (N) y
la variable que se encuentra en estudio, así que vamos a resaltar esa información:
Población: días laborables (esto se lo puede reconocer identificando a que se refieren todos los
casilleros de la tabla como conjunto). Esto está expresado en el enunciado porque menciona
que el estudio se lo hace solo en los días laborables del mes.
Variable: Número de pacientes atendidos en por día. (esto se lo puede reconocer identificando
a que se refiere cada valor de la tabla como individuo en sí mismo. En algunos casos se lo
visualiza en el título de la tabla, pero en algunos casos está implícito).
Variable Frecuencias
# de
fi fr fr% FAA FAD
pacientes
2 1 0.05 5 1 20
3 1 0.05 5 2 19
4 2 0.1 10 4 18
5 2 0.1 10 6 16
6 1 0.05 5 7 14
7 1 0.05 5 8 13
8 3 0.15 15 11 12
9 1 0.05 5 12 9
10 1 0.05 5 13 8
11 1 0.05 5 14 7
12 2 0.1 10 16 6
13 1 0.05 5 17 4
17 1 0.05 5 18 3
18 1 0.05 5 19 2
21 1 0.05 5 20 1
Sumas 20 1 100
Se recomienda hacer los cálculos manuales utilizando una calculadora, lápiz y papel para
reafirmar los conceptos y verificar los comentarios realizados anteriormente. Ya en lo posterior
y una vez que se tenga claro el panorama conceptual trabajaremos más con herramientas
computacionales.
Analizando la tabla. -
De la tabla anterior podemos notar que ya organizados los datos se puede extraer información
valiosa. Por ejemplo: se puede conocer el número de pacientes que aparece con más
frecuencia, es decir, el valor de la variable que tiene mayor frecuencia absoluta, que para el
ejemplo es de 8 (el valor más grande de la frecuencia absoluta nos ayuda a ubicar la fila en
donde está el valor de la variable que buscamos). Esto significa que si alguien le pregunta a la
recepcionista de ese consultorio cuántos pacientes se atienden por lo general en un día
común, ella podría usar esta tabla y sin mayor error contestar que se atienden 8 pacientes en
un día normal (esto se corroborará más adelante cuando se aborde el cálculo de las medidas
de tendencia central).
Si por ejemplo se necesita conocer el porcentaje que representan de la población (N=20 días
laborables) los días en que se atendieron 12 pacientes, esto lo extraemos del cruce de la
columna fr% y la fila cuyo valor de la variable es 12, lo cual nos dice que esos días representan
el 10%.
Otro dato interesante y que puede resultar muy útil en cuanto a toma de decisiones es el que
nos da la FAA y la FAD, por ejemplo: los médicos que trabajan en dicho consultorio podrían
preguntar: ¿en cuántos días de los 20 laborables se atendieron menos de 10 pacientes?, esta
Una pregunta similar pero que tiene una variante importante sería: ¿en cuántos días de los 20
laborables se atendieron 10 pacientes o menos?, en este caso se incluye al valor 10 de la
variable, por lo tanto, la respuesta está en el cruce de la FAA con la fila correspondiente al
valor 10 de la variable, cuyo resultado nos da 13 días en los cuales se atendieron 10 pacientes
o menos.
Por último, se puede extraer información importante también de la columna FAD, por
ejemplo: si se pregunta ¿en cuántos días de los 20 laborables se atendieron 4 pacientes o
más?, la respuesta estaría en el cruce de la columna FAD y la fila que corresponde al valor 4 de
la variable, lo que nos da un resultado de 18 días en que se atienden 4 pacientes o más (el
valor 4 está incluido de acuerdo a lo que se cuestiona).
Se debe usar un número de clases adecuado de tal manera que no complique los cálculos, y se
recomienda en lo posible usar entre 5 a 10 clases.
Ejemplo 1.5.1:
En un curso de 20 alumnos se les ha tomado el peso en kilogramos a cada uno de ellos, dando
como resultado la siguiente tabla:
Se pide construir la tabla de frecuencias utilizando datos agrupados. Se sugiere generar una
tabla de 5 clases.
Solución:
Rango:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 94 − 47 = 47
Como N=20 y se sugiere utilizar 5 clases, podemos calcular lo que se llama el ancho de clase o
amplitud del intervalo (C), dividiendo R para el número de clases (m):
𝑅 47
𝐶= = = 9.4
𝑚 5
Siempre con el propósito de facilitar los cálculos se hace un redondeo a un entero múltiplo de
10.
Nota: Si ya disponemos de C en algún caso (es decir, si en el enunciado del problema ya nos
ofrecen C como dato), este solo se calcula restando dos límites inferiores contiguos, o restando
dos límites superiores contiguos, tal como se puede verificar en la tabla siguiente.
Ahora nos falta decidir sobre el límite inferior de la primera clase. Se lo realiza en base al
menor valor de la variable, en este caso ese valor es Xmin = 47, en este caso lo redondearemos
a 45 por facilidad de uso.
Variable Frecuencias
Clase Límite Inferior Límite superior fi fr fr% FAA FAD
1º 45 54 2 0.1 10 2 20
2º 55 64 4 0.2 20 6 18
3º 65 74 8 0.4 40 14 14
4º 75 84 3 0.15 15 17 6
5º 85 94 3 0.15 15 20 3
20 1 100
De igual forma se puede extraer información interesante y sobre todo útil, por ejemplo: la
clase o grupo más numeroso se puede observar que es el grupo que está entre 65 y 74 Kg, esto
queda señalado por la fila en donde encontramos la mayor frecuencia absoluta.
También se pueden hacer análisis similares a los que se hizo en la tabla de datos no agrupados,
por ejemplo: ¿cuál cuántos alumnos pesan 64 kilogramos o menos?, la repuesta está en el
cruce de la columna FAA y la clase que contiene al valor de 64Kg (segunda clase), y la respuesta
es: son 6 alumnos que pesan 64Kg o menos.
Diagramas de barras. –
Ejemplo 1.6.1:
Se toma como referencia el caso del ejemplo 1.4.1. de lo que resulta el siguiente gráfico:
3
Frecuencia absoluta fi
2.5
1.5
0.5
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
Se puede advertir que se puede también extraer muy fácilmente la información relevante y
responder a las mismas preguntas que se realizaron en el caso de las tablas de frecuencia.
Existen algunas variantes de los gráficos de barras que simplemente en su mayoría difieren en
la forma pero que nos ofrecen la misma información.
14
12
10
8
6
4
2
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
Polígonos de frecuencia. –
3
Frecuencia absoluta fi
2.5
1.5
0.5
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
En ciertos casos se suele representar superpuestos los polígonos de frecuencia con el diagrama
de barras.
Ojivas. –
Si se genera un diagrama de barras utilizando la FAA o la FAD resultan los siguientes gráficos si
tomamos como referencia el mismo ejemplo 1.4.1:
20
15
10
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
20
15
10
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
Si construimos el polígono de frecuencia utilizando FAA y FAD estos nuevos gráficos toman el
nombre de “OJIVAS”, así que nos resultan las siguientes formas:
20
15
10
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
20
15
10
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos
Otro tipo de gráficas que se utiliza a menudo son los diagramas circulares o tipo pastel, las
cuales tienen una distribución en forma de sectores circulares, en donde cada sector
representa un valor de frecuencia relativa porcentual (puede estar acompañado de fi) en cada
valor de la variable. Para esto utilizaremos otro ejemplo que recurre a variables nominales, ya
que son las que más se recomiendan para este tipo de gráficas.
Ejemplo 1.6.2:
En un curso de tercer nivel se han obtenido los siguientes datos respecto al género de los
estudiantes y sus gustos por los tipos de arte:
Se requiere conocer el porcentaje en cuanto a género y las preferencias por el arte, para ello
se construirán los respectivos diagramas circulares:
Solución:
Una vez más colocaremos la población, N y la variable para que no se pierda de vista estos
conceptos.
Masculino
47%
Femenino
53%
Teatro
33% Música
40%
Pintura
27%
Histogramas. –
Todos los tipos de gráficas mencionadas hasta el momento son muy útiles para cuando se trata
de datos No agrupados. En el caso que se trabaje con datos agrupados lo más conveniente es
utilizar los llamados histogramas, que no son sino un tipo de gráfico de barras especial, en
donde las barras van juntas, es decir, no hay espacio entre ellas, esto se lo hace para indicar
que las clases en las que se ha distribuido la población son continuas.
Variable Frecuencias
Clase Límite Inferior Límite superior fi fr fr% FAA FAD Mi
1º 45 54 2 0.1 10 2 20 49.5
2º 55 64 4 0.2 20 6 18 59.5
3º 65 74 8 0.4 40 14 14 69.5
4º 75 84 3 0.15 15 17 6 79.5
5º 85 94 3 0.15 15 20 3 89.5
20 1 100
7
Frecuencia absoluta
0
49.5 59.5 69.5 79.5 89.5
Peso en Kg
Se observa que en el eje horizontal se expresa en función de las marcas de clase para cada
columna del histograma.