01 - Fundamentos PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 14

1.

Fundamentos y Definiciones

1.1. Introducción

Para comprender de mejor manera los ejercicios que realizaremos debemos manejar los
conceptos de: Población, tamaño de la población, muestra y variable.

Población. - Es un conjunto de elementos cualquiera que se estudia o investiga, es decir, el


conjunto que del cual nos interesa conocer ciertos fenómenos o características. Los elementos
pueden seres vivos tales como en una población humana o población de bacterias; pero
también pueden ser objetos como: el parque automotor de la ciudad de Quito, o el conjunto
de casas destruidas en la costa ecuatoriana por el terremoto de 2016.

Tamaño de la población (N). - Es la cuantificación de una población, es decir, el número de


elementos que la conforman. Por ejemplo: el tamaño de la población del Ecuador que son
aproximadamente 17 millones de habitantes en el 2020
(https://countrymeters.info/es/Ecuador). Otro ejemplo es la cantidad de células en el cuerpo
de un ser humano varón promedio que es de alrededor de 30 billones
(https://www.ngenespanol.com/ciencia/microbios-en-el-cuerpo-humano-organismos-celulas-
bacterias-estomago/).

Muestra (n). - Es una fracción significativa de la población que se escoge en base a diferentes
técnicas.

Variable. - Es una característica de la población que puede tomar un valor determinado de


acuerdo a diferentes factores o circunstancias.

Ejemplos: La edad de las personas, la velocidad del viento, la viscosidad de un fluido como la
sangre, la frecuencia del sonido, la calidad de un producto terminado.

1.2. Tipos de Variables

Dentro del concepto de variable se pueden dar un sinnúmero de clasificaciones, pero para el
caso de nuestro estudio podemos distinguir los siguientes tipos y subtipos:

Ing. Johnny Coronel O.


VARIABLES VARIABLES
CUANTITATIVAS CUALITATIVAS

Continuas Nominales

Discretas Ordinales

Variables cuantitativas.- Son aquellas que expresan un cantidad y que adquieren un valor
numérico.

En el contexto de las variables cuantitativas podemos mencionar las continuas y las discretas.

Variables continuas.- Son aquellas que toman valores decimales.

Ejemplos: el peso de las personas, su estatura, su índice de masa corporal.

Variables discretas.- Son aquellas que toman solo valores enteros.

Ejemplos: el número de hijos en una familia, la cantidad de lámparas defectuosas obtenidas al


mes en una fábrica, el número de protones en los átomos.

Variables cualitativas.- Son aquellas que expresan una cualidad y que adquieren un valor no
numérico.

Dentro de las variables cualitativas se encuentran las variables nominales y ordinales.

Variables nominales.- Son aquellas que no tienen un ordenamiento o jerarquía, y en muchos


casos el ordenamiento es impensable o incluso prohibido.

Ejemplos: el estado civil de una persona, el color de su cabello, el género de las películas.

Variables ordinales.- Son aquellas que tienen un orden o jerarquía, e incluso el ordenamiento
es indispensable, o al menos es altamente recomendable con el fin de facilitar los análisis
posteriores.

Ing. Johnny Coronel O.


Ejemplos: el rango militar, el grado académico de una persona, el nivel de satisfacción en la
atención al cliente.

1.3. Tablas de Frecuencias

Para empezar, se debe puntualizar que en la Estadística como parte de un proceso de


tratamiento de información se observan los siguientes pasos:

Recopilación Interpretación
Organización Análisis de la
de datos en de la
de datos Información
bruto Información

Los datos en bruto se refieren a los valores de las variables que se han tomado de una
población o muestra en particular y que aún se encuentran desordenados. Al organizar los
datos les estamos convirtiendo en información útil, con lo que por sí sola ya permite dilucidar
parámetros descriptivos importantes. Luego se la analiza a través del cálculo de ciertas
medidas, coeficientes e indicadores obteniendo otros valores más decidores e informativos, lo
que conlleva a una interpretación muy objetiva de los fenómenos y predicciones que se hacen
en una población.

El concepto de tablas de frecuencias está asociada a la distribución de frecuencias, que


consiste en el ordenamiento o clasificación de los valores observados en una variable, de
acuerdo con su magnitud numérica. Permite identificar la forma en que ciertos puntos o
características están distribuidos.

Vamos a definir varios tipos de frecuencias, así tenemos:

Frecuencia absoluta (𝑓𝑖 ).- Se refiere al número de apariciones que tiene un mismo valor de
una variable. La suma de todas las frecuencias absolutas siempre debe ser igual a N.

Frecuencia relativa (𝑓𝑟 ). – Se la calcula dividiendo la 𝑓𝑖 para N que es el tamaño de la


población. La suma de todas las frecuencias relativas es igual a 1.

Frecuencia relativa porcentual (𝑓𝑟% ). – Se la calcula multiplicando 𝑓𝑟 por 100. La suma de


todas las frecuencias relativas porcentuales es igual a 100.

Ing. Johnny Coronel O.


Frecuencia acumulada ascendente (FAA). – Se la calcula sumando la frecuencia absoluta actual
más la anterior, por lo cual se va acumulando, de ahí su nombre. El último valor de la FAA debe
coincidir con N.

Frecuencia acumulada descendente (FAD). – Se la calcula iniciando con N y el siguiente valor se


lo calcula restando el valor actual menos el anterior. El último valor debe coincidir con el
último valor de 𝑓𝑖 .

De acuerdo a lo señalado podemos distinguir entre dos tipos de datos: No agrupados y


agrupados.

1.4. Datos No Agrupados

Cuando N es pequeño (se considera pequeño cuando aproximadamente N<400) se organiza la


información de tal manera que en la primera columna se anotan los valores de las variables en
forma individual, es decir, no se requieren grupos.

Veamos a continuación un ejemplo para ilustrar los conceptos expuestos:

Ejemplo 1.4.1:

En un consultorio se desea conocer el comportamiento de los pacientes en cuanto a la


asistencia a las citas médicas, así que se toman los datos durante un mes del número de
pacientes atendidos en los días laborables. Se pide lo siguiente: organizar los datos en bruto y
construir la tabla de frecuencias, es decir, calcular y anotar las frecuencias: 𝑓𝑖 , 𝑓𝑟 , 𝑓𝑟%, FAA,
FAD.

Datos en bruto:

Número de pacientes atendidos por día


Lunes Martes Miércoles Jueves Viernes
2 4 11 12 7
5 4 8 21 18
10 5 9 6 13
12 17 8 8 3

Solución:

En primer lugar, es necesario tener claro cuál es la población, el tamaño de la población (N) y
la variable que se encuentra en estudio, así que vamos a resaltar esa información:

Población: días laborables (esto se lo puede reconocer identificando a que se refieren todos los
casilleros de la tabla como conjunto). Esto está expresado en el enunciado porque menciona
que el estudio se lo hace solo en los días laborables del mes.

Tamaño de la población: N=20 (esto lo reconocemos contando el número de valores o


casilleros de la tabla dada).

Variable: Número de pacientes atendidos en por día. (esto se lo puede reconocer identificando
a que se refiere cada valor de la tabla como individuo en sí mismo. En algunos casos se lo
visualiza en el título de la tabla, pero en algunos casos está implícito).

Ing. Johnny Coronel O.


La siguiente es la Tabla de frecuencias solicitada:

Variable Frecuencias
# de
fi fr fr% FAA FAD
pacientes
2 1 0.05 5 1 20
3 1 0.05 5 2 19
4 2 0.1 10 4 18
5 2 0.1 10 6 16
6 1 0.05 5 7 14
7 1 0.05 5 8 13
8 3 0.15 15 11 12
9 1 0.05 5 12 9
10 1 0.05 5 13 8
11 1 0.05 5 14 7
12 2 0.1 10 16 6
13 1 0.05 5 17 4
17 1 0.05 5 18 3
18 1 0.05 5 19 2
21 1 0.05 5 20 1
Sumas 20 1 100

Se recomienda hacer los cálculos manuales utilizando una calculadora, lápiz y papel para
reafirmar los conceptos y verificar los comentarios realizados anteriormente. Ya en lo posterior
y una vez que se tenga claro el panorama conceptual trabajaremos más con herramientas
computacionales.

Analizando la tabla. -

De la tabla anterior podemos notar que ya organizados los datos se puede extraer información
valiosa. Por ejemplo: se puede conocer el número de pacientes que aparece con más
frecuencia, es decir, el valor de la variable que tiene mayor frecuencia absoluta, que para el
ejemplo es de 8 (el valor más grande de la frecuencia absoluta nos ayuda a ubicar la fila en
donde está el valor de la variable que buscamos). Esto significa que si alguien le pregunta a la
recepcionista de ese consultorio cuántos pacientes se atienden por lo general en un día
común, ella podría usar esta tabla y sin mayor error contestar que se atienden 8 pacientes en
un día normal (esto se corroborará más adelante cuando se aborde el cálculo de las medidas
de tendencia central).

Si por ejemplo se necesita conocer el porcentaje que representan de la población (N=20 días
laborables) los días en que se atendieron 12 pacientes, esto lo extraemos del cruce de la
columna fr% y la fila cuyo valor de la variable es 12, lo cual nos dice que esos días representan
el 10%.

Otro dato interesante y que puede resultar muy útil en cuanto a toma de decisiones es el que
nos da la FAA y la FAD, por ejemplo: los médicos que trabajan en dicho consultorio podrían
preguntar: ¿en cuántos días de los 20 laborables se atendieron menos de 10 pacientes?, esta

Ing. Johnny Coronel O.


información la encontramos en el cruce de la columna FAA y la fila que corresponde al valor de
la variable 9 (puesto que nos cuestiona sobre menos de 10 pacientes), con lo cual la respuesta
es 12 días en los cuales se atendieron menos de 10 pacientes.

Una pregunta similar pero que tiene una variante importante sería: ¿en cuántos días de los 20
laborables se atendieron 10 pacientes o menos?, en este caso se incluye al valor 10 de la
variable, por lo tanto, la respuesta está en el cruce de la FAA con la fila correspondiente al
valor 10 de la variable, cuyo resultado nos da 13 días en los cuales se atendieron 10 pacientes
o menos.

Por último, se puede extraer información importante también de la columna FAD, por
ejemplo: si se pregunta ¿en cuántos días de los 20 laborables se atendieron 4 pacientes o
más?, la respuesta estaría en el cruce de la columna FAD y la fila que corresponde al valor 4 de
la variable, lo que nos da un resultado de 18 días en que se atienden 4 pacientes o más (el
valor 4 está incluido de acuerdo a lo que se cuestiona).

1.5. Datos Agrupados

Cuando N es grande (se considera grande cuando aproximadamente N≥400) se organiza la


información de tal manera que en la primera columna se anotan grupos que tienen límites
inferior y superior, a manera de intervalos como los ya conocidos en el cálculo matemático, es
decir, se requieren grupos, o por lo menos se recomienda utilizar grupos para facilitar los
análisis posteriores. A estos grupos se los denomina: clases.

Se debe usar un número de clases adecuado de tal manera que no complique los cálculos, y se
recomienda en lo posible usar entre 5 a 10 clases.

Ejemplo 1.5.1:

Para el ejemplo por facilidad en la comprensión vamos a considerar un N=20.

En un curso de 20 alumnos se les ha tomado el peso en kilogramos a cada uno de ellos, dando
como resultado la siguiente tabla:

Peso en kilogramos de los alumnos del curso


74 69 47 65 76
67 61 85 88 57
94 71 82 52 72
70 79 55 58 66

Se pide construir la tabla de frecuencias utilizando datos agrupados. Se sugiere generar una
tabla de 5 clases.

Solución:

Población: Alumnos del curso. (casilleros de la tabla como conjunto)

Tamaño de la población: N=20. (número de casilleros de la tabla)

Variable: Peso en Kg de los alumnos (está en el título de la tabla y es el significado de los


valores dados en la tabla)

Ing. Johnny Coronel O.


Iniciamos calculando lo se conoce como rango, que no es otra cosa que la diferencia entre el
mayor valor (Xmax) y el menor valor (Xmin) de la variable.

Rango:

𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 94 − 47 = 47

Como N=20 y se sugiere utilizar 5 clases, podemos calcular lo que se llama el ancho de clase o
amplitud del intervalo (C), dividiendo R para el número de clases (m):
𝑅 47
𝐶= = = 9.4
𝑚 5
Siempre con el propósito de facilitar los cálculos se hace un redondeo a un entero múltiplo de
10.

Nota: Si ya disponemos de C en algún caso (es decir, si en el enunciado del problema ya nos
ofrecen C como dato), este solo se calcula restando dos límites inferiores contiguos, o restando
dos límites superiores contiguos, tal como se puede verificar en la tabla siguiente.

Ahora nos falta decidir sobre el límite inferior de la primera clase. Se lo realiza en base al
menor valor de la variable, en este caso ese valor es Xmin = 47, en este caso lo redondearemos
a 45 por facilidad de uso.

Entonces la tabla de frecuencias quedará de la siguiente manera:

Variable Frecuencias
Clase Límite Inferior Límite superior fi fr fr% FAA FAD
1º 45 54 2 0.1 10 2 20
2º 55 64 4 0.2 20 6 18
3º 65 74 8 0.4 40 14 14
4º 75 84 3 0.15 15 17 6
5º 85 94 3 0.15 15 20 3
20 1 100

De igual forma se puede extraer información interesante y sobre todo útil, por ejemplo: la
clase o grupo más numeroso se puede observar que es el grupo que está entre 65 y 74 Kg, esto
queda señalado por la fila en donde encontramos la mayor frecuencia absoluta.

También se pueden hacer análisis similares a los que se hizo en la tabla de datos no agrupados,
por ejemplo: ¿cuál cuántos alumnos pesan 64 kilogramos o menos?, la repuesta está en el
cruce de la columna FAA y la clase que contiene al valor de 64Kg (segunda clase), y la respuesta
es: son 6 alumnos que pesan 64Kg o menos.

Ing. Johnny Coronel O.


1.6. Gráficos Estadísticos

Las tablas de frecuencia se consideran una de las formas de organizar y presentar la


información recopilada. A continuación, presentamos otra manera de presentar los datos y es
en forma gráfica, veremos algunas clases de gráficos.

Diagramas de barras. –

Es un tipo de gráfica construida sobre un plano de ejes rectangulares, en donde el eje


horizontal siempre representa la variable y el eje vertical representa alguno de los tipos de
frecuencia que ya se conoce (esta asignación puedo variar en otros textos, pero para nuestro
estudio la consideraremos según lo señalado).

Ejemplo 1.6.1:

Se toma como referencia el caso del ejemplo 1.4.1. de lo que resulta el siguiente gráfico:

pacientes atendidos en días laborables


diagrama de barras
3.5

3
Frecuencia absoluta fi

2.5

1.5

0.5

0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

Se puede advertir que se puede también extraer muy fácilmente la información relevante y
responder a las mismas preguntas que se realizaron en el caso de las tablas de frecuencia.

Existen algunas variantes de los gráficos de barras que simplemente en su mayoría difieren en
la forma pero que nos ofrecen la misma información.

Como ya se ha mencionado en el eje vertical también se puede representar la frecuencia


relativa y la relativa porcentual, en tales casos la forma será la misma que en el caso de la
frecuencia absoluta, nada más que el eje vertical tendrá escalas diferentes. Como ejemplo de
lo dicho a continuación ilustramos la gráfica de barras utilizando la frecuencia relativa
porcentual.

Ing. Johnny Coronel O.


pacientes atendidos en días laborables
diagrama de barras
16
Frecuencia relativa porcentual fr%

14
12
10
8
6
4
2
0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

Polígonos de frecuencia. –

En ocasiones se suele utilizar los polígonos de frecuencia que se construyen


sencillamente al unir los puntos máximos de las barras, con lo cual se obtienen las siguientes
formas:

pacientes atendidos en días laborables


polígono de frecuencia
3.5

3
Frecuencia absoluta fi

2.5

1.5

0.5

0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

En ciertos casos se suele representar superpuestos los polígonos de frecuencia con el diagrama
de barras.

Ojivas. –

Si se genera un diagrama de barras utilizando la FAA o la FAD resultan los siguientes gráficos si
tomamos como referencia el mismo ejemplo 1.4.1:

Ing. Johnny Coronel O.


pacientes atendidos en días laborables
diagrama de barras
25
Frecuencia acumuolada ascendente

20

15

10

0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

Se puede deducir claramente por qué la FAA toma ese nombre.

pacientes atendidos en días laborables


diagrama de barras
25
Frecuencia acumuolada descendente

20

15

10

0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

Se puede deducir claramente por qué la FAD toma ese nombre.

Si construimos el polígono de frecuencia utilizando FAA y FAD estos nuevos gráficos toman el
nombre de “OJIVAS”, así que nos resultan las siguientes formas:

Ing. Johnny Coronel O.


pacientes atendidos en días laborables
ojiva con FAA
25
Frecuencia acumuolada ascendente

20

15

10

0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

pacientes atendidos en días laborables


ojiva con FAD
25
Frecuencia acumuolada descendente

20

15

10

0
2 3 4 5 6 7 8 9 10 11 12 13 17 18 21
# de pacientes atendidos

Diagramas Circulares o Pastel. –

Otro tipo de gráficas que se utiliza a menudo son los diagramas circulares o tipo pastel, las
cuales tienen una distribución en forma de sectores circulares, en donde cada sector
representa un valor de frecuencia relativa porcentual (puede estar acompañado de fi) en cada
valor de la variable. Para esto utilizaremos otro ejemplo que recurre a variables nominales, ya
que son las que más se recomiendan para este tipo de gráficas.

Ejemplo 1.6.2:

En un curso de tercer nivel se han obtenido los siguientes datos respecto al género de los
estudiantes y sus gustos por los tipos de arte:

Ing. Johnny Coronel O.


Estudiantes de tercer nivel
Estudiante Género Arte
1 Femenino Música
2 Femenino Pintura
3 Masculino Teatro
4 Femenino Teatro
5 Masculino Teatro
6 Masculino Música
7 Masculino Música
8 Masculino Música
9 Femenino Música
10 Masculino Pintura
11 Femenino Teatro
12 Masculino Música
13 Femenino Pintura
14 Femenino Pintura
15 Femenino Teatro

Se requiere conocer el porcentaje en cuanto a género y las preferencias por el arte, para ello
se construirán los respectivos diagramas circulares:

Solución:

Una vez más colocaremos la población, N y la variable para que no se pierda de vista estos
conceptos.

Población: estudiantes del curso de tercer nivel


N=15
Variable: tenemos dos, el género y el gusto por un determinado tipo de arte.

Lo primero que se debe hacer es organizar la información construyendo la tabla de frecuencia,


en esta ocasión utilizaremos la fr%.

Estudiantes de tercer nivel


Variable Género fi fr%
Femenino 8 53.33
Masculino 7 46.67
15 100
Estudiantes de tercer nivel
Variable Arte fi fr%
Música 6 40
Pintura 4 26.67
Teatro 5 33.33
15 100

Ing. Johnny Coronel O.


En segundo lugar, construimos las gráficas. Si se lo hace manualmente se debe distribuir los
sectores de tal manera que el ángulo de cada uno de ellos sea proporcional al valor de la
frecuencia relativa porcentual.

GÉNERO DE LOS ESTUDIANTES DE TERCER NIVEL

Masculino
47%

Femenino
53%

GUSTO POR EL ARTE DE LOS ESTUDIANTES DE


TERCER NIVEL

Teatro
33% Música
40%

Pintura
27%

Se observa que la respuesta a la pregunta planteada se la visualiza muy elocuentemente en


forma numérica y además gráficamente en cada sector ilustrado de los diagramas tipo pastel
generados.

Histogramas. –

Todos los tipos de gráficas mencionadas hasta el momento son muy útiles para cuando se trata
de datos No agrupados. En el caso que se trabaje con datos agrupados lo más conveniente es
utilizar los llamados histogramas, que no son sino un tipo de gráfico de barras especial, en
donde las barras van juntas, es decir, no hay espacio entre ellas, esto se lo hace para indicar
que las clases en las que se ha distribuido la población son continuas.

Ing. Johnny Coronel O.


Ejemplo 1.6.3:

Para ilustrar los histogramas utilizaremos el caso del ejemplo 1.5.1.


Se hace necesario antes de construir la gráfica conocer un nuevo concepto llamado Marca de
clase (Mi), que es un valor que se lo calcula únicamente hallando el promedio de los límites de
cada clase. En la siguiente tabla la última columna contiene el mencionado concepto:

Variable Frecuencias
Clase Límite Inferior Límite superior fi fr fr% FAA FAD Mi
1º 45 54 2 0.1 10 2 20 49.5
2º 55 64 4 0.2 20 6 18 59.5
3º 65 74 8 0.4 40 14 14 69.5
4º 75 84 3 0.15 15 17 6 79.5
5º 85 94 3 0.15 15 20 3 89.5
20 1 100

Es así que resulta la siguiente gráfica utilizando la frecuencia absoluta:

Peso de los alumnos


9

7
Frecuencia absoluta

0
49.5 59.5 69.5 79.5 89.5
Peso en Kg

Se observa que en el eje horizontal se expresa en función de las marcas de clase para cada
columna del histograma.

De igual forma se lo puede construir utilizando cualquiera de las frecuencias ya conocidas.


También se puede construir el llamado polígono de frecuencia y superponerlo al histograma.

Ing. Johnny Coronel O.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy