Estadistica I
Estadistica I
Estadistica I
Definición de estadística
• Rama de las matemáticas que se refiere a un conjunto de métodos, normas, reglas y principios para
observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo.
• Es la ciencia de los datos.
• La estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al
investigador obtener conclusiones útiles sobre ellos.
La utilidad de la estadística se aplica en la actividad Industrial, Medicina, Biología, Educación, Banca y Comercio
y otras. Por mencionar las aplicaciones en la administración de las empresas, al hacer los registros de las
operaciones comerciales, van acumulando los resultados, ya sean pérdidas o utilidades, se hacen estudios de
mercado y se interpreta en graficas estadísticas y se utilizan en la toma de decisiones
División de la estadística
Estadística descriptiva: Es aquella que utiliza técnicas y medidas que indican las características de los datos
disponibles. Comprende el tratamiento y análisis de datos que tienen por objeto resumir y describir los hechos
que han proporcionado la información, y que por lo general toman la forma de tablas, gráficos, cuadros e índices.
Estadística inferencial: Es la parte de la Estadística mediante la cual se intenta dar explicación, concluir o inferir
sobre los experimentos y fenómenos observados, mediante el auxilio de la probabilidad, estadística descriptiva
y distribución de probabilidad, por lo que resulta una herramienta de suma utilidad para la toma de decisiones.
Población:
Se define como un conjunto de individuos o de objetos que poseen una o varias características comunes.
Censo:
Muestra:
Es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar las propiedades del
conjunto del cual es obtenida.
Las características de la muestra dependen del criterio del muestreo empleado para su determinación. Sin
embargo, para que una muestra sea representativa de la población, ésta deberá contener aproximadamente
entre el 5 % y el 10 % de los datos de la población cuando ésta es finita, además los elementos de la muestra
deben ser escogidos al azar (a la suerte) y se deben observar todas las características que se observan en la
población.
Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e
interpretación.
A) Datos Internos: son aquellos datos que no necesitan de observaciones adicionales al experimento; es
decir, no es necesario buscar características que proporcionen información adicional acerca del experimento.
Ejemplo: Las calificaciones de un grupo, un experimento químico, etcétera.
a) Datos Bibliográficos: son aquellos ya conocidos y que podemos encontrar fácilmente utilizando
bibliografía, registros, actas, etcétera, como los datos históricos, censos y otros.
b) Datos Originales: son aquellos que podemos obtener mediante métodos de recolección, como las
encuestas, plebiscitos, referéndum, y nos proporcionan datos reales y certeros.
Para Organizar los datos: existen muchas formas de clasificarlos, en general pueden ser determinados de acuerdo
a cuatro elementos que son: Tiempo, lugar, cantidad y cualidad.
Considerando la estadística que es la ciencia de los datos. Cualquier conjunto de datos contiene información
sobre un grupo de individuos. La información se organiza en forma de variables.
Los individuos son los objetos descritos por un conjunto de datos. Los individuos pueden ser personas,
pero también pueden ser animales o cosas.
Una variable es cualquiera característica de un individuo. Una variable puede tomar distintos valores
para distintos individuos.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Variable Estadística
Variable estadística es una propiedad característica de la población que estamos interesados en estudiar.
a) Cualitativas: son aquellas a las que no se les puede asignar o identificar con un valor numérico, sino con
un aspecto, cualidad o característica que las distinga y que no se pueden medir sino solo observar, a ese
aspecto, cualidad o característica se le llama categoría. No se expresan mediante un número.
Las variables categóricas, son etiquetas o nombres usados para identificar un atributo de cada elemento. Un
elemento no puede estar en dos o más categorías a la vez, lo cual las hace excluyentes y además no puede haber
elementos de la población que no pertenezcan a alguna categoría, lo cual las hace exhaustivas.
Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general de cualquier cosa, idioma, nacionalidad,
colores, cabello o piel, himnos nacionales, sexo, estado de ánimo, clima, etcétera.
Se clasifica en:
Variables Categóricas Nominales: son aquellas a las que no se les puede asignar un orden, es decir que sólo
permite clasificación en categorías por mención de ésta.
Variables Categóricas Ordinales: son aquellas que además de clasificar a los elementos en distintas categorías
les podemos asignar un orden o que podemos ordenar de acuerdo a cierta característica. Ejemplo: El estado de
salud de una persona; que podemos ordenarla según la urgencia del caso, el color de algún objeto según la
tonalidad desde muy clara a más oscuro; que podemos ordenarlo de acuerdo a la intensidad del color, el grado
militar, puesto en la empresa, día de las madres, meses del año, etcétera.
b) Variables Cuantitativas: Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente. Puede ser discreta o continua.
Variables cuantitativas continuas (datos continuos), si admiten tomar cualquier valor dentro de un rango
numérico determinado (tiempo fuera de servicio de un equipo, tiempo entre fallas, edad del equipo,
temperatura ambiental, etc).
Variables cuantitativas discretas (datos discretos), si no admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (número de fallas, número de paradas de mantenimiento, número de
equipos, etc).
Variable aleatoria:
Una variable aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un
experimento aleatorio. Las variables aleatorias se denotan con una letra mayúscula, tal como X, y con una letra
minúscula, como x, el valor posible de x. El conjunto de los posibles valores de la variable aleatoria X recibe el
nombre de rango de X.
Es una variable aleatoria con un rango finito. Ejemplo: Número de hijos en una familia, talla de calzado, la
cantidad de alumnos por grupo, Número de artículos defectuosos en un lote de artículos, etc.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Ejemplo 1. La cantidad de errores de facturación por día en un período de 20 días, ordenados en orden
ascendente es
0 0 1 1 2 4 4 4 5 666 7 8 8 9 9 9 9 9
Si se considera la variable aleatoria X como el número de errores de facturación por día en el ejemplo, la
variable es:
Los valores que asume la variable son discretos, porque sus valores se pueden enumerar.
X: Número de caras
X: 0, 1, 2, 3
X: 0 ------- sss X: 1 -------- css, scs, ssc X: 2 ------- ccs, csc, scc X:3 ------- ccc
Son aquellas que pueden tomar cualquier valor entre dos valores dados. Es decir, el rango contiene no sólo
valores enteros sino un intervalo (finito o infinito) de valores reales (esto es, que puede ser fraccionario,
decimal o irracional). Ejemplo: El tiempo de vida de una persona, la cantidad de azúcar para endulzar un café,
el nivel de hemoglobina de los habitantes de una colonia, la temperatura ambiental durante un día, etcétera.
d) ¿Qué tipo de escala de medición se usa para cada una de las variables?
Los elementos son las entidades a partir de las cuales se reúnen los datos. Hay 10 elementos (Audi, BMW 328 Xi,
Cadillac CTS, ….., Volkswagen Jeta).
Una variable es una característica de interés para los elementos. Hay 5 variables (Tamaño, Cilindros, Ciudad
Millas por galón, Autopista Millas por galón, Combustible).
Hay dos variables categóricas (Tamaño y Combustible) y tres variables cuantitativas (Cilindros, Ciudad Millas por
galón, Autopista Millas por galón).
d) ¿Qué tipo de escala de medición se usa para cada una de las variables?
Cilindro, Ciudad Millas por galón, Autopista Millas por galón: escala de razón.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
D. DISTRIBUCIONES DE FRECUENCIAS.
Para Organizar los datos existen muchas formas de clasificarlos, en general pueden ser determinados de acuerdo
a cuatro elementos que son: Tiempo, lugar, cantidad y cualidad.
Después de la organización de los datos, la información se resume en Tablas Estadísticas con base en
arreglos formados de renglones y columnas, adecuados según cronología, geografía, análisis cuantitativo o
cualitativo.
Los principales elementos de una tabla estadística son: Título, unidades, encabezado, cuerpo o
contenido, nota de pie y referencias.
Se elabora colocando en la primera columna los datos diferentes o subgrupos de datos (llamados clases
o intervalos de clase) y en la columna siguiente el número de observaciones que corresponden a cada dato o a
cada grupo de datos (llamada frecuencia).
Una tabla de este tipo dará, en forma abreviada, una información completa acerca de la distribución de
los valores observados.
Distribución de frecuencias
Una distribución de frecuencias es método de clasificación de datos en clases o intervalos, que muestra el
número o porcentaje de observaciones de cada una de ellas. Esto proporciona una forma de observar un
conjunto de números sin que se tenga que considerar en forma individual.
El procedimiento para elaborar una distribución de frecuencias, depende del tipo de datos particulares
(esto es, continuos, discretos, nominales o jerarquizados). En primer lugar, si consideraremos datos que se miden
en una escala continua.
Los pasos principales en la elaboración de una distribución de frecuencias para observaciones de una muestra
se enumeran a continuación:
1. Establecer el número de clases o intervalos (k) en que se agruparán los datos. En la práctica se eligen
entre 5 y 15 intervalos. K es el número de intervalos el cual siempre debe ser un número entero.
Una regla empírica o Regla de Velleman es calcular la raíz cuadrada del número de observaciones (n),
siempre que n < 50. n es el número de observaciones o datos.
𝒌 = √𝒏
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
O bien la Regla de Sturges que se utiliza para determinar el número mínimo de intervalos que debe
tener la distribución de frecuencias. La desventaja de la regla de Sturges es que debe tener un tamaño de la
muestra considerable para garantizar confiabilidad en su aplicación (como n>30).
𝟏𝟎
𝒌=𝟏+ ∗ 𝐥𝐨𝐠(𝒏)
𝟑
Donde n es el número de observaciones o datos
2. Determinar el rango o amplitud de las observaciones (R), el cual se obtiene como la diferencia entre el
mayor y el menor valor numérico de las observaciones.
La longitud de cada intervalo o amplitud de clase (A) se obtiene dividiendo al rango ampliado por el número
de intervalos:
𝑹
𝑨=
𝒌
3. Con el fin de que la diferencia R* - R se distribuya en forma equitativa, debemos dividir esta diferencia
por 2, y repartirla en ambos extremos del rango original. Con esto logramos que los límites de los
intervalos tengan una mayor aproximación decimal que la que tienen las observaciones originales.
Usaremos el símbolo: (a,b] para representar a todas las observaciones que son mayores que “a” pero
menores o iguales que “b”.
El límite del primer intervalo se obtiene restando a la primera observación el cociente: (R* - R) /2. Los
límites de los demás intervalos se obtienen sumando sucesivamente la longitud de cada intervalo.
4. El punto medio de cada intervalo, llamado marca de clase se obtiene promediando los límites inferior
y superior de cada intervalo, es el valor más representativo de cada intervalo. Se le simboliza por: 𝑥𝑗
5. Contar el número de observaciones que pertenecen a cada intervalo, a las cuales se les llama frecuencias
absolutas de la clase y se les representa por: 𝑓𝑗
6. La frecuencia relativa (𝒇𝒓 ) de un intervalo se obtiene dividiendo a la frecuencia de la clase por el número
total de observaciones en la muestra.
7. La frecuencia acumulada (𝑭𝒂 ) es la cantidad que nos indica cuántas observaciones existen, cuyo valor
numérico es menor o igual al límite superior de un intervalo. Esta se puede expresar en términos de las
frecuencias absolutas o de las frecuencias relativas.
EJEMPLO. Considérense los siguientes datos, del tiempo entre fallas de un equipo:
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64 8.82
5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26 7.90 6.65 7.25 6.26 6.43 7.71
7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14 6.91 7.82 6.76 7.75 7.36
8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 7.10 4.00
𝑅 6.53
La amplitud de clase (A) es 𝐴 = 𝑘 = 8
= 0.816, se toma una décima por encima, es decir, A = 0.9
En particular, en este ejemplo usaremos 8 intervalos de clase de longitud igual a 0.9 unidades.
A fin de que estas observaciones extremas queden incluidas dentro de los intervalos, usaremos un valor
ligeramente mayor a R = 6.53, al que llamaremos rango extendido (R*), de modo que este último sea un
múltiplo de R.
Distribuyendo de manera equitativa esta diferencia, dividimos este resultado por dos, así tenemos el valor
0.335.
Restando esta cantidad al menor valor observado Xmin = 3.81, obtenemos: Xmin = 3.81 - 0.335 = 3.475.
Ahora elegimos a 3.475 como el límite inferior del primer intervalo de clase. Si a este valor le sumamos la
longitud del intervalo obtenemos: 3.475 + 0.9 = 4.375, el cual será el límite superior del primer intervalo.
Procediendo de esta forma, obtendremos los límites de los demás intervalos.
(3.475, 4.375], (4.375, 5.275], (5.275, 6.175], (6.175, 7.075], (7.075,7.975], (7.975,8.875], (8.875,9.775],
(9.775,10.675]
En el intervalo (3.475,4.375] se encuentran incluidas las observaciones: 3.81, 4.00 y 3.86, por lo que la frecuencia
absoluta fj de este intervalo es igual a 3. Procediendo a contar las frecuencias en cada uno de los demás
intervalos, obtenemos las siguientes frecuencias absolutas: 2, 7, 19, 22, 13, 4 y 3 respectivamente. De esta forma
la Distribución de frecuencias contiene hasta este momento la siguiente información:
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
La marca de clase (punto medio de un intervalo), se obtiene promediando los valores de los límites inferior y
superior de cada intervalo. Así tenemos:
3.475 + 4.375 4.375 + 5.275 9.775 + 10.675
= 3.925 = 4.825 …. = 10.225
2 2 2
Así, las marcas de clase xj son:
Para terminar de construir la Distribución de frecuencias solo nos falta calcular las frecuencias relativas:
fr y las frecuencias acumuladas: Fa.
Las frecuencias relativas se calculan dividiendo a las frecuencias absolutas de cada intervalo, por el
número de observaciones en la muestra. Así, por ejemplo, la frecuencia relativa del primer intervalo es: 3/73 =
0.04
Las frecuencias acumuladas las obtenemos sumando las frecuencias absolutas (o relativas) que se
encuentren contenidas hasta el límite superior del intervalo de clase considerado.
Por ejemplo, la frecuencia acumulada absoluta hasta el límite superior del segundo intervalo es: 3 + 2 =
5.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Los corchetes expresan que el valor extremo se incluye en el intervalo y los paréntesis dan a entender
que el valor extremo del intervalo no se incluye en el.
Al elaborar una distribución de frecuencias que utiliza datos continuos, se pierde cierta información debido a
que los valores individuales pierden su identidad cuando se agrupan en clases. Esto puede o no suceder en el
caso de datos discretos, dependiendo de la naturaleza.
Ejemplo. Considérense los siguientes datos acerca de los accidentes que ocurren durante 50 días en un
estacionamiento:
6 9 2 7 0 8 2 5 4 5 4 4 4 4 2 5 6 3 3 8 8 4 4 4 7 7 6 4 7 5 3 7 1 3 8 0 5 1 2 3 6 0 5 6 6 2 7
5 6 3
Las observaciones constan de números enteros que van de 0 a 9, utilizando a estos como clases, podemos
construir una distribución de frecuencias sin que haya pérdida de los valores originales.
Ejemplo. El periodo de almacén (vida de anaquel) de una película fotográfica de alta velocidad está siendo
investigada por un fabricante. Se dispone de los siguientes datos
125 127 140 135 126 120 121 142 151 160 140 125 124 122 121 127 130 131 141 137 121 127 128
134 140 121 126 124 125 127 141 147 150 132 143 121 124 131 141 127
120 121 121 121 121 121 122 124 124 124 125 125 125 126 126 127 127 127 127 127 128
130 131 131 132 134 135 137 140 140 140 141 141 141 142 143 147 150 151 160
𝑅 40
La amplitud de clase (A) es 𝐴 = 𝑘 = 7
= 5.71, se toma una unidad por encima, es decir, A = 6
A fin de que estas observaciones extremas queden incluidas dentro de los intervalos, usaremos un valor
ligeramente mayor a R = 6.53, al que llamaremos rango extendido (R*), de modo que este último sea un múltiplo
de R.
Eligiendo a R* = 7(6) = 42
Distribuyendo de manera equitativa esta diferencia, dividimos este resultado por dos, así tenemos el
valor 1.
Restando esta cantidad al menor valor observado Xmin = 120, obtenemos: Xmin = 120 - 1 = 119.
Ahora elegimos a 119 como el límite inferior del primer intervalo de clase. Si a este valor le sumamos la
longitud del intervalo obtenemos: 119 + 6 = 125, el cual será el límite superior del primer intervalo. Procediendo
de esta forma, obtendremos los límites de los demás intervalos.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
[119, 125), [125, 131), [131, 137), [137, 143), [143, 149), ([119, 125), ([149, 155), [155, 161)
En el intervalo [119, 125) se encuentran incluidas las observaciones: 120, 121, 121, 121, 121, 121, 122,
124, 124, y 124 por lo que la frecuencia absoluta fj de este intervalo es igual a 10. Procediendo a contar las
frecuencias en cada uno de los demás intervalos, obtenemos las siguientes frecuencias: 12, 5, 8, 2, 2 y 1
respectivamente. De esta forma la Distribución de frecuencias contiene hasta este momento la siguiente
información:
La marca de clase (punto medio de un intervalo), se obtiene promediando los valores de los límites
inferior y superior de cada intervalo. Así tenemos:
119 + 125 125 + 131 155 + 161
= 122 = 128 … = 158
2 2 2
Así, las marcas de clase xj son: 122, 128, 134, 140, 146, 152, 158
Las frecuencias relativas se calculan dividiendo a las frecuencias absolutas de cada intervalo, por el
número de observaciones en la muestra. Así, por ejemplo, la frecuencia relativa del primer intervalo es: 10/40
= 0.25
El 25% de las películas fotográficas tienen un promedio de vida de 122 días, mientras que el 30% de las
películas fotográficas tienen un promedio de vida de 128 días
Las frecuencias acumuladas las obtenemos sumando las frecuencias absolutas (o relativas) que se
encuentren contenidas hasta el límite superior del intervalo de clase considerado.
Por ejemplo, la frecuencia acumulada absoluta hasta el límite superior del segundo intervalo es: 10 +
12 = 22 22 + 5 = 27 …… 39 + 1 = 40
Niña, niña, niño, niño, niño, niña, niña, niño, niño, niño, niña, niña, niño, niño, niño, niña, niña, niño, niño, niño,
niña, niña, niño, niño, niño, niña, niña, niño, niño, niño, niña, niña.
Se tiene una variable cualitativa (X) que es el sexo de los usuarios del Centro de Rehabilitación, los posibles
valores que asumen la variable son:
X: niño, niña
Sexo de los usuarios del Cantidad Porcentaje de sexo Cantidad de Porcentaje acumulados
Centro de usuarios de los usuarios usuarios de usuarios
Rehabilitación acumulados
Niño 18 (18/32) *100= 56% 18 (18/32) *100= 56%
Niña 14 44% 18+14 = 32 (32/32) *100= 100%
Total 32 100%
Narrativa Biografía Poesía Cuento Biografía Narrativa Cuento Cuento Poesía Biografía Poesía
Narrativa Narrativa Teatro Poesía Biografía Narrativa Poesía Biografía Narrativa Cuento Narrativa
Poesía Poesía Narrativa Poesía Poesía Narrativa Narrativa Biografía Narrativa Biografía Biografía
Narrativa Poesía Teatro Biografía Narrativa Teatro Narrativa Biografía Cuento Poesía Poesía
Narrativa Poesía Biografía Narrativa Poesía Narrativa Poesía Poesía Narrativa Teatro Teatro Poesía
Biografía Narrativa Poesía Narrativa Poesía Biografía Narrativa Poesía Narrativa Narrativa Teatro
Teatro Biografía Biografía
Se tiene una variable cualitativa (X) que es el género de los libros de la biblioteca, los posibles valores que
asumen la variable son:
En la Biblioteca pública el 32.9% de los libros son del género Narrativa, le sigue los libros del género Poesía que
tienen el 28.6%, mientras, que los que tienen menos libros es el género cuentos con un 7.1%.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
En la Biblioteca pública el 82.9% de los libros son del género Narrativa, Poesía y Biografía.
Sabemos el orden que mantiene, la nota más baja es el Insuficiente, le siguen el Suficiente y Notable y la más
alta es Sobresaliente
El 88.9% (100% -11.1% o (33.3% + 38.9 % + 16.7%)) de los alumnos aprobaron el examen
De los 16 (18-2) alumnos que aprobaron, 13 (16-3) alumnos no sacaron la nota más alta.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
E. GRÁFICAS DESCRIPTIVAS
GRÁFICAS DESCRIPTIVAS
Los gráficos son muy útiles como apoyos e incluso sustitutos de las tablas o distribuciones y como una
herramienta para el análisis de los datos, lo que los convierte en el medio más efectivo para la presentación,
descripción, resumen y análisis de la información.
La representación gráfica de los datos constituye un instrumento de gran utilidad ya que proporciona una
imagen que permite:
Existen diversos tipos de gráficas, cada uno de ellos adecuado a un cierto tipo de variables, por lo que
podemos clasificar las gráficas atendiendo a estos tipos.
- El diagrama de sectores, que refleja como sectores de un círculo las frecuencias de cada modalidad.
Como el radio es constante en un círculo, para cumplir la regla fundamental de proporcionalidad basta
hacer al ángulo de cada sector proporcional a la frecuencia, lo que se consigue multiplicando los 360º
del círculo por la frecuencia relativa de cada modalidad. Este tipo de gráficas es muy útil para comparar
los resultados de una variable cualitativa en dos o más muestras.
Hay otras gráficas menos frecuentes pero igualmente válidas para variables cualitativas; cabe citar los
pictogramas, en los que se representa una misma figura para cada modalidad pero con tamaño proporcional
a las frecuencias (pictograma por extensión) o una misma figura repetida tantas veces como sea necesario
para reflejar la frecuencia de cada modalidad (pictograma por repetición), los cartogramas, en los que se
representa cada modalidad sobre puntos o regiones de un mapa, o los diagramas de superficie, en los que
se divide una figura geométrica, generalmente un rectángulo, en trozos proporcionales a las frecuencias.
Por su parte, para variables CUANTITATIVAS los tipos de gráficas más importantes son los siguientes:
- Para variables discretas, el diagrama de segmentos. Las variables discretas toman valores aislados, como
puntos sueltos, en la “recta de los números”; ésta suele representarse horizontalmente con los valores
negativos a la izquierda del cero y los positivos a la derecha; por esos puntos sueltos, la gráfica adecuada
para las variables discretas es el diagrama de segmentos, en el que sobre cada valor de la variable se
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
coloca verticalmente un segmento que tiene una longitud proporcional a su frecuencia; así se consigue
que la abscisa (horizontal) refleje los valores y que la ordenada (vertical) exprese las frecuencias de la
variable. Es lo mismo usar para ello frecuencias absolutas o relativas, ya que las dos clases de frecuencias
son a su vez proporcionales por la propia definición de frecuencia relativa; por ello podemos hacer el
diagrama con frecuencias absolutas o relativas, a voluntad. Junto con el diagrama de segmentos, puede
dibujarse una línea quebrada que una los extremos superiores de los segmentos, que se llama polígono
de frecuencias; a veces este polígono (que matemáticamente no es tal, sino una “poligonal”) se
representa sólo, como si se hubieran borrado los segmentos verticales. El polígono de frecuencias
también puede usarse junto con:
Para elaborar este grafico se sitúan las categorías o valores en el eje de abscisas y en el de ordenadas las
frecuencias absolutas o relativas. Sobre la marca correspondiente a cada categoría o valor se alza una barra
perpendicular al eje de abscisas de altura igual a su frecuencia.
• El perfil del diagrama es el mismo si se representan las frecuencias absolutas o las frecuencias relativas.
• El criterio de orden de las categorías (datos cualitativos) más adecuado es el de mayor a menor
frecuencia, mientras que el de los valores (datos cuantitativos) es de menor a mayor valor de X.
• Este grafico permite visualizar rápidamente las categorías o valores más o menos frecuentes.
Un histograma es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la
escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia; en
tanto que las barras se dibujan de manera adyacente (sin huecos entre sí).
En la escala horizontal se marca cada barra del histograma con su frontera de clase inferior a la izquierda, y
su frontera de clase superior a la derecha. En vez de utilizar las fronteras de clase a lo largo del eje horizontal, a
menudo es más práctico el uso de los valores de la marca de clase en el centro de las barras correspondientes.
El uso de los valores de la marca de clase es muy común en los programas de cómputo que generan histogramas
de manera automática.
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
12
CANTIDAD DE PELÍCULAS
10
0
[119, 125) [125, 131) [131, 137) [137, 143) [143, 149) [149, 155) [155, 161)
VIDA DE LAS PELÍCULAS
Escala horizontal: Utilice las marcas de clase, es decir, los puntos medios de los intervalos de clases.
12
CANTIDAD DE PELÍCULAS 10
0
122 128 134 140 146 152 158
PROMEDIO DE VIDA DE LAS PELÍCULAS EN DÍAS
Un histograma de frecuencias relativas tiene la misma forma y escala horizontal que un histograma, pero la
escala vertical está marcada con las frecuencias relativas en vez de las frecuencias reales.
Escala vertical: Utilice las frecuencias relativas de clase, en este caso, se utiliza la frecuencia relativa porcentual.
30,0%
PORCENTAJE DE PELÍCULAS
25,0%
20,0%
15,0%
10,0%
5,0%
0,0%
[119, 125) [125, 131) [131, 137) [137, 143) [143, 149) [149, 155) [155, 161)
VIDA DE LAS PELÍCULAS
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Escala horizontal: Utilice las marcas de clase, es decir, los puntos medios de los intervalos de clases.
Escala vertical: Utilice las frecuencias relativas de clase, en este caso, se utiliza la frecuencia relativa porcentual.
30,00%
PORCENTAJE DE PELÍCULAS
25,00%
20,00%
15,00%
10,00%
5,00%
0,00%
122 128 134 140 146 152 158
PROMEDIO DE VIDA DE LAS PELÍCULAS
Polígono de frecuencias
Un polígono de frecuencias es una herramienta gráfica que se emplea a partir de un histograma de frecuencia (es
decir, otro tipo de gráfico que expresa las frecuencias mediante columnas verticales). Para ello, se unen con una
línea los distintos puntos medios de las columnas del histograma, sin dejar espacio entre una y otra, logrando así
un polígono
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de
cada rectángulo de un histograma. El polígono cierra en el límite inferior de la primera y última clase.
0
[119, 125) [125, 131) [131, 137) [137, 143) [143, 149) [149, 155) [155, 161)
VIDA DE LA PELÍCULA EN DÍAS
CANTIDAD DE PELÍCULAS
14
12
CANTIDAD DE PELÍCULAS
10
0
[119, 125) [125, 131) [131, 137) [137, 143) [143, 149) [149, 155) [155, 161)
VIDA DE LA PELICULA
Ejemplo: Se tiene la siguiente distribución de frecuencia de una muestra de 70 libros biblioteca pública en
diferente género:
Elaborar un Histograma.
Se tiene una variable cualitativa (X) que es el género de los libros de la biblioteca, los posibles valores que
asumen la variable son:
20
15
%
10
0
Narrativa Biografía Poesía Cuento Teatro
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Teatro
Cuento
Poesía
Biografía
Narrativa
Frecuencia
del defecto
Variable
cualitativa
Frecuencia Frecuencia
Tipo de defecto Recuento relativa acumulada
Rasgadura de la tela 4 8 8
Decoloración de la tela 3 6 14
Rotura del tablero de fibra 36 72 86
Bordes deshilachados 7 14 100
50
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Tipos de defectos
80
70
60
50
40
30 Frec relativa
20
10
0
Rasgadura de Decoloración Rotura del bordes
la tela de la tela tablero de fibra dehilachados
Frec acumulada
120
100
80
60
40 Frec acumulada
20
0
Rotura del bordes Rasgadura de Decoloración
tablero de dehilachados la tela de la tela
fibra
Diagrama de sectores
El diagrama de sectores, que refleja como sectores de un círculo las frecuencias de cada modalidad o categoría.
Como el radio es constante en un círculo, para cumplir la regla fundamental de proporcionalidad basta hacer al
ángulo de cada sector proporcional a la frecuencia, lo que se consigue multiplicando los 360º del círculo por la
frecuencia relativa de cada modalidad. Este tipo de gráficas es muy útil para comparar los resultados de una
variable cualitativa en dos o más muestras.
Una vez tenemos las frecuencias, debemos calcular el ángulo correspondiente a cada dato, que será
proporcional a cada frecuencia, es decir, a mayor frecuencia, el sector será más amplio y a menor frecuencia el
sector será más pequeño.
𝑓𝑖
𝛼𝑖 = × 360°
𝑁
Donde:
Ejemplo: Se tiene la siguiente distribución de frecuencia de una muestra de 70 libros biblioteca pública en
diferente género:
Se tiene una variable cualitativa (X) que es el género de los libros de la biblioteca, los posibles valores que
asumen la variable son:
Para realizar un diagrama de sectores se debe calcular el ángulo y el porcentaje que corresponde a cada sector
o categoría.
23 23
𝑁𝑎𝑟𝑟𝑎𝑡𝑖𝑣𝑎:𝛼 = × 360° = 118.3% = × 100 = 32.9
70 70
15 15
𝐵𝑖𝑜𝑔𝑟𝑎𝑓𝑖𝑎:𝛼 = × 360° = 77.1% = × 100 = 21.4
70 70
……
7 10
𝑇𝑒𝑎𝑡𝑟𝑜:𝛼 = × 360° = 36% = × 100 = 10
70 70
ESTADÍSTICA I – Introducción a la Estadística Prof. Julia Marcano – UDO (2021)
Para representar cada sector en el diagrama circular, se dibuja un círculo y un radio vertical en 0o desde cero
grados en sentido de las agujas del reloj se coloca el ángulo de 118.3o del sector Narrativa,
118.3o
Luego se coloca el ángulo se 77.1 del sector Biografía, y así sucesivamente hasta terminar con el ángulo de
36ode Teatro.
118.3o
77.1o
10%
7% Narrativa
33%
Biografía
Poesía
Cuento
29%
Teatro
21%
El 33% de los libros que tiene la biblioteca son de género Narrativa, mientras que el género Poesía representa el
29% y el 21% es de género Biografía.