Estadistica Basica
Estadistica Basica
Estadistica Basica
INTRODUCCIÓN
Este módulo comenzará con el estudio de los diferentes tipos de datos y sus escalas de
medición, y continuará con las distintas medidas y representaciones gráficas que ayudan
a describir, resumir e interpretar la información.
DEFINICIONES Y CONCEPTOS BÁSICOS.
Variables cualitativas.
Variables cuantitativas.
Datos: Conjunto de valores de una variable para cada uno de los elementos de la
muestra.
Variables cualitativas:
Son las variables que expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría y la medición consiste en
una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y
nominales.
Variables cuantitativas:
Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas además pueden ser (según los valores que pueda tomar la variable):
Variables de intervalo: Los datos medidos en una escala ordinal para los cuales
pueden calcularse las distancias entre valores, se llaman datos de intervalo. La
distancia entre dos valores es importante y los datos de intervalo son cuantitativos
por necesidad; una escala de intervalo no siempre tiene un punto cero, uno que
indique la ausencia de lo que se quiere medir. Ejemplo: la temperatura (10°C,
8°C, 35°C,…).
Variables de razón: Los datos medidos en una escala de intervalo con un punto
cero que significa ninguno, se llama datos de razón. Ejemplo: el peso (23 kg,
24 kg, 30 kg,...)
MUESTREO
Cuando se desea conocer o hacer inferencias acerca de alguna característica de una
población, surgen preguntas de cómo seleccionar la información y que tan grande debe
ser el tamaño de la muestra para que las conclusiones extraídas de ella sean
representativas de la población.
El muestreo puede hacerse con o sin reposición; en una muestra sin reposición,
comúnmente empleada en los trabajos estadísticos, las unidades se seleccionan apenas
una vez; en el muestreo con reposición se seleccionan las unidades por lo menos una
vez.
Ejemplo de muestreo sin reposición: En una encuesta electoral, poco antes de
una elección de voto de las personas entrevistadas, éstas deben ser escuchadas
apenas una sola vez, pues, en una elección, el voto es individual.
Ejemplo de muestreo con reposición: Cuando se desea saber cuánto tiempo
gasta una persona haciendo cola en un banco, ésta puede ser observada una o
más veces, cada vez que vuelve al banco.
Ejemplo: Para obtener una muestra de suscriptores telefónicos en una ciudad grande,
puede obtenerse primero una muestra aleatoria de los números de las páginas del
directorio telefónico; al elegir el vigésimo nombre de cada página obtendríamos un
muestreo sistemático, también podemos escoger un nombre de la primera página del
directorio y después seleccionar cada nombre del lugar número cien a partir del ya
seleccionado. Por ejemplo, podríamos seleccionar un número al azar entre los primeros
100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del
directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente.
Ejemplo: Supongamos que nos interesa obtener una muestra de las opiniones de los
profesores de una gran universidad. Puede ser difícil obtener una muestra con todos los
profesores, así que supongamos que elegimos una muestra aleatoria de cada facultad,
o departamento académico; los estratos vendrían a ser los facultades, o departamentos
académicos.
Ejemplo: Supongamos que una compañía de servicio de televisión por cable está
pensando en abrir una sucursal en una ciudad grande; la compañía planea realizar un
estudio para determinar el porcentaje de familias que utilizarían sus servicios, como no
es práctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad
al azar, la cual forma un conglomerado.
ESTADISTICA DESCRIPTIVA
Empleado Nivel Acad. Empleado Nivel Acad. Empleado Nivel Acad. Empleado Nivel Acad.
1 Profesional 31 Profesional 61 Técnico 91 Tecnólogo
2 Técnico 32 Bachiller 62 Tecnólogo 92 Bachiller
3 Técnico 33 Técnico 63 Tecnólogo 93 Bachiller
4 Tecnólogo 34 Bachiller 64 Técnico 94 Tecnólogo
5 Profesional 35 Posgrado 65 Técnico 95 Posgrado
6 Tecnólogo 36 Técnico 66 Bachiller 96 Bachiller
7 Profesional 37 Bachiller 67 Técnico 97 Técnico
8 Tecnólogo 38 Profesional 68 Profesional 98 Técnico
9 Profesional 39 Bachiller 69 Posgrado 99 Bachiller
10 Posgrado 40 Técnico 70 Técnico 100 Profesional
11 Técnico 41 Bachiller 71 Tecnólogo 101 Profesional
12 Bachiller 42 Tecnólogo 72 Bachiller 102 Tecnólogo
13 Tecnólogo 43 Profesional 73 Tecnólogo 103 Bachiller
14 Bachiller 44 Técnico 74 Técnico 104 Técnico
15 Profesional 45 Bachiller 75 Profesional 105 Técnico
16 Técnico 46 Bachiller 76 Tecnólogo 106 Bachiller
17 Bachiller 47 Tecnólogo 77 Bachiller 107 Posgrado
18 Bachiller 48 Profesional 78 Tecnólogo 108 Tecnólogo
19 Profesional 49 Tecnólogo 79 Bachiller 109 Tecnólogo
20 Tecnólogo 50 Tecnólogo 80 Profesional 110 Técnico
21 Bachiller 51 Técnico 81 Bachiller 111 Técnico
22 Técnico 52 Bachiller 82 Tecnólogo 112 Técnico
23 Técnico 53 Bachiller 83 Tecnólogo 113 Bachiller
24 Profesional 54 Bachiller 84 Bachiller 114 Tecnólogo
25 Bachiller 55 Bachiller 85 Profesional 115 Tecnólogo
26 Bachiller 56 Técnico 86 Bachiller 116 Bachiller
27 Bachiller 57 Bachiller 87 Tecnólogo 117 Profesional
28 Profesional 58 Posgrado 88 Técnico 118 Técnico
29 Bachiller 59 Tecnólogo 89 Tecnólogo 119 Bachiller
30 Bachiller 60 Bachiller 90 Profesional 120 Bachiller
Representación Tabular:
Frecuencia Frecuencia relativa
Clase Frecuencia Frecuencia Relativa
Acumulada acumulada
Diagrama de Barras:
45
40
35
30
25
20
15
10
0
Bachiller Técnico Tecnólogo Profesional Posgrado
Diagrama de sectores:
Frecuencias:
6
20
40 Bachiller
Técnico
Tecnólogo
Profesional
27 Posgrado
27
Frecuencias relativas:
0,05
0,17
0,33 Bachiller
Técnico
Tecnólogo
Profesional
0,23 Posgrado
0,23
TABLAS DE CONTINGENCIA:
La empresa del ejemplo anterior consta de tres plantas y sus empleados están
distribuidos de la siguiente forma:
Planta A 5 7 6 10 4
Planta B 18 11 9 6 1
Planta C 17 9 12 4 1
Diagrama de Barras:
18
16
14
Bachiller
12
Técnico
10
Tecnólogo
8
Profesional
6
Posgrado
4
2
0
Planta A Planta B Planta C
45
40
35 Posgrado
30 Profesional
25
Tecnólogo
20
Técnico
15
Bachiller
10
5
0
Planta A Planta B Planta C
Estadísticos Descriptivos:
Mediana: Es el valor que divide los datos en dos partes iguales cuando
estos se presentan en orden de magnitud creciente o decreciente.
Ejemplo: Organizando los datos anteriores: 0, 2, 2, 2, 3, 4, 5, 7, 11. Vemos
que el dato que está en el centro es 3, por tanto, la mediana es 3.
Moda: Valor que ocurre con mayor frecuencia (Puede no existir la moda o
haber varios valores modales).
Ejemplo: Del ejemplo anterior, el dato que más se repite es 2, por tanto, la
moda de este conjunto de datos es 2.
2. Medidas de colocación:
Percentiles: El n-ésimo percentil, denotado con ܲ , es el valor para el cual
3. Estadísticos de dispersión:
La dispersión o variación de los datos mide cuán esparcidos se encuentran éstos
o qué tan heterogéneos son. Hay varias medidas de dispersión, siendo las más
comunes las siguientes:
ഥ) + (࢞ − ࢄ
(࢞ − ࢄ ഥ) + ⋯ + (࢞ − ࢄ
ഥ)
ࡿ= ඨ
−
Ejemplo: Para nuestros datos, la desviación estándar es:
manera que ℎ݇ ≥ ܴ.
c. Las fronteras de clase son cerradas por el lado izquierdo.
Clase Frecuencia
1,41 1,86 1
1,86 2,31 1
2,31 2,76 3
2,76 3,21 12
3,21 3,66 17
3,66 4,11 11
4,11 4,56 4
4,56 mayor 1
Gráficos:
Histograma.
Histograma - Matemáticas
18
16
14
12
Frecuencia
10
8
6
Frecuencia
4
2
0
1,41 1,86 2,31 2,76 3,21 3,66 4,11 y
mayor...
Clase
Boxplot:
El boxplot proporciona información sobre el centro, la dispersión y la simetría de
un conjunto de observaciones. En él se pueden ubicar valores como los cuartiles,
la media, la mediana y los valores máximo y mínimo de los datos. Además se
pueden identificar puntos extremos, los cuales aparecen antes del primer cuartil o
después del tercer cuartil indicando que en la distribución de datos existen valores
muy altos o muy bajos que no están incluidos en el rango intercuartílico.