Manual Estadistica
Manual Estadistica
Manual Estadistica
ESCUELA DE POSGRADO
FACULTAD DE CIENCIAS
ESTADÍSTICA APLICADA
A la investigación científica
Ventanilla - 2017
1
INTRODUCCIÓN
En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de
observaciones muestrales o históricas, crean modelos lógico-matemáticos que se "aventuran" describir
o pronosticar un determinado fenómeno con cierto grado de certidumbre medible
La estadística, entonces, dejó de ser una técnica exclusiva de los estados, para convertirse en una
herramienta imprescindible de todas las ciencias, de donde proviene la desconcertante des-
uniformidad en las definiciones de los diferentes autores, ya que cada estudioso la define de acuerdo
con lo que utiliza de ella y tenemos definiciones como que: la estadística es la tecnología del método
científico, o que es el conocimiento relacionado con la toma de decisiones en condiciones de
incertidumbre, o que la estadística son métodos para obtener conclusiones a partir de los resultados de
los experimentos o procesos, o que es un método para describir o medir las propiedades de una
población. En fin, no se trata de discutir si la estadística es una ciencia, una técnica o una herramienta,
sino de la utilización de sus métodos en provecho de la evolución del conocimiento
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si
tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre... y
la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con
un determinado grado de confianza
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de
incursionar en la totalidad de las ciencias
La estadística proporciona reglas, técnicas e instrumentos para los investigadores de diferentes ramas
del saber humano.
En los últimos años la aplicación del método científico a las ciencias exactas e ingeniería, ha
aumentado considerablemente lo cual ha llevado conjuntamente una gran difusión de las técnicas
estadísticas en la gran mayoría de los trabajos de investigación
ESTADÍSTICA 2
INTRODUCCIÓN A LA ESTADÍSTICA
I. OBJETIVOS DE LA SESION:
Los alumnos deberán ser capaces de:
-Comprender qué estudia la Estadística.
-Definir algunos términos estadísticos básicos.
DEFINICIONES BASICAS
¿QUÉ ES ESTADÍSTICA?
Es la ciencia que nos proporciona un conjunto de métodos, técnicas o procedimientos para: Recopilar,
Organizar (clasificar, agrupar), Presentar, y Analizar datos con el fin de describirlos o de realizar
generalizaciones válidas.
La Estadística actúa como disciplina de interconexión entre los modelos matemáticos y los
fenómenos reales. Un modelo matemático es una abstracción simplificada de una realidad más
compleja. Por ello, siempre existirá cierta diferencia entre lo observado y lo previsto en el modelo.
¿Que es un dato?
Los datos pueden concebirse como información numérica necesaria para ayudarnos a tomar una
decisión con más bases en una situación particular.
POBLACION: Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los
cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos
producidos por una fábrica en un año, etc.).
Población finita: Es aquella que tiene un número determinado de elementos. Por ejemplo, se puede
considerar como una población finita a todas las llantas fabricadas por la Goodyear en un año.
Población infinita: Es aquella que tiene un número infinito de elementos. En la práctica, una
población finita con un número grande de elementos se considera una población infinita. .Por ejemplo
el conjunto de todos los resultados posibles al lanzar una moneda de forma sucesiva constituye una
población infinita.
Parámetro Es una medida de resumen que se calcula para describir una característica de toda
una población. Ejemplo: La tasa de desempleo se ha mantenido en 30%. Es un índice
estadístico que va dirigido a describir a la población.
o Son calculadas a partir de los datos observados de toda la población . La idea es resumir
toda la información que hay en la población en unos pocos números (parámetros).
Estadístico o estimador Es una medida que se calcula para describir una característica de una
muestra de la población. Ejemplo: De los 100 estudiantes entrevistados, el 70% apoya la
resolución sobre la vacancia del Rector
o Se representa por :
x Media muestral.
s 2 = Varianza muestral.
p = Proporción muestral.
r= Coeficiente de correlación muestral
n2 x2
POBLACIÓN n3
x3
. .
. .
nm
xm
PAR
ÁMETRO ESTIMA
DOR
ES
NOTA.-
Ejemplo 1: Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente
por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferían esta
marca.
a. ¿Qué constituye la muestra?
b. ¿Qué constituye la población?
c. ¿Cuál es la proporción, dentro de la muestra, de las amas de casa que prefieren la marca del
detergente?
Solución:
a. El conjunto de respuestas que dieron las 50 amas de casa.
b. El conjunto formado por las posibles respuestas de las amas de casa.
c. Es el estimador proporcional 0.6
Ejemplo 2: Una compañía produce arandelas que se supone tengan un diámetro promedio de
2.50 centímetros, según requerido por el comprador. Un equipo de ingenieros examina la
producción rutinariamente para velar que se cumpla con las especificaciones. Si encuentran
que las arandelas no cumplen con las especificaciones establecidas, las máquinas que las
producen son ajustadas. Ellos seleccionan una muestra de 100 arandelas de un lote producido
en la fábrica y encuentran con que el diámetro promedio es de 2.51 centímetros.
a) Indica cuál es el problema que debe ser resuelto.
b) En términos de este problema, indica explícitamente cuál es
1. La población
2. El parámetro que se debe estimar
3. La variable que se debe medir
4. La muestra
DIVISIONES DE LA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA.-
Es la parte de la Estadística que describe, analiza y representa un grupo de datos utilizando métodos
numéricos y gráficos que resumen y presentan la información contenida en ellos. No pretende ir más
allá del conjunto de datos investigados.
EJEMPLOS:
La clase de Métodos Estadísticos tiene 102 alumnos en el turno de mañana.
El nivel promedio de inteligencia obtenido mediante la prueba Stanford Bidet resultó ser 104 para
el grupo de mujeres
Durante los últimos dos días se han informado un total de ocho homicidios.
La encuesta Gallup informa una ventaja de 5% para el candidato X
Como puede observarse en cada uno de estos ejemplos, los datos estadísticos utilizados solamente
describen e indican lo que hay, informando donde, cuando y cuanto de los hechos u observaciones
indicadas.
Lo mismo sucede cuando se realiza una encuesta política donde se nos informa que entrevistaron
a 1100 electores y que el candidato del Partido AP obtuvo la preferencia de un 44% de los
encuestados, que un 45% optó por el candidato del Partido PPC y que aún se mantiene unos 11%
de indecisos. Todos estos datos numéricos describen y nos señalan cuál es el parecer u opinión de
los electores encuestados y por tanto estos datos estadísticos se le clasifica como estadística
descriptiva de una muestra de electores.
INFERENCIA ESTADÍSTICA.-
Son métodos que apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa
estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos. Es
decir hacen posible la estimación de una característica de la población, en base a una muestra.
Estas dos ramas no son independientes; por el contrario, son complementarias y entre ambas dan la
suficiente ilustración sobre una posible realidad futura, con el fin de que quien tenga poder de
decisión, tome las medidas correctivas necesarias para transformar ese futuro o para mantener las
condiciones existentes
Técnicasde MUESTRA
M uestreo
Estimador: x
POBLACIÓN EstadísticaInferencial
Parámetro:µ
µ̂=Errordemuestreo
Los estudiantes que obtuvieron un IQ de inteligencia sobre 120, probablemente obtendrán sobre
700 puntos en cada área de la prueba de Admisión para el ingreso a la universidad.
Si aún hay un 11% de los electores indecisos y si la población electoral es de cerca de 10 millones
electores, quiere decir que aún hay cerca de 1.1 millones de electores quienes realmente decidirán
cuál va a ser el candidato ganador.
En estos dos ejemplos se lleva a cabo una deducción lógica basada en unos datos estadísticos de
una muestra, pero la inferencia o deducción que se utiliza para generalizar una observación sobre
la población requiere de unos cómputos y análisis estadísticos que van más halla de los números
obtenidos de la muestra. La deducción o inferencia debe ser comprobada para aceptarse como
confiable y válida, por lo tanto, esto requiere un procedimiento estadístico mucho más complejo el
cuál compete a la estadística inferencial.
ESTADÍSTICA 6
CLASIFICACIÓN DE VARIABLES
I. OBJETIVO DE LA SESION:
Los alumnos deberán ser capaces de distinguir los distintos tipos de variables que se manejan en
estadística.
II. TEMAS:
Los datos que deben manejarse en una investigación científica para describir los objetos de interés
son, en general de naturaleza diversa. La consideración de esta diferenciación es esencial para
decidir el método de análisis estadístico adecuado.
VARIABLE: Las variables son las características observables de un objeto, problema o evento que se
puede describir según un esquema de medición bien definido. Cada rasgo o aspecto de una población
constituye una variable. La edad de unas personas, su sexo, color de su piel, nacionalidad, su nivel de
motivación, niveles de ansiedad, el número de nacimientos, número de matrimonios, frecuencia de
suicidios, estatura, peso, niveles de inteligencia, actitudes, entre muchas otras .
Es una característica observable que varía entre los diferentes individuos de una muestra o población.
La información que disponemos de cada individuo es resumida en variables
Clasificación:
I. Por su naturaleza
nominales
cualitativas 1. VARIABLES CUALITATIVAS (Categóricas) Son
aquellas características que se pueden clasificar, pero no
cuanti ai vasdiscretas
"si" y "no", sexo, colores, carreras universitarias, grupo
sanguíneo.
continuas
Variables categóricas ordinal: Son variables categorías
en las cuales hay un orden. Por ejemplo
Calificación {excelente, bueno, regular, malo}
Clasificación {1º,2º,3º,.......}
Dolor que sufre un paciente ante un tratamiento
Nivel socioeconómico
EJERCICIO
1. Clasificar las siguientes variables
Preferencias de cerveza.
Velocidad en Km/h.
El peso en Kg.
Signo del zodiaco.
Nivel educativo (primario secundario, superior).
Años de estudios completados.
Tipo de enseñanza (privada o pública).
Número de empleados de una empresa.
La temperatura de un enfermo en grados Celsius.
La clase social (baja, media o alta).
La presión de un neumático en Nw/cm2
Capacidad de un disco duro de un ordenador, en GB.
Velocidad de transferencia de ficheros en una red, en bps.
Resultado de un test que comprueba si un ordenador tiene virus o no.
Tipos de impresoras.
Velocidad de acceso a un disco duro, en milisegundos.
2. Dar cuatro ejemplos de variables categóricas (dos nominales y dos ordinales), y cuantitativas
relacionadas con el mundo informático.
3. Se desea comparar la calidad de varias marcas de computadoras. Proponer de forma razonada seis
variables que podrían utilizarse para realizar el estudio. ¿Qué tipo de variable es cada una de
ellas?
4. La empresa de conservas Inca Mar proyecta lanzar al mercado un producto nuevo. Se realiza un
Test de aceptación en una muestra de 20 personas, utilizando una escala de 20 puntos, para medir
el grado de aceptación. Los puntos obtenidos en las 20 personas fueron los siguientes: 6, 7, 4, 7,
10 6, 6, 5, 7, 3, 7, 7, 5, 8, 6, 4, 7, 5, 7, 6 La muestra estuvo compuesta por igual número de
personas de ambos sexos, de 25 a 40 años de edad residentes en el municipio.
(1) ¿Cuál es la población? (2) ¿Cuál es la muestra?
(3) ¿Cuál es la variable? (4) ¿De qué tipo es la variable?
Será aquella cuyo contenido se refiere a un factor que ya no es causa, tampoco efecto,
pero sí modifica las condiciones del problema investigado.
Es importante analizar si esta variable aparece a partir de la variable independiente, es
decir, posterior a ella y con anterioridad a la variable dependiente, de tal forma que
entre a reemplazar la variable independiente que ha sido formulada, o si actúa como
factor concerniente en la relación de variables. A esta variable interviniente la forman
factores que influyen en el efecto, es decir la variable dependiente, pero que no van a
ser muy evidentes en el análisis
Ejemplo 1: Los niños que son reprimidos en la consecución de sus metas exhiben conductas
agresivas más frecuentemente que los niños que no son tan reprimidos
Variable Independiente: Grado que se reprime el logro de las metas.
Variable Interviniente: Frustración
Variable Dependiente: Número de conductas agresivas
Ejemplo 2: ¿Cuál es la incidencia del nivel de cariño que reciben los estudiantes de la ciudad
de Lima en su rendimiento escolar?
Variable Ordinal: Presentan un orden en sus categorías, pero no implican grados de distancias
iguales entre ellas (Nivel económico, clasificación, dolor de un paciente).
Variable de Razón (Cociente): Estas variables además de tener las características de las
variables de intervalo, con la diferencia que incluye el cero absoluto
Ejemplo: edad, peso, sueldos, número de accidentes, etc.
Ender Egg (1971) define la Investigación Científica como “un proceso formal, sistemático,
racional e intencionado en el que se lleva a cabo el método científico de análisis; como un
procedimiento reflexivo, controlado y crítico que permite descubrir nuevos hechos o datos,
racionales o leyes, en cualquier campo del conocimiento, en un momento histórico concreto”.
ASPECTOS PRELIMINARES
.
Titulo de la investigación
El título de la investigación a realizar, debe ser claro, preciso y completo. Está destinado a
indicar dónde, qué, cómo y cuándo, en forma clara y sucinta indica el lugar a que se refieren los
datos, el fenómeno que se presenta, las variables que sé interrelacionan, y la fecha a que se
refiere la información.
Es decir el título debe ser general, en cuanto recoge la esencia del tema que va a tratarse, pero
específico en cuanto debe referirse al problema objeto de investigación.
Introducción: Contiene de manera resumida problema, hipótesis, objetivos justificación,
hipótesis y procedimientos generales de investigación
I. EL PROBLEMA
FORMULACIÓN DEL PROBLEMA:
¿Qué entendemos por formular un problema? Partamos del siguiente criterio: formular un
problema es caracterizarlo, definirlo, enmarcarlo teóricamente, sugerir propuestas de
solución para ser demostradas, establecer unas fuentes de información y unos métodos
para recoger y procesar dicha información. La caracterización o definición del problema
nos conduce otorgarle un título, en el cual de la manera más clara y precisa
6. FORMULACIÓN DE HIPOTESIS
Variables
Definiciones operacionales
7. MARCO METODOLOGICO
Determinación de la población y la muestra
Técnicas de recolección de datos( observación, experimentación, encuesta,, entrevista)
Técnicas de análisis de datos descripción detallada de las técnicas estadísticas que serán
utilizadas en el procesamientos de los datos
REDONDEO DE DATOS
REGLA 1:
PRECISION Y EXACTITUD
En el lenguaje común se suele usar la palabra precisión como sinónimo de exactitud. Sin embargo, en
estadística son conceptos bien diferentes.
Si se mide una magnitud patrón n veces, con un instrumento adecuado, se obtienen n valores que
difieren entre sí.
La dispersión de estos valores tiene diferentes causas y cuanto menor sea, mayor será la precisión
del instrumento de medición.
Cuanto más cercano esté el promedio de los valores al valor del patrón, mayor exactitud tendrá el
instrumento.
Ejemplo del tiro al blanco, en él se supone que: el centro del blanco es el valor patrón, cada impacto es
una medición realizada, y la pistola es el sistema de medición.
A, se puede ver que los impactos están muy cercanos entre sí pero muy lejos del centro, y por eso se
dice que hay mucha precisión, pero poca exactitud.
B, se ve que los impactos están muy dispersos pero rodeando sistemáticamente al centro, o
sea que su promedio resultará muy cercano al mismo. A este caso se lo califica como de poca
precisión y mucha exactitud.
C, el ideal, se tiene un grupo muy compacto de disparos en el centro del blanco, hay mucha
exactitud y mucha precisión.
RECOLECCION DE DATOS
ESTADÍSTICA 12
FUENTES DE DATOS: Son aquellos lugares, persona o elementos de los que se puede obtener datos
o información necesaria para realizare estudio de investigación
TIPOS
a) Fuentes Secundarias:
Datos ya recolectados para cumplir otros objetivos
Contiene información, sintetizada y organizada
Es la primera fuente que se debe analizar
b) Fuentes Primarias:
Datos que hay que recolectar para el trabajo
Personas que por su conocimiento proporciona información especifica para el investigador
Las técnica mas empleadas son
a) La Observación :
El investigador no interfiere en el objeto de estudio
Se registra el dato bajo condiciones normales
Cuando se mide el desempeño la persona observada no debe saber
que es objeto de estudio.
b) La Experimentación:
El investigador fija, manipula e introduce variables en el objeto de
estudio
Se registra un dato bajo condiciones provocadas simulando el
proceso lo más real posible
c) La Entrevista
Permite recolectar datos mediante el dialogo.
Puede ser:
Estructurada(Entrevista-Cuestionario) : Las preguntas son
precisas de acuerdo a indicadores previamente elaboradas y tienen
orden que se cumple para cada entrevistado
c) La Encuesta :
Es el método de recopilación de datos acerca de hechos, opiniones
conocimientos, etc.
Basado en una interacción directa (la entrevista) o indirecta (el
cuestionario) entre el investigador (encuestador) y encuestado
El Cuestionario
Es el formulario impreso que los individuos responden un conjunto
de preguntas formuladas de acuerdo a la necesidad de la
información.
Junto a las hojas de registro es la técnica más común de datos de
fuentes primarias.
¿Frecuentemente fuma? SI NO
SI NO
No ____
No sabe/ no contesta_____________
La pregunta señala sólo la línea positiva. Compárese con esta otra redacción:
En este caso, no se orienta la pregunta como se había hecho en el caso anterior, dónde
se había primado sólo la parte positiva.
TIPOS DE PREGUNTAS
SI NO
Anual...............Trimestral.............Mensual....................Nunca................
Preguntas Abiertas
Preguntas de acción: referidas a actividades de los encuestados. Por ejemplo: ¿ha tomado algún
curso de capacitación?
Preguntas de información: para conocer los conocimientos del encuestado. Por ejemplo: ¿sabe qué
es software libre?
Preguntas de intención: para conocer la intención del encuestado. Por ejemplo: ¿utilizará algún
software para su próxima clase?
Preguntas de opinión: para conocer la opinión del encuestado. Por ejemplo: ¿qué carrera cursarás
después del bachillerato?
Existe otra clasificación de los cuestionarios que toma en la función que las preguntas desarrollaran
dentro del cuestionario. De esta manera tenemos:
Preguntas filtro: son aquéllas que se realizan previamente a otras para eliminar a los que no les
afecte. Por ejemplo: ¿Tiene usted coche? ¿Piensa comprarse uno?
Preguntas trampa o de control: son las que su utilizan para descubrir la intención con que se
responde. Para ello se incluyen preguntas en diversos puntos del cuestionario que parecen
independientes entre sí, pero en realidad buscan determinar la intencionalidad del encuestado al
forzarlo a que las conteste coherentemente (ambas y por separado) en el caso de que sea honesto, pues
de lo contrario «caería» en contradicciones.
Para la elaboración de un cuestionario eficaz y útil, Cadoche proponen 17 reglas fundamentales para
su confección:
Es el caso de preguntas que presentan varias respuestas alternativas y una de ellas va unida a
un objetivo tan altruista que difícilmente puede uno negarse.
1. Es buena idea codificar las variables como números para poder procesarlas con facilidad en un
programa estadístico.
ESTADÍSTICA 16
2. Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los
códigos numéricos.
o Sexo (Cualitativa: Códigos arbitrarios)
1 = Hombre
2 = Mujer
o Raza (Cualitativa: Códigos arbitrarios)
1 = Blanca
2 = Negra,...
o Felicidad Ordinal: Respetar un orden al codificar.
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz
4. Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)
EN CU ES TA D E IN IC I AC I ÓN EN EL TA BA QU I S MO
C ons idere 30 encues tas y corregirlas para finalment e tras ladarla como
información en tablas y gráficos us ando el paquete es tadís tico S P SS .
SESION
I. OBJETIVOS DE LA SESION:
ESTADÍSTICA 18
3. Las indicaciones complementarias; con el fin de que no haya dudas sobre el contenido del
cuadro, éste se anotará en la parte inferior de la tabla. Las indicaciones complementarias son: la
fuente de información, comentarios y notas explicativas.
b) Notas. Son colocadas al pie del cuadro para esclarecimientos de orden general.
c) Comentarios. También colocadas al pie del cuadro, sirven para aclarar minucias en relación a
las celdas, columnas, filas.
TABLAS CONTINGENCIA
Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100
Ejemplo de Tabla de Contingencia de dos variables categóricas SEXO y FUMAR generada por el
programa SPSS. Obsérvese que cada variable presenta dos categorías:
Son tablas de trabajo estadístico que presentan la distribución de un conjunto de elementos agrupados
o clasificados en las diversas categorías de la variable.
F1 = f1
F2 = f1 + f2 = F1 + f2
… = …………………………………
Fm = f1 + f2 + ………………………… fm = Fm-1 + fm = n
H 1 = h1
H2 = h1 + h2 = H1 + h1
…………………………………………………………
Hm = h1 + h2 + ……………………… + hm = Hm-1 + hm = 1
f i n m
i 1
h
i 1
i 1
Nota:
En el caso de la escala nominal las dos últimas columnas
carecen de sentido
Ejemplo En una encuesta en Ate el año 2006, se entrevisto a 12 familias y se pregunto cuantos hijos
tienen, obteniéndose los siguientes datos:
Interpretación:
f2: 3 familias tienen 2 hijos
h4: el 25% de las familias tienen 4 hijos
F3: que 5 familias tienen a lo mas 3 hijos.
H2: el 33.3% de las familias tuvieron a lo mas 2 hijos
Y Yi
Yi i 1
2
Histograma de Frecuencias: Constituido por un conjunto sucesivo de rectángulos.
Ejemplo 1: La siguiente tabla muestra las edades de los 21 trabajadores que laboran en Siderúrgica
Aceros Arequipa:
58 42 51 54 40 39 49
56 58 57 59 63 58 66
70 72 71 69 70 68 64
Solución
33
C= = 6.6 (En lo preferible se debe encontrar un número entero).
5
La amplitud debe ser mayor que 6.6 fijándolo en 7
4. Luego el rango ampliado R = 5x7=35
5. La diferencia a =35-33=2
6. Distribuyendo la diferencia
a
X min - (Límite inferior del primer intervalo)
2
a
X max + (Límite superior del último intervalo)
2
X min X max
Valores originales 39 72
Valores corregidos 38 73
<Xi-1 - Xi] fi hi Fi Hi X i
<38 - - 45] 3 0.14 3 0.14 41.5
<45 - - 52] 2 0.10 5 0.24 48.5
<52 - - 59] 7 0.33 12 0.57 55.5
<59 - - 66] 3 0.14 15 0.71 62.5
<66 - -73] 6 0.29 21 1.00 69.5
21
ESTADÍSTICA 24
Ejemplo 2 Los siguientes datos son los 80 tiempos en segundos que demoran en procesar ciertos
programas en la PC. Hallar los intervalos para los siguientes datos, interprete f3, F2 , h3 y H4. Haciendo
uso de un software estadístico
7 8 12 1 4 7 8 17 3 4
10 7 11 1 5 7 13 3 1 7
12 3 3 13 5 3 1 4 17 7
4 8 8 10 8 2 7 5 10 11
<Xi-1 - Xi] fi hi Fi
<0 - - 10] 60 h1 F1
<10 - - 20] f2 0.4 F2
<20 - - 30] 30 h3 F3
<30 - - 40] f4 0.1 F4
<40 - - 50] f5 h5 200
n
Ejemplo 5: Se realiza un estudio en 120 familias en la Perla, para conocer el nivel educacional que
tiene el jefe de familia. Los resultados son los siguientes: básica: 3 jefes de familia; básica incompleta:
65 jefes de familia; media: 21 jefes familia; media incompleta: 14 jefes de familia; universitaria: 11
jefes de familia; universitaria incompleta: 6 jefes de familia.
SESION
REPRESENTACIONES GRAFICAS
I. OBJETIVO DE LA SESION:
Los alumnos deberán ser capaces de representar gráficamente los datos según el(los) tipo(s) de
variable(s) que se maneje(n).
II. TEMAS:
El gráfico es la representación en el plano, de la información estadística, con el fin de obtener una
impresión visual global del material presentado, que facilite su rápida comprensión. Los gráficos
son una alternativa a las tablas para representar las distribuciones de frecuencias.
REPRESENTACIONES GRAFICAS
Una gráfica o diagrama es un dibujo que permite observar las tendencias de un fenómeno en
estudio y facilita el análisis estadístico de las variables allí relacionadas
5. Gráficos lineales:
Son gráficos adecuados para analizar la existencia de asociación entre dos variables cuantitativas.
Son particularmente útiles cuando se desea mostrar los cambios de una o más variables a través
del tiempo.
ESTADÍSTICA 28
6. Pictogramas:
Son una forma de representar la información mediante dibujos de los objetos que son motivo de
estudio, con un formato tal que de una idea rápida y visual, de la distribución de frecuencias.
Son especialmente útiles para fines publicitarios por ser atractivos y de fácil comprensión.
8. Histograma:
Este tipo de gráfico se utiliza para representar la distribución de variables cuantitativas, discretas o
continuas tabuladas en intervalos.
En el eje X se representa el recorrido de la variable y en el eje Y la frecuencia absoluta o relativa.
9. Polígono de Frecuencias:
Se puede utilizar este tipo de gráfico como una alternativa al Histograma, es decir, también se
utilizan para representar la distribución de frecuencia de variables cuantitativas continuas o
discretas tabuladas en intervalos.
En el eje X se representa el recorrido de la variable y en el eje Y la frecuencia absoluta o relativa.
El polígono de frecuencias es particularmente útil cuando se tienen dos variables: una variable
cuantitativa tabulada en intervalos y otra variable discreta, como en el siguiente ejemplo .
Ejemplo
ESTADÍSTICA 30
Se toman 10 mediciones del diámetro interno de los tornillos para los pistones del motor de un
automóvil. Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000, 74.002, 74.005, 74.001,
74.001, 74.002 y 74.004. El diagrama de puntos correspondiente se presenta en la figura 1.
5 1 22269
24 2 1223334455577778888
(10) 3 0011226688
23 4 2223334567999
10 5 0117
6 6 3589
2 7 49
Diagrama de Pareto
25
24 46
23 52
22 41
71
47
62
21 43
93
65
28
94
20
19
EDAD
18
17
N= 80 20
HOMBRE MUJER
SEXO
El Diagrama de Pareto es una gráfica en donde se organizan diversas clasificaciones de datos por
orden descendente, de izquierda a derecha por medio de barras sencillas después de haber reunido
los datos para calificar las causas. De modo que se pueda asignar un orden de prioridad
El nombre de Pareto fue dado por el Dr. Joseph Juran en honor del economista italiano Vilfredo
Pareto (1848-1923) quien realizo un estudio sobre la distribución de la riqueza, en el cual
descubrió que la minoría de la población poseía la mayor parte de la riqueza y la mayoría de la
población poseía la menor parte de la riqueza. Con esto estableció la llamada "Ley de Pareto"
según la cual la desigualdad económica es inevitable en cualquier sociedad.
El Dr. Juran aplicó este concepto a la calidad, obteniéndose lo que hoy se conoce como la regla
80/20. Según este concepto, si se tiene un problema con muchas causas, podemos decir que el
20% de las causas resuelven el 80% del problema y el 80% de las causas solo resuelven el 20%
del problema.
Cuando se utiliza
o Para estudiar los resultados
o Para planear una mejora continua
o Para demostrar qué progreso se ha logrado
Las Gráficas de Pareto son especialmente valiosas como fotos de “antes y después”. Como tal, la
Gráfica de Pareto es una herramienta sencilla pero poderosa.
Causas fi hi
Incompetencia 698 47.7%
Experiencia desequilibrada 314 21.5%
Falta de experiencia gerencial 236 16.1%
Falta de experiencia de línea 111 7.6%
Causa desconocida 83 5.7%
Otras causas 21 1.4%
TOTAL 1463 100%
ESTADÍSTICA 32
SESION
I. OBJETIVOS DE LA SESION:
El alumno deberá ser capaz de:
Identificar las distintas medidas de resumen.
Calcular e interpretar las tres medidas de tendencia central, tanto para datos agrupados como
sin agrupar.
II. TEMAS:
MEDIDAS DE RESUMEN
Entre las medidas que permiten resumir información proveniente de una población, podemos
considerar las medidas de posición, medidas de dispersión y medidas de forma, como se resume en el
siguiente diagrama.
Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la
información, son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su
interpretación no debe hacerse aisladamente de las medidas de dispersión, ya que la representabilidad
de ellas está asociada con el grado de concentración de la información.
Los de uso más frecuente son la media aritmética, media geométrica, media armónica, mediana,
moda,
etc.
1. MEDI
A
Procedimiento de Cálculo
a) Sin intervalos x i fi
, donde m= número de intervalos ó de categorías
x i 1
n
EJEMPLO: Cantidad de cigarrillos consumidos por un fumador durante una semana
�x f i i
140
x i 1
20
n 7
b) Con intervalos X f i i
X i 1
n
<Xi-1 - Xi] fi hi Fi Hi X i� X i f
i
<38 - - 3 0.14 3 0.14 41.5 124.5
45]
<45 - - 52] 2 0.10 5 0.24 48.5 97
<52 - - 59] 7 0.33 12 0.57 55.5 388.5
<59 - - 66] 3 0.14 15 0.71 62.5 187.5
<66 - -73] 6 0.29 21 1.00 69.5 417
21 1.00 1214.5
1214.5
Luego X 57.83
21
ESTADÍSTICA 34
Desventajas:
Los valores extremos influyen sobre la media en algunos casos puede distorsionarlos llegando
a una conclusión errada
Por ejemplo los gastos de 3 médicos que trabajan en cierta zona son $300, $300 y $600
¿podemos concluir que el gasto promedio es de $400?
No se puede hallar la media aritmética cuando en los extremos de los intervalo indica " Mas
de 700" o "Menos de 1000"
n1 X 1 n2 X 2 ...... nm X m
X
n1 n2 ...... nm
Donde N n1 n2 ....... nm
4. La media del producto de una constante por una variable, es igual al
producto de la constante por la media de la variable.
M ( KX )
KX i
K Xi
KX .
N N
5. La media de la suma de una constante más una variable, es igual a la media
de la variable más la constante
M ( X Y ) X X i K
X i K X i K X K.
n n n
2. MEDIA RECORTADA AL 5%
n j
1 5
X 5% xi
n 2 j i 1 j
si j
100
n es un número entero
Posible remedio al problema de la media con los valores atípicos (falta de robustez)
Eliminación de los valores más extremos
Media recortada al por 5% es la media de los datos que quedan después de eliminar el 5% de
los datos más grandes y el 5% de los datos más pequeños
Ejemplo:
Sean los 10 datos:
1.7 2.8 3.2 3.4 5.3 5.9 6.2 7.2 9.3 83
128
La media aritmética x 12.8
10
La media recortada al 50%
El 5% de 10 es 0.5 1
Luego quitamos un valor menor y un valor mayor (1.7 y 83)
43
La media recortada es x Re c 5.41
8
Descriptive Statistics
1 Ejercicio: Se realizó una encuesta, en una población de la ciudad de Viña del Mar.
En dicha encuesta, entre las cosas que se consultaron, se les preguntó: ¿Cuántas
personas habitan la casa?, ¿Cuántos T.V. tenían?. Dicha encuesta arrojó los
siguientes resultados:
Casa Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nº de
3 4 6 1 7 10 4 5 3 8 6 2 7 3 4 5 3 2 3 2
Hab.
Nº de TV 1 1 2 0 3 4 2 1 1 3 3 1 3 1 2 2 2 1 0 1
X n1 si n impar
2
Me
X X
n2 n2 1
si n par
2
Procedimientos de Cálculo
Si consideremos el ejemplo de la edad en años de las ocho personas que sufren un extraño mal.
Se ordenan los datos, en este caso los ordenaremos de menor a mayor:
10 18 25 32 12 5 7 7
Ordenando los datos de menor a mayor
5 7 7 10 12 18 25 32
Como n = 8, que es un número par, utilizamos la expresión:
ESTADÍSTICA 36
Xn Xn
1 10 12
Me 2 2
11
2 2
Esto significa que el 50% de las personas que sufren este extraño mal tienen entre 5 y 11 años y el
50% restante tiene entre 11 y 32 años.
n
Fi 1
Me Li Ci 2
fi
<Xi-1 - Xi] fi hi Fi Hi
<38 - - 45] 3 0.14 3 0.14
<45 - - 52] 2 0.10 Fi 1 =5 0.24
Li <52 - - 59] f i =7 0.33 12 0.57
<59 - - 66] 3 0.14 15 0.71
<66 - -73] 6 0.29 21 1.00
21
n 21
Si Fi 1 Entonces 10.5 5
2 2
10.5 5
Luego Me 52 7 57.5
7
Interpretación.=
esto quiere decir que el 50% de los trabajadores tienen una edad sobre 43.5 años y el otro 50 %
por debajo de los 43.5 años.
NOTA:
1. Los valores extremos no tienen efecto importante sobre la mediana, lo que si ocurre con la
media
Sean los datos 4,5,6,7,8 luego, X M e 6 , pero si en lugar de 8 fuera 80 entonces la media
sería M e 6 pero la media aritmética X 20.4
4. MODA ( M 0 ): Es el valor de la variable que se presenta con mayor frecuencia, valor que se
corresponde al máximo del histograma.
Procedimiento de Cálculo
X : Notas 12,11,08,06, 11, 16 M 0 = 11 unimodal.
Y : Pesos 62,77,70,62,88,55,70 M 0 = 62 y 70 bimodal
X : Tallas 1.77, 1.66, 1.89, 1.75 M 0 = No existe moda
NOTA:
La moda se puede
utilizar para describir
datos cualitativos, por
ejemplo suponiendo
que los pacientes de
un hospital de salud
mental durante un año
recibieron los
siguientes
diagnósticos:
neurosis, psicosis,
trastorno de la
personalidad. .etc.
El diagnóstico que
ocurre con más
frecuencia se llama
diagnóstico modal
MEDIDAS DE POSICION
En el Capitulo anterior, vimos lo referente a las medidas de tendencia central, las cuales, a su vez, son
también medidas de posición ya que, de todas maneras ocupan un lugar dentro de la información.
Nos ocuparemos ahora de ciertos parámetros posicionales muy útiles en la interpretación porcentual
de la información.
CUARTILES: Cuando se divide a un conjunto de datos en cuatro partes iguales, a los puntos de
división se les llama cuartiles
El primer cuartil Q1 es un valor en el cuál 25% de las observaciones es menor que él y 75% son
mayores que él.
Es el segundo cuartil Q2 es la mediana, el 50% de las observaciones son menores y el 50% son
mayores que él.
Es el tercer cuartil, Q3 es el valor en el cual el 75% las observaciones son menores que él y 25% son
mayores que él.
Ejemplo: Una muestra de 15 trabajadores de una ciudad indica la distancia que recorren para llegar a
su centro laboral.
ESTADÍSTICA 38
La identificación de la tendencia y nivel del sesgo de los datos, servirá parar hacer correcciones al
hacer inferencia estadística. También permitirá seleccionar la mejor medida para lograr las
estimaciones deseadas.
Si X = Me = Mo La distribución es simétrica
SESION
MEDIDAS DE DISPERSION
I. OBJETIVO DE LA SESION:
El alumno deberá ser capaz de calcular e interpretar las medidas de dispersión: rango, varianza y
desviación estándar.
II. TEMAS
MEDIDAS DE DISPERSIÓN
Las medidas de posición por si solas, no son suficientes para describir las distribuciones, ya que ellas
no consideran la variabilidad de estas. Al comparar dos o más distribuciones puede suceder que estas
tengan el mismo promedio, pero que la dispersión de los valores observados no sea la misma.
Una medida de dispersión, tiene como propósito ofrecer información adicional que permita juzgar la
confiabilidad de la medida de tendencia central.
Las medidas de dispersión más importantes son: el rango, varianza, coeficiente de variación,
desviación intercuartílica.
�( x )
i
2
2 i 1
N
ESTADÍSTICA 40
2
N
N
x 2
i xi
En forma simplificada: 2 i 1
i 1
N N
n
La varianza muestral
(x i x)2
s2 11
n 1
En forma simplificada 2
n
n
xi
xi i 1
2
n
s 2 i 1
n 1
Ejemplo: Se uso dos tipos de máquinas para la producción de un tipo de agujas descartables, a
continuación se muestran los tiempos en segundos
A: 14, 24, 46, 50, 70 X = 40.8 M e = 46
B: 15, 38, 46, 52, 53 X = 40.8 M e = 46
¿En cuál grupo hay menos dispersión?
A B
xi x 2
i
xi xi2
14 196 15 225
24 576 38 1444
46 2116 46 2116
50 2500 52 2704
70 4900 53 2809
5 5 5 5
xi 204
i 1
xi2 10288 xi 204
i 1
x i
2
9298
i 1 i 1
Reemplazando
A B
2
(204) (204) 2
10288 92998
s2 5 s2 5
4 4
s 2 491.2 s 2 243.7
Como el grupo B tiene menor varianza por lo tanto hay menos dispersión
En el diagrama de puntos (dotplot) vemos que el grupo B los datos están mas agrupados alrededor de
la media
. . . . .
++++++A
. . . ..
++++++B
20 30 40 50 60 70
PROPIEDADES:
Estos valores se cumplen con bastante aproximación, para distribuciones que son
normales y para las que son ligeramente asimétricas
Ejercicio: Los siguientes datos corresponden a los tiempos (en minutos) que duran
36 llamadas telefónicas recibidas por una central:
Ejemplo
Los trabajadores de cierta empresa tienen un sueldo promedio de $383.290, con una varianza de
30.571 ($)2. Si a cada trabajador se le aumenta el sueldo en 8% más un bono de $10.500. Determine el
sueldo promedio y la varianza luego del aumento.
Desarrollo:
Llamemos:
X: sueldos antes del aumento.
Y: sueldos después del aumento.
x 383.290 y X2 30.571$ 2
ESTADÍSTICA 42
a 1.8 y b $10.500
y a x b y 1.8 383.290 10.500 424.453,2
Y2 a 2 X2 Y2 (1.8) 2 30.571 35.658.0144
Por lo tanto $424.453,2 y 35.658,0144 ($)2 son, respectivamente el sueldo promedio y la varianza de
los sueldos después del aumento.
n 1
Luego la desviación estándar de A es s 491.2 = 22.16
y la desviación estándar de B es s 243.7 = 15.61 luego la mas homogénea es la B
NOTA:
Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes
variables. Ejemplo si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una
cantidad fijada arbitrariamente. Por ejemplo 0ºC ≠ 0ºF
Descriptive Statistics
Descriptive Statistics Variable: TIPOB
Variable: TIPOA
Anderson-Darling Normality Test
A-Squared: 0.431
Anderson-Darling
P-Value: Normality Test
0.171
A-Squared: 0.205
Mean
P-Value: 40.8000
0.730
StDev 15.6109
Mean
Variance 40.8000
243.7
StDev
Skewness 22.1630
-1.51515
Variance
Kurtosis 491.2
2.13976
Skewness 6.99E-02
NKurtosis 5
15 25 35 45 55 -1.10743
N 5
10 20 30 40 50 60 70 Minimum 15.0000
1st Quartile
Minimum 26.5000
14.0000
Median
1st Quartile 46.0000
19.0000
3rd Quartile
Median 52.5000
46.0000
3rd Quartile
Maximum 60.0000
53.0000
95% Conf idence Interv al f or Mu
95% Conf idence Interv al f or Mu Maximum 70.0000
95% Conf idence Interv al f or Mu
95% Conf idence Interv al f or Mu
21.4165 60.1835
13.2810 68.3190
15 25 35 45 55 65 95% Conf idence Interv al f or Sigma
10 20 30 40 50 60 70 95% Conf idence Interv al f or Sigma
Profesor : Ms. Aurelio Gámez Torres 9.3530
13.2786 44.8588
63.6867
95%
95%Conf
Confidence
idence Interv
Interval
al ffor
or Median
Median
95% Conf
95% idence
Conf Interv
idence alalf or
Interv f orMedian
Median 15.0000
14.0000 53.0000
70.0000
43
Ejemplo:
1. En una Empresa donde los salarios tienen una media de $100 y una desviación estándar de $10, el
sindicato solicita que cada salario X, se transforme en Y, mediante la siguiente relación
Y = 2,5 · X +10. El Gerente acoge la petición rebajando los salarios propuestos por el sindicato
en10%, lo que es aceptado. ¿Qué distribución de salarios es más homogénea? ¿Qué propuesta
prefieren los trabajadores?
Solución:
Tenemos: la propuesta del sindicato
X =100 S X = 10.
Luego: Y 2.5 X 10 Y 2.5 X 10 = 2.5(100)+10=260
S Y 2.5S X 2.5(10) 25
S 25
Por lo tanto CV (Y ) Y 260 0.09615
Y
La propuesta de la Gerencia
Z Y 10%Y 0.9Y Z 0.9Y 0.9( 260) 234
S Z 0.9S Y = 0.9(25) = 22.5
SZ 22.5
Por lo tanto CV ( Z ) 0.09615
Z 234
Ambas distribuciones son iguales de homogéneas. El sindicato prefiere su propuesta, ya que, esta
tiene un promedio mayor
EJERCICIOS
1. En una empresa comercial, el salario medio semanal de los hombres es de $40.000 con una
desviación estándar de $15 y el de las mujeres es en promedio de $30.000 con desviación estándar
de $12
¿Halle el coeficiente de variación de los salarios de los hombres y mujeres?
2. El CV de los ingresos de 200 empleados de cierta empresa es 57%. Después de reajustar, según
ley, todos los sueldos en S/.11,000 este CV es ahora de 50%. Sin embargo la empresa fija un
sueldo mínimo de S/.71,000 Antes del reajuste había 35 personas que tenían un sueldo promedio
de 40,000 y todos ellos ganaban menos de $60,000; con la nueva política de la empresa, sus
sueldos serán elevados a $71,000
Determinar la cantidad de dinero que necesitará la empresa, para pagar los sueldos después de
hacer efectivos los reajustes.
Existen varias medidas de la asimetría de una distribución de frecuencias. Aquí estudiaremos dos de
ellas
Coeficiente de Asimetría de Pearson
3( X M e )
C. A.
s
Si:
C.A. > 0 entonces la distribución tiene sesgo positivo
C.A .< 0 entonces la distribución tiene sesgo negativo
C.A .= 0 entonces la distribución es simétrica.
1 n
Asimetría respecto a la media n
� ( xi x )3
As i 1 3
s
1 n
n
( xi x ) 4
K i 1 4 3
s
K< 0 Platicúrtica (plana) es decir, es menos apuntada que la normal, hay muchos valores extremos, las
colas de la variable son muy pesadas.
Antes de proceder a cualquier análisis se debe hacer un Análisis Exploratorio que nos permita ver la
naturaleza de los datos.
Las técnicas de análisis exploratorio son útiles cuando se trabaja con grandes cantidades de datos, en
tales casos es de gran importancia organizar los datos.
El Análisis exploratorio utiliza medidas de tendencia central y de dispersión que tienen la propiedad
de robustez, es decir estadísticos que son relativamente insensibles a cambios extremos de algunos de
los datos
HERRAMIENTAS :
Gráfico de Cajas y Bigotes(Box and Wisker): Nos muestra un gráfico que nos
permite detectar los outlier y el comportamiento asimétrico de la serie puesto que
lo divide en cuatro partes iguales. La caja cubre el 50% de los datos entre el
cuartil inferior y el cuartil superior.
º
x
dato atípico
Q 1 ,-1.5D c Q1 Me Q3 Q 3 +1.5D c
Solución:
Se ordena forma ascendente, las observaciones a esta característica se llaman
medidas de estadísticas de orden
1 36 X(1)
2 49 X(2)
3 59 ...
4 73 ...
5 95 ...
6 96 X(6) Me=126.5
7 157 X(7)
8 169 ...
9 210 ...
10 245 ...
11 278 ...
12 298 X(12)
Luego hallamos la mediana
Xn Xn
2 2 1 n par
Mediana 2
X n1 n impar
Profesor : Ms. Aurelio Gámez Torres
2
47
n 1
i)Si 4 Z Q1 X n1
4
Cuartil inferior ( Q1 ) =
ii) Si n 1 Z Se Interrpola
4
3(n 1 )
i)Si 4 Z Q3 X 3(n1 )
4
Cuartil superior ( Q3 ) =
ii) Si 3(n 1 ) Z Se Interpola
4
12 1
Hallar, Q1 , si 3.25 Z entonces se interpola .
4
Q1 es el tercer dato más el 25% de las diferencias entre los valores de la cuarta y tercera
observación.
Q1 = X(3) + (X(4) –X(3)) 0.25
Q1 = 59 + (73-59)x0.25=59 +3.5 =62.5
3(12 1)
Hallar, Q3 , si 9.75
4
Q3 es el noveno dato más el 75% de las diferencias entre los valores de la décima y novena
observación.
Q3 = X(9) + (X(10) –X(9)) 0.75
Q3 = 210 + (245 - 210)x0.75= 210 +26.25 = 236.25
Ejercicios
1. En tres computadores con dispositivo de cinta DAT, se ha medido durante ocho días el
tiempo (en minutos) de realización de la copia de seguridad, obteniéndose los siguientes
resultados:
3. Los siguientes datos corresponden a los pesos en onzas de tumores malignos retirados del
abdomen de 57 trabajadores mineros del hospital de la Oroya.
Presentar un informe de los resultados de este reporte del Minitab
68 63 42 27 30 36 28 32 79 27
22 23 24 25 44 65 43 25 74 51
36 42 28 31 28 25 45 12 57 51
12 32 49 38 42 27 31 50 38 21
16 24 69 47 23 22 43 27 49 28
23 19 46 30 43 49 12
Descriptive Statistics
Stem-and-leaf of PESO N = 57
Leaf Unit = 1.0
5 1 22269
24 2 1223334455577778888
(10) 3 0011226688
23 4 2223334567999
10 5 0117
6 6 3589
2 7 49
4. Los salarios mensuales de 4 individuos son S/.. 1500, 1600, 1650 y 2000. Hallar el salario medio.
Ahora entra a trabajar una nueva persona en la empresa, percibiendo un salario de S/..5000
mensuales. ¿Se verá afectado el salario medio tras esta incorporación? ¿Crees que la media es una
medida de centralización adecuada en los dos casos?. En caso de que no lo sea, propón y calcula
otra medida de centralización más adecuada.
i) La diferencia entre el valor más alto de un conjunto de datos y el mínimo se conoce como
____________.
Nota: todas las interpretaciones que se piden a continuación, y en general, debe hacerlas en
el contexto del problema.
a) Indique el valor de la/s moda/s e interpretar su resultado en el contexto del problema.
b) ¿Qué porcentaje de valores observados para el tiempo es igual o superior a 131 horas?
Justificar
c) Interpretar el valor numérico del cuartil inferior
d) Interpretar el valor numérico de la desviación estándar
e) Realice el diagrama de caja
g) ¿Aparecen valores atípicos? ¿y apartados? Justifique su respuesta.
BIBLIOGRAFIA
Cadoche, L. S.; G. Stegmayer, J. P. Burioni y M. De Bernardez (1998). Material del Seminario de Encuestas en Educación,
impartido vía internet por parte de la Universidad Nacional del Litoral, en Santa Fe, y de la Universidad Tecnológica Nacional,
Regional Santa Fe, en la República de Argentina.
Devore Jay, L. “Probabilidad y Estadística para Ingeniería y Ciencias Aplicadas”. 4ª edición Editorial Thompson. 2000.
Irak L. Berenson & David M. Levine Estadística Básica en Administración 5º Edición Editorial Prentice Hall 2000
Montgomery, C. Douglas & Runger, C. George. “Probabilidad y Estadística aplicadas a la Ingeniería”. Editorial McGraw-Hill,
1996.
Walpole, Myers. “Probabilidad y Estadística para Ingenieros”. Editorial Prentice Hall. 1998.
Canavos, George C. “Probabilidad y Estadística”. Editorial McGraw-Hill, 1990.
William Mendenhall Introducción a la Probabilidad y Estadística. Editorial Iberoamerica,1999
Irwin Miller y John Freund Probabilidad y Estadística para Ingenieros Editorial: Prentice Hall, 2000
Marija J. Norusis - SPSS Advanced Statistics 11.0 – SPSS Inc., Chicago, IL, 2002.