Control de Calidad 1
Control de Calidad 1
Control de Calidad 1
estadística
M E A. Genoveva L. Landa
gelorenzo@uv.mx
Conceptos básicos de estadística
Colectivos estadísticos
Población de Objetivo
muestreo
Inferencia
Juicios
Resultados
Muestra
Medición
Análisis Datos
Estudios enumerativos y
estudios analíticos
En la terminología estadística:
v Ordinal
Escala de • Estadísticas de orden
medición
v Intervalo
• Distancias (media
aritmética)
v Razón
• Distancias relativas
Mediciones de Tipo Nominal
La escala de medición más baja es la escala nominal. Como
su nombre lo indica, consiste en designar o "nombrar" las
observaciones o clasificarlas en varias categorías mutuamente
excluyentes y colectivamente exhaustivas. Pueden contener la
descripción del grupo o pueden ser codificadas
numéricamente en forma arbitraria, es decir, no existe un
ordenamiento natural en la clasificación. Por ejemplo:
ü Marca de refresco
ü Votará
ü Género
ü Estado Civil
ü País de procedencia
ü Programa de TV preferido
Mediciones de Tipo Ordinal
Siempre que las observaciones no solo difieran de categoría a
categoría, sino que además puedan clasificarse por grados de
acuerdo con algún criterio, se dice que se miden sobre una
escala ordinal. Ejemplos:
Cambio en la calidad de la prestación de un servicio:
1. Mejor calidad
2. Igual calidad
3. Peor calidad
Nivel socio-económico:
1. Bajo
2. Medio-bajo
3. Medio
4. Medio-alto
5. Alto
Mediciones de Intervalo
La escala de intervalo es más especializada que la nominal
y la ordinal. Con esta escala, no sólo es posible ordenar las
mediciones, sino que también se conoce la distancia entre
dos mediciones cualesquiera.
Ø Tablas:
Proporcionan información a través de conteos.
Ø Gráficos:
Proporcionan información fuertemente a través de la
impresión visual.
Ø Estadísticos Descriptivos:
Valores numéricos que proporcionan información
sobre el “comportamiento de los datos”.
Herramientas de organización datos
Nominales
Tablas de Frecuencias
•Tablas de frecuencia
acumulada de casos)
Herramientas de organización de datos en
escalas de intervalo y de razón
Estadísticos descriptivos:
Medidas de dispersión
Ø Rango
Ø Varianza
Ø Desviación estándar
Medidas Tendencia Central
Las medidas de tendencia central, también conocidas
como medidas de posición central, nos informan sobre los
valores medios de la serie de datos. Entre los principales
indicadores se encuentran:
• Media aritmética
• Mediana
• Moda
Media aritmética
La media aritmética (también llamada promedio o
simplemente media) de un conjunto finito de números es
el valor de una serie de datos cuantitativos que se obtiene
a partir de la suma de todos sus valores dividida entre el
número total de datos.
∑x
i =1
i
x =
n
• Es el número que se obtiene al dividir la suma de todos
los valores de la variable entre el número total de
observaciones.
Mediana
• Si x(1) , x(2) , K , x( n ) constituyen las realizaciones, ordenadas
ascendentemente, de una v.a. entonces la mediana es el
elemento en la posición central.
2
∑𝑁
𝑖=1(𝑋𝑖 − 𝜇 )
2
𝜎 =
𝑁
Donde:
𝜇 = 𝑀𝑒𝑑𝑖𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑁 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑋𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑖 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋
Varianza muestral
𝑛 2
∑ 𝑖=1 ( 𝑋𝑖 − 𝑥̅ )
𝑠2 =
𝑛−1
Donde:
𝑥̅ = 𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑛 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑋𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑖 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋
Desviación estándar
Se calcula como la raíz cuadrada positiva de la varianza.
Posee la propiedad de medir la variabilidad en las unidades
originales de la variable de interés.
𝜎 = #𝜎 2
Desviación estándar muestral
𝑠 = #𝑠 2
Coeficiente de variación (CV)
𝜎
𝐶𝑉 = ∗ 100
|𝜇 |
𝑠
𝑐𝑣 = ∗ 100
|𝑥̅ |
Coeficiente de variación (CV)
Gráficos
–Gráfica de barras
–Gráfico de pastel
–Polígonos de frecuencias
Herramientas de organización datos
Ordinales
Gráficos
–Gráfica de barras
–Gráfico de pastel
–Polígonos de frecuencias
Herramientas de organización de datos
en escalas de intervalo y de razón
Gráficos:
–Histograma
–Diagrama de dispersión
–Diagrama de puntos
Coeficiente de Correlación Muestral
Coeficiente de Correlación r de Pearson
0.7 < r < 1 Existe una correlación directa y fuerte entre las variables
r>0.7 y r<1
0 < r ≤ 0.7 Existe una correlación directa y baja entre las variables
r>0 y r ≤ 0.7
-0.7 ≤ r <0 Existe una correlación baja e inversa entre las variables
r <0 y r ≥-0.7
-1 <r < -0.7 Existe una correlación fuerte e inversa entre las variables
r <-0.7 y r ≥-1
∑ ( x − x )( y − y )
i i
ˆ ( x, y )
Cov
i =1
ˆ ( x, y ) =
y Corr
n −1 sx s y
∑ ( x − x )( y − y )
i i
ˆ ( x, y )
Cov
ˆ ( x, y ) =
Cov i =1
ˆ ( x, y ) =
y Corr
n −1 sx s y
Prueba de hipótesis para r
r n−2
Estadístico de prueba: t=
1− r2
Regla de decisión; se rechaza H0 con un nivel de significancia de α si
t > tα / 2, n−2
Tablas de Contingencia
Característica B
leve mod sev … c Totales
n. j × ni.
Frecuencia esperada = eij =
N
Chi cuadrada
Estadístico de prueba
2
2
χ = ∑∑
c r (n
ij − eij )
j =1 i =1 eij
Phi :
En tablas de contingencia (2x2) toma valores entre 0 y 1. Su valor
es idéntico al r de pearson.
En tablas donde una variable tiene más de 2 categorías phi puede
tomar valores más grandes que 1 (no recomendable).
En algunas ocaciones en los paquetes estdísticos toma valores
negativos (error).
Correlación para datos nominales
V de Cramer:
Cualitativa- Cuantitativa-
Eta
(nominal, ordinal) (Intervalo, razón)