GUIA
GUIA
GUIA
De Querétaro.
Evaluación III.
Probabilidad y Estadística.
Carrera:
2022168006
2022168021
2022168018
2022168001
Docente:
Contenido
Estimación. .......................................................................................................................................... 2
Estimación Puntual.......................................................................................................................... 2
Estimación por intervalos................................................................................................................ 3
Error estándar de estimación. ......................................................................................................... 5
¿Cómo se calcula? ....................................................................................................................... 6
Prueba de hipótesis. ............................................................................................................................ 6
Hipótesis nula. ................................................................................................................................. 8
Prueba de una Hipótesis. ................................................................................................................ 9
Error tipo I ..................................................................................................................................... 10
Error tipo II. ................................................................................................................................... 10
Regresión lineal. ................................................................................................................................ 10
Tipos de regresión lineal: .............................................................................................................. 11
Test de hipótesis. .............................................................................................................................. 11
SUMA DE CUADRADOS...................................................................................................................... 13
Suma de los cuadrados en ANOVA.................................................................................................... 13
Sumas secuenciales de los cuadrados............................................................................................... 14
Sumas ajustadas de los de cuadrados ............................................................................................... 14
Cuadrados medios ............................................................................................................................. 16
ESTADISTICO DE PRUEVA .................................................................................................................. 17
¿Qué es la prueba de la hipótesis? ................................................................................................... 18
CONCLUSIONES Y ERRORES DE UN TEST DE HIPÓTESIS .................................................................... 20
Bibliografía: ....................................................................................................................................... 21
1
Probabilidad y Estadística. MA-23 17/08/2022
Estimación.
La estimación es la determinación de un elemento o factor. Esto, usualmente
tomando como referencia una base o conjunto de datos.
En otras palabras, la estimación es un cálculo que se realiza a partir de la evaluación
estadística. Dicho estudio suele efectuarse sobre una muestra y no sobre toda la
población objetivo.
Para llevar a cabo una estimación, entonces, es necesario primero contar con una
serie de datos. Además, es común que los investigadores se sustenten en un marco
teórico.
Por ejemplo, podemos estimar la inflación definiéndola como la diferencia entre los
precios (de la economía) del periodo A y los precios del periodo B. Entonces, se
calcula una variación porcentual entre los datos registrados en ambos puntos del
tiempo.
Vale aclarar también que la estimación puede efectuarse sin rigurosidad
matemática. Esto suele suceder, por ejemplo, cuando se consulta a algunos
expertos sobre cuánto va a crecer la economía en el presente año. Entonces, sin
haber trabajado un cálculo econométrico, el analista lanza una cifra (o un rango),
posiblemente con base en los indicadores que se vienen observando, como el
consumo de cemento.
Estimación Puntual.
2
Probabilidad y Estadística. MA-23 17/08/2022
3
Probabilidad y Estadística. MA-23 17/08/2022
6.3
𝜇𝑥 ± 1.96𝜎𝑥 = 5.1 ± (1.96)(0.6) = {
3.9
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución
muestral son los valores cuya función de distribución es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribución Normal
estandarizada). Seguidamente generamos una muestra de la población y
obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de
la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:
4
Probabilidad y Estadística. MA-23 17/08/2022
5.7
𝑋̅ ± 1.96𝜎𝑥 = 4.5 ± (1.96)(0.6) = {
3.3
Ahora bien, la distancia de un punto “A” a un punto “B” es la misma que de “B” a “A”.
Por esa razón, la distancia desde m a la Media muestral es la misma que va de la
Media muestral a m. En consecuencia, si hacemos un muestreo con un número
grande de muestras observamos que el 95% de las veces (aproximadamente) el
valor de la Media de la población (m) se encuentra dentro del intervalo definido
alrededor de cada uno de los valores de la Media muestral. El porcentaje de veces
que el valor de m se halla dentro de alguno de los intervalos de confianza es del
95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que él % de veces que m se
halle dentro del intervalo sea igual al 99%, la expresión anterior es:
𝑋̅ ± 2.58𝜎𝑥
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución
muestral en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel), y son los valores cuya función de
probabilidad es igual a 0.995 y 0.005 respectivamente).
5
Probabilidad y Estadística. MA-23 17/08/2022
¿Cómo se calcula?
El error estándar de estimación se puede calcular para todas las medidas que se
obtienen en las muestras (por ejemplo, error estándar de estimación de la media o
error estándar de estimación de la desviación estándar) y mide el error que se
comete al estimar la verdadera medida poblacional a partir de su valor muestral
A partir del error estándar de estimación se construye el intervalo de confianza de
la medida correspondiente.
La estructura general de una fórmula para el error estándar de estimación es la
siguiente:
Error estándar de estimación = ± Coeficiente de confianza * Error estándar
Coeficiente de confianza = valor límite de un estadístico muestral o distribución de
muestreo (normal o campana de Gauss, t de Student, entre otras) para un
determinado intervalo de probabilidades.
Error estándar = desviación estándar de la población dividida por la raíz cuadrada
del tamaño de la muestra.
El coeficiente de confianza indica la cantidad de errores estándar que está dispuesto
a sumar y restar a la medida para tener un cierto nivel de confianza en los
resultados.
Prueba de hipótesis.
Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir
de los datos contenidos en una muestra. Puede encontrarse ya sea un sólo número
6
Probabilidad y Estadística. MA-23 17/08/2022
𝐻0 ; 𝜇 = 50𝑐𝑚
𝑠
𝐻1 ; 𝜇 ≠ 50𝑐𝑚
𝑠
𝐻0 ; 𝜇 = 50𝑐𝑚
𝑠
𝐻0 ; 𝜇 > 50𝑐𝑚
𝑠
O
𝐻0 ; 𝜇 = 50𝑐𝑚
𝑠
𝐻0 ; 𝜇 < 50𝑐𝑚
𝑠
7
Probabilidad y Estadística. MA-23 17/08/2022
Hipótesis nula.
8
Probabilidad y Estadística. MA-23 17/08/2022
Los valores de x 𝑥 que son menores que 48.5 o mayores que 51.5 constituyen la
región crítica de la prueba, mientras que todos los valores que están en el intervalo
48.5 ≤x ≤ 51.5x forman la región de aceptación de la hipótesis nula. Las fronteras
entre las regiones crítica y de aceptación reciben el nombre de valores críticos.
La costumbre es establecer conclusiones con respecto a la hipótesis nula Ho. Por
tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región
crítica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisión puede conducir a una de dos conclusiones
erróneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio de
combustión del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los
especímenes bajo prueba, bien puede observarse un valor del estadístico de prueba
9
Probabilidad y Estadística. MA-23 17/08/2022
x 𝑥 que cae en la región crítica. En este caso, la hipótesis nula Ho será rechazada
en favor de la alternativa H1 cuando, de hecho, Ho en realidad es verdadera.
Error tipo I
Regresión lineal.
La regresión lineal es una técnica de modelado estadístico que se emplea para
describir una variable de respuesta continua como una función de una o varias
variables predictoras. Puede ayudar a comprender y predecir el comportamiento de
sistemas complejos o a analizar datos experimentales, financieros y biológicos.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo
describe la relación entre una variable dependiente y (también conocida como la
respuesta) como una función de una o varias variables independientes Xi
10
Probabilidad y Estadística. MA-23 17/08/2022
Y=β0+∑ βiXi+ϵi
donde β representa las estimaciones de parámetros lineales que se deben calcular
y ϵ representa los términos de error.
Y=β0+βiX+ϵi
Regresión lineal múltiple: modelos que utilizan múltiples predictores. Esta
regresión tiene múltiples Xi para predecir la respuesta, Y. Este es un ejemplo de la
ecuación:
Y=β0+β1X1+β2X2+ϵ
Regresión lineal multivariante: modelos para varias variables de respuesta. Esta
regresión tiene múltiples Yi que derivan de los mismos datos YY. Se expresan con
fórmulas diferentes. Este es un ejemplo del sistema con 2 ecuaciones:
Y1=β01+β11X1+ϵ1Y1=β01+β11X1+ϵ1
Y2=β02+β12X1+ϵ2
Test de hipótesis.
• Las pruebas de significación (test de hipótesis) sirven para comparar dos
situaciones diferentes o, dicho de otra manera, el efecto de un factor a dos niveles
• En ocasiones interesa comparar más de dos situaciones diferentes o el efecto que
tienen un factor que puede tomar varios valores o niveles.
• Cada columna difiere de las demás en que los datos se obtienen después de
aplicar un procedimiento de mineralización diferente.
• El factor que hace que las columnas difieran ¿tiene algún efecto sobre las medias
de esas columnas? Dicho de otra forma, ¿todos los procedimientos de
mineralización originan el mismo resultado?
• Su pongamos que determinamos el contenido en Cu de una muestra por medio
de siete procedimientos de mineralización diferentes:
METODO
11
Probabilidad y Estadística. MA-23 17/08/2022
1 2 3 4 5 6 7
• Cada columna difiere de las demás en que los datos se obtienen después de
aplicar un procedimiento de mineralización diferente.
• El factor que hace que las columnas difieran ¿tiene algún efecto sobre las medias
de esas columnas? Dicho de otra forma, ¿todos los procedimientos de
mineralización originan el mismo resultado?
1 2 3 4 5 6 7
xij = μ + eij
12
Probabilidad y Estadística. MA-23 17/08/2022
𝑋𝑖 𝑗 = 𝜇 + 𝑎𝑗 + 𝑒𝑖 𝑗 ∑ 𝑎𝑗 = 0
SUMA DE CUADRADOS
t ¿Qué es la suma de los cuadrados?
La suma de cuadrados representa una medida de variación o desviación con
respecto a la media. Se calcula como una suma de los cuadrados de las diferencias
con respecto a la media. El cálculo de la suma total de los cuadrados considera
tanto la suma de los cuadrados de los factores como la de aleatoriedad o error.
13
Probabilidad y Estadística. MA-23 17/08/2022
14
Probabilidad y Estadística. MA-23 17/08/2022
(en ese orden), entonces las dos sumas de los cuadrados para C representan la
reducción en la suma de los cuadrados del error residual que se produce cuando C
se agrega a un modelo que contiene A y B.
Las sumas secuenciales y ajustadas de los cuadrados serán igual para todos los
términos si la matriz de diseño es ortogonal. El caso más común en el que ocurre
esto es con los diseños factoriales y factoriales fraccionados (sin covariables)
cuando se analizan en unidades codificadas. En estos diseños, las columnas de la
matriz de diseño para todos los efectos principales y las interacciones son
ortogonales entre sí. Los diseños de Plackett-Burman tienen columnas ortogonales
para los efectos principales (por lo general los únicos términos en el modelo), pero
los términos de interacción, si existen, pueden confundirse parcialmente con otros
términos (es decir, no ortogonales). En los diseños de superficie de respuesta, las
columnas para los términos al cuadrado no son ortogonales entre sí.
Para cualquier diseño, si la matriz de diseño se encuentra en unidades no
codificadas, entonces puede haber columnas que no son ortogonales, a menos que
los niveles de los factores aún estén centrados en cero.
¿Pueden las sumas ajustadas de los cuadrados ser menores, iguales o mayores
que las sumas secuenciales de los cuadrados?
Las sumas ajustadas de los cuadrados pueden ser menores, iguales o mayores que
las sumas secuenciales de los cuadrados.
Supongamos que usted ajusta un modelo con los términos A, B, C y A*B. Sea SC
(A, B, C, A*B) la suma de los cuadrados cuando A, B, C y A*B estén en el modelo.
Sea SC (A, B, C) la suma de los cuadrados cuando A, B y C estén incluidos en el
modelo. Entonces, la suma ajustada de los cuadrados para A*B es:
15
Probabilidad y Estadística. MA-23 17/08/2022
C1 C2
2.40 41.5304
Cuadrados medios
En ANOVA, los cuadrados medios se utilizan para determinar si los factores
(tratamientos) son significativos.
El cuadrado medio del tratamiento se obtiene dividiendo la suma de los cuadrados
del tratamiento entre los grados de libertad. El cuadrado medio del tratamiento
representa la variación entre las medias de las muestras.
El cuadrado medio del error (MSE) se obtiene dividiendo la suma de los cuadrados
del error residual entre los grados de libertad. El MSE representa la variación dentro
de las muestras.
Por ejemplo, usted hace un experimento para probar la efectividad de tres
detergentes para ropa. Recolecta 20 observaciones para cada detergente. La
16
Probabilidad y Estadística. MA-23 17/08/2022
ESTADISTICO DE PRUEVA
¿Qué es un estadístico de prueba?
17
Probabilidad y Estadística. MA-23 17/08/2022
18
Probabilidad y Estadística. MA-23 17/08/2022
19
Probabilidad y Estadística. MA-23 17/08/2022
20
Probabilidad y Estadística. MA-23 17/08/2022
efecto de interés y del tamaño de la muestra. Sin embargo, es más frecuente hablar
de la potencia de la prueba para detectar un efecto de un tamaño determinado.
Estos dos errores deben ser considerados al evaluar el resultado de un trabajo de
investigación que haya empleado pruebas de hipótesis, considerando la posibilidad
de un error I cuando los resultados son significativos y de un error tipo II cuando son
no significativos. La Tabla 1 resume la relación entre los resultados de una prueba
de hipótesis y la realidad.
Bibliografía:
(S/f). Ugr.es. Recuperado el 15 de agosto de 2022, de
https://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadisticaII/tema4.
pdf
ESTIMACIÓN PUNTUAL Y POR INTERVALOS. (s/f). Rpsqualitas.es. Recuperado
el 15 de agosto de 2022, de
http://www.rpsqualitas.es/documentacion/dowloads/quimiometria/estimacion_puntu
al_y_por_intervalos.pdf
21