0% encontró este documento útil (0 votos)
50 vistas18 páginas

Estadistica Inferencial

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 18

http://www.unmsm.edu.pe/educacion/postgrado/estadistica.

pdf

ESTADÍSTICA INFERENCIAL

También se le llama inferencia estadística, pero previamente recordemos que la


estadística
(EI) comprende el conjunto de métodos estadísticos que permiten deducir (inferir) cómo
se distribuye la población bajo estudio, a partir de la información que proporciona una
muestra representativa obtenida de dicha población. Ver sección 1.6.2 del presente
libro.
Para que la estadística inferencial proporcione buenos resultados debe:
1. Basarse en una técnica estadístico-matemática adecuada al problema y
suficientemente
validada.
2. Utilizar una muestra que realmente sea representativa de la población y de un tamaño
suficiente.
Veamos el siguiente ejemplo:
Ejemplo 2.1.
Se realiza un estudio para comparar tres métodos para enseñar técnicas de comprensión
lectora en inglés a escolares de segundo grado de Educación Básica Secundaria, como
son:
1. El método de la enseñanza recíproca.
2. El método de instrucción directa.
3. La combinación de métodos de instrucción directa y enseñanza recíproca.
22
Para iniciarse en el estudio y aplicación de la estadística inferencial es
necesario conocer los conceptos básicos que a continuación se van a tratar.
Las preguntas por resolver son:
1. ¿Cuál de los métodos mejora la comprensión lectora?
2. ¿Para el próximo año el método, identificado como el mejor, dará buenos resultados
para el alumno Javier Hernández León, quién realizará el segundo grado de Educación
Básica Secundaria?
La primera pregunta es un caso de incertidumbre porque basándonos en el estudio de
tres
muestras independientes y en igualdad de condiciones se aplicará uno de los tres
métodos
a cada muestra de manera independiente; con el apoyo de la estadística inferencial
absolvemos esta pregunta, eligiendo a la que mejora significativamente la comprensión
lectora para este tipo de alumnos.
La segunda pregunta es un caso de toma de decisiones porque Javier Hernández León
no
ha participado en el estudio, pero se le aplicará el mejor método que resulte de la
investigación realizada, ahora bien, con qué confianza diremos que ese método logrará
que Javier mejore su comprensión lectora en inglés.
Los casos de incertidumbre y toma de decisiones son resueltos por la estadística
inferencial, por supuesto apoyada por la probabilidad.
http://probabilidadyestadisticaavr.blogspot.com/2008/10/regla-de-adicion-unidad-
ii.html

Regla de adición
Los conjuntos compuestos se generan al aplicar las operaciones básicas. Las uniones de
eventos, las intersecciones, y los complementos son de interés frecuente, la probabilidad
de un evento compuesto a menudo pueden tenerse a partir de las probabilidades de cada
uno de los eventos que le forman. En ocasiones las operaciones básicas de los conjuntos
también son útiles para determinar la probabilidad de un evento compuesto.

Ejercicio:

La siguiente tabla presenta la historia de 940 obleas de un proceso de fabricación de


semiconductores. Supóngase que se elije al azar una oblea, Sea A el evento en que la
oblea tiene altos niveles de contaminación y B el evento donde la oblea esta en el centro
del instrumento.

Sea:
A = {Altos niveles de contaminación}=358
B = {La oblea está en el centro del instrumento}=314

Determinar:

a) ¿Cómo Interpreta A inserción B y A unión B?


b) Calcule la probabilidad de cada evento.

Tenemos que:

AUB= 112+68+246 = 426


A intersección B= 246

Ya determinamos el inciso "a", ahora, para determinar el inciso "b", lo que se tiene que
hacer es dividir el numero de datos del evento entre el numero total de datos:

P(A)=358/940=0.38
P(B)=314/940=0.33
http://probyestrnca.blogspot.com/2008/10/regla-de-la-multiplicacin.html

Regla de la Multiplicación

Si A y B son independientes:

-P(A int B) = P(B)P(A|B)

-P(B int A) = P(A)P(B|A)

Si A y B son dependientes:

-P(A int B) = P(A)P(B)


______________________________________________________________________

Se lanzan un dado blanco y un dado negro. Encontrar la probabilidad de que la suma de


sus caras sea 7 y que el numero del dado negro sea mayor que eld el dado blanco.

Sean los eventos:

A={la suma de las caras es 7}


B={dado negro mayor a dado blanco}

P(A)= 6/36 = 1/6


P(B)= 16/36

P(A|B)= 3/15

P(A int B)= (3/15)(15/36) = 3/36 = 1/12


ht t p: / /ww w. vi tu to r. com / pr o/ 2/ a _17. htm l

Si A 1 , A 2 ,. . . , A n son :

Suc e s os i nc o mp at i ble s 2 a 2.

Y c uya un ió n e s e l es paci o mue s tr al ( A 1 A 2 ... A n =


E ).

Y B e s ot ro s uce s o.

R e s u lta que :

Las p ro ba bi lid ade s p(A 1 ) se de no min an pr oba bi l i da de s a


pr i ori .

Las pr ob a b il i da de s p( A i / B ) s e den om i na n pr oba b ili da de s a


po s t er io ri.

Las probabilidades p( B /A i ) se denominan verosimilitudes.

Ejemplos

E l 2 0% de lo s e mple a dos de una e m pres a s o n i ngen ie ro s y


ot r o 20 % s o n e co no mi s t a s. E l 75 % d e l os i n ge ni e ros o c upa n un
pu es to di rec ti vo y e l 50 % d e l o s ec onom i s t as ta m bién, mie nt r as
qu e l os n o in ge ni e ro s y l os n o ec on om i s ta s s ola me nte el 2 0%
oc up a u n pue s t o dire c t ivo. ¿C uá l e s la pro ba bi li da d de q ue un
e mp lea do di re cti vo e le gid o a l a zar se a inge ni er o?
La p rob a bi li da d d e q ue ha ya un acci de nte en una f á br ica que
di s p one de ala rm a es 0. 1. La p rob a b i li da d d e que s u ene e s ta s í se
ha pro du ci do a l gú n in ci den te es de 0. 97 y l a p rob a bi li d ad de qu e
s ue n e si no ha s uc edi do n in gú n i nc i de nte es 0. 0 2.

E n e l s u pue st o de qu e h aya f unci ona do l a al a rma, ¿ c uá l e s la


pr ob a b il i da d d e q ue no ha ya ha bi do ni ngún i nc i de nt e?

Se an lo s s uc e s os:

I = Pr odu c ir se i n ci de n te.

A = Son ar la al ar ma.

http://www.aulafacil.com/CursoEstadistica/Lecc-18-est.htm

Combinaciones, Variaciones y Permutaciones

Para aplicar la Regla de Laplace, el cálculo de los sucesos favorables y de los sucesos
posibles a veces no plantea ningún problema, ya que son un número reducido y se
pueden calcular con facilidad:

Por ejemplo: Probabilidad de que al lanzar un dado salga el número 2. Tan sólo hay un
caso favorable, mientras que los casos posibles son seis.
Probabilidad de acertar al primer intento el horóscopo de una persona. Hay un caso
favorable y 12 casos posibles.

Sin embargo, a veces calcular el número de casos favorables y casos posibles es


complejo y hay que aplicar reglas matemáticas:

Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la


probabilidad de que al menos los miembros de un matrimonio se sienten junto. En este
caso, determinar el número de casos favorables y de casos posibles es complejo.

Las reglas matemáticas que nos pueden ayudar son el cálculo de combinaciones, el
cálculo de variaciones y el cálculo de permutaciones.

a) Combinaciones:

Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con


los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los
elementos que lo componen, sin que influya el orden.

Por ejemplo, calcular las posibles combinaciones de 2 elementos que se pueden formar
con los números 1, 2 y 3.

Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de


combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se
cuentan una vez.

b) Variaciones:

Calcula el número de subgrupos de 1, 2, 3, etc.elementos que se pueden establecer con


los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los
elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia
de las combinaciones).

Por ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer
con los número 1, 2 y 3.

Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso
los subgrupos (1,2) y (2,1) se consideran distintos.

c) Permutaciones:

Cálcula las posibles agrupaciones que se pueden establecer con todos los elementos de
un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los
elementos.

Por ejemplo, calcular las posibles formas en que se pueden ordenar los número 1, 2 y 3.

Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1)
¿Cómo se calculan?

a) Combinaciones:

Para calcular el número de combinaciones se aplica la siguiente fórmula:

El termino " n ! " se denomina "factorial de n" y es la multiplicación de todos los


números que van desde "n" hasta 1.

Por ejemplo: 4 ! = 4 * 3 * 2 * 1 = 24

La expresión "Cm,n" representa las combinaciones de "m" elementos, formando


subgrupos de "n" elementos.

Ejemplo: C10,4 son las combinaciones de 10 elementos agrupándolos en subgrupos de


4 elementos:

Es decir, podríamos formar 210 subgrupos diferentes de 4 elementos, a partir de los 10


elementos.

b) Variaciones:

Para calcular el número de variaciones se aplica la siguiente fórmula:

La expresión "Vm,n" representa las variaciones de "m" elementos, formando


subgrupos de "n" elementos. En este caso, como vimos en la lección anterior, un
subgrupo se diferenciará del resto, bien por los elementos que lo forman, o bien por el
orden de dichos elementos.

Ejemplo: V10,4 son las variaciones de 10 elementos agrupándolos en subgrupos de 4


elementos:

Es decir, podríamos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los


10 elementos.
c) Permutaciones:

Para calcular el número de permutaciones se aplica la siguiente fórmula:

La expresión "Pm" representa las permutaciones de "m" elementos, tomando todos los
elementos. Los subgrupos se diferenciaran únicamente por el orden de los elementos.

Ejemplo: P10 son las permutaciones de 10 elementos:

Es decir, tendríamos 3.628.800 formas diferentes de agrupar 10 elementos.

http://cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_9.htm

Prueba de hipótesis

Prueba de significancia de una cola


Una prueba es de una cola cuando la hipótesis alterna, H1, establece una dirección,
como:
H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los
hombres.
H1 : el ingreso medio de las mujeres es mayor que el de los hombres.

Distribución de muestreo para el valor estadístico z, prueba de una cola, nivel de


significancia de .05

Prueba de significancia de dos colas

Una prueba es de dos colas cuando no se establece una dirección específica de la


hipótesis alterna H1, como:
H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los
hombres.
Distribución de muestreo para el valor estadístico z, prueba de dos colas,
nivel de significancia de 0.05
Prueba de hipótesis: dos medias poblacionales

Suponga que los parámetros para dos poblaciones son:

Para muestras grandes el estadístico de prueba es:

Cuando σ1 y σ2 no se conocen pero el tamaño de muestra n1 y n2 es mayor o


igual que 30, el estadístico de prueba es

Ejemplo:
Se realizó un estudio para comparar los años promedio de servicio de quienes se
retiraron en 1979 con los que se retiraron el año anterior en Delong
Manufacturing Co. Con un nivel de significancia de .01 ¿podemos concluir que
los trabajadores que se retiraron el año pasado trabajaron más años según la
siguiente muestra? Nota: sea población #1= año anterior.

Paso 1:

Paso 2: Rechace H0 si z > 2.33


Paso 3:

Paso 4: Como z = 6.80 > 2.33, H0 se rechaza. Los que se retiraron el año
anterior tenían más años de servicio.
http://www.itchihuahuaii.edu.mx/academico/cb/meg/documentos/3.1.htm

PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS

1. Definir la Hipótesis estadística H0 y Ha

En la prueba de hipótesis, debemos establecer el valor supuesto o hipotetizado


del parámetro de población antes de comenzar a tomar la muestra. La suposición
que deseamos probar se conoce como hipótesis nula Ho.
Con base en los datos muestrales la hipótesis nula se rechaza o no rechaza.
Nunca se puede aceptar la hipótesis nula como verdadera para demostrar sin
lugar a dudas que la hipótesis es verdadera se tendría que conocer el parámetro
de la población. El no rechazo solamente significa que la evidencia muestral no
es lo suficientemente fuerte como para llevar a su rechazo.
Es importante recordar que, sin importar como se determina el problema, la
hipótesis nula siempre lleva el signo de igual ( = ).

Supongamos que deseamos probar la hipótesis de que la media de la población


es igual a 16. Lo simbolizaríamos y leeríamos “La hipótesis nula es que la media
de la población es igual a 16”.

Ho: µ = 16

El término hipótesis nula surge de las primeras aplicaciones agrícolas y médicas


de la estadística. Con el fin de probar la efectividad un nuevo fertilizante o de
una nueva medicina, la hipótesis que se probaba es que no tuvo efecto, es decir
no tuvo diferencia entre las muestras tratadas y no tratadas.

La hipótesis alternativa describe la conclusión a la que se llegará si se rechaza a


la hipótesis nula. También se conoce como hipótesis de investigación. La
hipótesis alternativa se acepta si los datos de la muestra proporcionan suficiente
evidencia estadística de que la hipótesis nula es falsa.
Consideraremos tres hipótesis alternativas posibles:

Ha: µ ≠ 16
Ha: µ > 16
Ha: µ < 16
El signo de igual ( = ) nunca aparecerá en la hipótesis alternativa. Porque la
hipótesis nula es la declaración que se prueba, y es necesario incluir un valor
especifico en los cálculos. La hipótesis alternativa se observa sólo si se
demuestra que no es verdadera la hipótesis nula.

2. Establecer la estadística de prueba que sea apropiado.

Es un valor que se calcula con base a la información de la muestra, y que se


utiliza para determinar si se rechaza la hipótesis nula

Existen muchas estadísticas de prueba que pertenecen a una distribución


muestral con su propia forma, media y desviación estándar.
Z, t, χ2, F
Por ejemplo en la prueba de hipótesis para la media, la estadística de prueba Z
se calcula por:

X−µ
z=
σ
n
El valor z se basa en la distribución de muestreo de X , que tiene una
distribución normal cuando la muestra es razonablemente grande con µ , σ n .
Así, es posible determinar si la diferencia entre la media muestral y la media
poblacional es importante desde el punto de viste estadístico.

3. Definir el nivel de significancia y la zona de rechazo


El nivel de significancia es la probabilidad de rechazar la hipótesis nula cuando
es verdadera es a lo que se llama error Tipo I.
El nivel de significancia se define con la letra griega alfa ( α ).Se le llama
también nivel de riesgo.
No hay un nivel de significancia que se aplique a todas las pruebas. Se toma la
decisión de utilizar los niveles 0.05 ( que con frecuencia se conoce como un
nivel del 5%), .01, 0.10, o cualquiera entre 0 y 1 a elección de la persona que
realiza la prueba.

La zona de rechazo son los valores de la estadística de prueba para los cuales
se rechaza la hipótesis nula. La regla de decisión en la prueba de hipótesis,
puede establecerse de tres maneras:
Hacer liga con problema resuelto de prueba de hipótesis para la µ
( σ conocida ó n ≥ 30 )
2

1. Regla basada en la estadística de prueba.


2. Regla basada en la probabilidad.
3. Regla basada en la distribución de probabilidad del estadístico utilizado
en la prueba.
La zona de rechazo tiene una magnitud dada por α y una dirección dada por la
hipótesis alternativa.
El siguiente ejemplo es de acuerdo a la hipótesis nula que se planteo en base a la
media poblacional, y al primer ejemplo de hipótesis alternativa:
Si µ = 16, existe sólo un 2.5% de
oportunidad de que una media muestral Si µ = 16, existe sólo un 2.5% de
produzca un valor de Z < -1.96 oportunidad de que una media
muestral produzca un valor de Z >
1.96

No rechazar
Zona de rechazo Zona de rechazo
Cola a la izquierda Cola a la derecha
0.95

0.475 0.475
α/2 = 0.025 α/2 = 0.025

µ = 16

-1.96 0 1.96

Zona de no rechazo

Existe un 95% de probabilidad de que los


resultados muestrales puedan caer entre ±
1.96 si la hipótesis nula es verdadera

4. Calcular la estadística de prueba a partir de los datos muestrales considerando H0


como verdadera

5. Decidir si H0 se acepta o se rechaza.

6. Concluir en términos del contexto del problema.


http://www.hrc.es/bioest/Reglin_8.html

Propiedades del coeficiente de correlación


1) número sin dimensiones entre -1 y 1.
2) si las variables son independientes r=0. La inversa no es necesariamente cierta,
aunque si las variables son normales bivariantes sí.
3) si las variables estuvieran relacionadas linealmente r=1

Un contraste que interesa realizar en un modelo II es H0: r=0. Como

este contraste es totalmente equivalente al realizado sobre dicho coeficiente, aunque


también hay tablas basadas en que una cierta transformación (de Fisher) de r se
distribuye aproximadamente como una normal.

¿Qué mide r?

Se puede demostrar una relación algebraica entre r y el análisis de la varianza de la


regresión de tal modo que su cuadrado (coeficiente de determinación) es la proporción
de variación de la variable Y debida a la regresión. En este sentido, r2 mide el poder
explicatorio del modelo lineal.

¿Qué no mide r?

- no mide la magnitud de la pendiente ("fuerza de la asociación")

- tampoco mide lo apropiado del modelo lineal


Potencia de los contrastes en regresión

Los contrastes se realizan en base al conocimiento de la distribución muestral del


estadístico usado. En el caso de la regresión, las distribuciones usadas son la normal
(para r) y la t de Student (para los coeficientes). Sólo para la normal es fácil el cálculo
de la potencia, pero sabemos que la t tiende asintóticamenta (para muestras grandes
(>30 en la práctica) a la normal. Usaremos esto.

1- b = p(rechazar Ho| Ho falsa)

Supongamos que

asumamos normalidad ¿qué potencia tiene el contraste si a1 fuera 5 (recordar que se


necesita concretar H1)?

¿Cuándo rechazamos H0 al 95%?

Cuando

en nuestro caso mayor que 4,92. Como no lo es, no rechazamos H0. Hay que calcular la
probabilidad de encontrar

si a1 fuera 5. Calculamos

y lo miramos en la tabla de la normal 1- b =0,512=51,2%.


http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_12.htm

Coeficiente de determinación
El coeficiente de determinación, r2 - la proporción de la variación total en la variable
dependiente Y que está explicada por o se debe a la variación en la variable
independiente X.
El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma
valores de 0 a 1.

Ejemplo:
Dan Ireland, presidente de la sociedad de alumnos de la Universidad de Toledo,
está preocupado por el costo de los libros. Para tener un panorama del problema
elige una muestra de 8 libros de venta en la librería. Decide estudiar la relación
entre el número de páginas del libro y el costo. Calcule el coeficiente de
correlación.

r =.614 (verifique)
Pruebe la hipótesis de que no existe correlación en la población. Use .02 de nivel
de significancia.
Paso 1: H0 la correlación en la población es cero. H1 la correlación en la
población es distinta de cero.
Paso 2: H0 se rachza si t>3.143 o si t<-3.143, gl = 6, a = .02
El estadístico de prueba es t = 1.9055, calculado por

con (n - 2) grados de libertad


Paso 4: H0 no se rechaza
http://www.monografias.com/trabajos16/metodos-lineales/metodos-lineales.shtml#f

Regresión lineal múltiple.


En la mayor parte de los problemas de investigación donde se aplica el análisis de
regresión se necesita más de una variable independiente en el modelo de regresión. La
complejidad de la mayor parte de los mecanismos científicos es tal que para ser capaces
de predecir una respuesta importante se necesita un modelo de regresión múltiple.
Cuando este modelo es lineal en los coeficientes se denomina modelo de regresión
lineal múltiple. Para el caso de k variables independientes X1, X2,....,Xk, la media de Y|
X1, X2,....,XK está dada por el modelo de regresión lineal múltiple
m Y|x1, x2 ,………, xk = b 0 + b 1 x1 +……..+ b k xk

y la respuesta estimada se obtiene de la ecuación de regresión de la muestra

donde cada coeficiente de regresión b i se estima por bi de los datos de la muestra con el
uso del método de mínimos cuadrados. Como en el caso de una sola variable
independiente, el modelo de regresión lineal múltiple a menudo puede ser una
representación adecuada de una estructura más complicada dentro de ciertos rangos de
las variables independientes.
Técnicas de mínimos cuadrados similares también se pueden aplicar al estimar los
coeficientes cuando el modelo lineal involucra, digamos, potencias y productos de las
variables independientes. Por ejemplo, cuando k = 1, el experimentador puede pensar
que las medias m Y|x1 no caen en una línea recta pero que se describen de forma más
apropiada con el modelo de regresión polinomial

m Y|x = b 0 + b 1 x +b 2 x2+ ……..+ b r xr

y la respuesta estimada se obtiene de la ecuación de regresión polinomial

En ocasiones surge confusión cuando hablamos de un modelo polinomial como de un


modelo lineal. Sin embargo, los estadísticos por lo general se refieren a un modelo
lineal como uno en el cual los parámetros ocurren linealmente, sin importar cómo entran
las variables independientes al modelo. Un ejemplo de un modelo no lineal es la
relación exponencial
m Y|x = a b x,
que se estima con la ecuación de regresión

Existen muchos fenómenos en la ciencia y en la ingeniería que son inherentemente no


lineales por naturaleza y, cuando se conoce la estructura real, desde luego se debe hacer
un intento para ajustar el modelo presente. La literatura sobre estimación por mínimos
cuadrados de modelos no lineales es voluminosa. El estudiante que quiera una buena
explicación de algunos aspectos de este tema debe consultar Classical and Modern
Regression with Applications de Myers.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy