Distribuciones Discretas y Continuas en R

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Apuntes distribuciones de probabilidad

Cristian Gutiérrez N.

2022-08-04

Contents
Distribuciones de probabilidad 2
Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Esperanza de una variable aleatoria discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Funciones en R disponibles para distribuciones discretas . . . . . . . . . . . . . . . . . . . . . 3
Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Funciones en R disponibles para distribuciones continuas . . . . . . . . . . . . . . . . . . . . . 6
Estándarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Ejemplo 1 Puntuación Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ejemplo 2 Distribución Normal con media y desviación estándar. . . . . . . . . . . . . . . . . 8
Ejemplo 3 Lectura inversa de la tabla normal estándar: . . . . . . . . . . . . . . . . . . . . . 8
Ejemplo 4 Distribución de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Aproximación Binomial a Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Ejemplo 3 Distribución Exponenecial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1
Distribuciones de probabilidad
Definición: Una variable aleatoria es un número que depende del resultado aleatorio de un experimento. Una
variable aleatoria es una regla que asigna un valor numérico (sólo uno) a cada punto en el espacio muestral
de un experimento aleatorio.
Nota: normalmente se usan letras mayúsculas, y del final de abecedario, (X, Y, o Z) para denotar variables
aleatorias. Si la variable aleatoria es discreta la describimos según su distribución de probabilidades, que
consiste en una lista de valores posibles de la variable y la proporción de veces que esperamos que ocurran.

Distribuciones discretas
La función de probabilidad o función de cuantía f es una función

f : R → [0, 1]

P (X = x), si x = x1 , x2 , . . .;

f (x) =
0, de otra forma.

Algunas propiedades de f son las siguientes:

f (x) ≥ 0 ∀ x ∈ R.
X
f (x) = 1
x∈R
.
La distribución de probabilidades de una variable aleatoria discreta X es una función (tabla o regla), denotada
por p(x) o P (X = x), que asigna una probabilidad a cada valor posible de la variable aleatoria X.

Esperanza de una variable aleatoria discreta


La esperanza (o valor esperado de una variable aleatroia discreta, corresponde al valor medio (esperado) de
una variable aleatoria X. Se calcula de la siguiente forma:

X
µ = E(X) = xk · f (xk )
k

o bien como

X
µ = E(X) = xi · P (X = xi )
R

La esperanza de una variable aleatoria X es un promedio ponderado, cuyas ponderaciones son las probabilidades
de cada xi del Recorrido de X Rec(X).
La varianza de X se define así:
X
σ 2 = V (X) = (xk − µ)2 · f (xk ).
k

o bien

2
V (X) = E(X 2 ) − E(X)


donde E(X 2 ) = x2k · f (xk )


P
k

2
Funciones en R disponibles para distribuciones discretas
• dxxx(x, . . . ) # Función de masa de probabilidad, f(x)
• pxxx(q, . . . ) # Función de distribución acumulada hasta q, F(x)
• qxxx(p, . . . ) # Cuantil para el cual P(X <= q) = p
• rxxx(n, . . . ) # Generador de números aleatorios.
En el lugar de las letras xxx se de debe colocar el nombre de la distribución en R, a continuación el listado de
nombres disponibles para las 6 distribuciones discretas básicas.
• binom # Binomial
• geo # Geométrica
• nbinom # Binomial negativa
• hyper # Hipergeométrica
• pois # Poisson

Distribución binomial
Cada ensayo de una distribución binomial termina en sólo uno de dos resultados mutuamente excluyentes, uno
de los cuales se identifica como éxito y el otro como fracaso, proviene de un ensayo Bernoulli. Sin embargo,
se advierte que estos términos no tienen ninguna connotación de “bueno” o “malo”.
• La probabilidad de éxito, p, para cada resultado permanece constante en un ensayo al siguiente, al igual
que lo hace la de fracaso (1-p).
• La probabilidad de éxito es independiente en cada ensayo
• El experimento puede repetirse muchas veces La probabilidad de que de n número de individuos o
unidades, un x número dado se obtiene mediante la siguiente expresión:
 
n k
P (X = k) = p (1 − p)n−k , x = 0, 1, 2, . . . , n
x
Donde: n: tamaño de la muestra p: probabilidad de éxito q: probabilidad de fracaso q=1-p
La media y desviación estándar para esta distribución son: Media o valor esperado:

E(X) = np

Desviación estándar:
V (X) = np(1 − p)

Ejemplo 1
Una de las medidas de control de calidad de un amortiguador para automóvil, es probarlo en los baches de
una pista, se encontró que el 20% de los amortiguadores sometidos a la prueba presentaban fuga de aceite y
por lo tanto están defectuosos. Si se instalan 20 de estos amortiguadores, represente y determine:
a) Representación gráfica de la distribución de probabilidades
b) La probabilidad de que más de 5 estén defectuosos.
c) La probabilidad de que de 3 a 6 amortiguadores estén defectuosos.
d) La probabilidad de que a lo más 5 estén defectuosos.
e) La probabilidad de que 5 estén defectuosos.
# a) realice una representación gráfica de la distribución de probabilidades,
x <- 0:20 # Recorrido de la variable
n <- 20 # muestra
p <- 0.2 # probabilidad de éxito
prob <- dbinom(x,n,p)
df.binom <- as.data.frame(cbind(x,prob))

3
library(ggplot2)
q <- ggplot(df.binom, aes(x,prob))
q+geom_col(fill="orange", color="black")

0.20

0.15
prob

0.10

0.05

0.00

0 5 10 15 20
x
#b) la probabilidad de que más de 5 estén defectuosos.
x <- 6:20
sum(dbinom(x,n,p))

## [1] 0.1957922
## [1] 0.1957922
#c) la probabilidad de que de 3 a 6 amortiguadores estén defectuosos.
x <- 3:6
sum(dbinom(x,n,p))

## [1] 0.7072228
## [1] 0.7072228
#d) la probabilidad de que a lo más 5 estén defectuosos.
x <- 0:5
sum(dbinom(x,n,p))

## [1] 0.8042078
#e) la probabilidad de que 5 estén defectuosos.
x <- 5
dbinom(x,n,p)

## [1] 0.1745595

4
Distribución de Poisson
Una variable aleatoria en la medición de la frecuencia relativa de un evento sobre alguna unidad de tiempo o
espacio es la distribución de Poisson. Con frecuencia se utiliza para describir el número de llegadas de clientes
por hora, número de accidentes industriales en cada mes, número de fallas en una línea eléctrica, y otras.
Mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio.
Son necesarios dos supuestos para la aplicación de la distribución.
• La probabilidad de ocurrencia del evento es constante para dos intervalos de tiempo o espacio
• La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera
La función de probabilidad de Poisson puede expresarse como:

e−µ · µx
P (X = x) = f (x) =
x!
Donde:

f (x)
es la función de probabilidad para valores de

x = 0, 1, 2, 3.., n

µ
es el valor medio esperado en cierto lapso de tiempo. Algunas veces expresado como

x
es la variable aleatoria. Es una variable aleatoria discreta (x=0,1,2,. . . )

valor constante, es la base de los logaritmos naturales 2.71728.

Ejemplo 2
Supongamos que está interesado en la probabilidad de que exactamente 5 clientes lleguen durante la siguiente
hora laboral. La observación simple de las últimas 80 horas ha demostrado que 780 clientes han entrado al
negocio. Además, ¿Cuál es la probabilidad de que lleguen dos o menos personas? Y ¿Cuál es la probabilidad
de que lleguen más de tres personas?
## Distribución Poisson

mu <- 780/80
# la probabilidad de que exactamente 5 clientes lleguen durante la siguiente hora laboral
x <- 5
sum(dpois(x,mu))

## [1] 0.04280265

5
## [1] 0.04280265
#¿Cuál es la probabilidad de que lleguen dos o menos personas?
x <- 0:2
sum(dpois(x,mu))

## [1] 0.003397486
## [1] 0.003397486
# ¿Cuál es la probabilidad de que lleguen más de tres personas?
x <- 0:3
sum(dpois(x,mu))

## [1] 0.01240265
## [1] 0.01240265
1-sum(dpois(x,mu))

## [1] 0.9875974
## [1] 0.9875974

Distribuciones continuas
Distribución Normal
La distribución de probabilidad continua más importante en todo el campo de la estadística es la distribución
normal. Su gráfica, denominada curva normal, es la curva con forma de campana, la cual describe de manera
aproximada muchos fenómenos que ocurren en la naturaleza, la industria y la investigación.
En 1733, Abraham DeMoivre desarrolló la ecuación matemática de la curva normal, la cual sentó las bases
sobre las que descansa gran parte de la teoría de la estadística inductiva. La distribución normal a menudo
se denomina distribución gaussiana en honor de Karl Friedrich Gauss (1777-1855), quien también derivó su
ecuación a partir de un estudio de errores en mediciones repetida de la misma cantidad.

La ecuación matemática para la distribución de probabilidad de la variable normal depende de dos parámetros

y
σ
, su media y su desviación estándar, respectivamente. Su expresión viene dada por:

1 (x−µ)2
f (x) = √ e− 2σ 2 , para todo x real
2πσ 2

Funciones en R disponibles para distribuciones continuas


Para cada distribución hay cuatro comandos. Los comandos para cada distribución están precedidos de una
letra para indicar la funcionalidad:
• d: devuelve la función de densidad de probabilidad

6
• p: devuelve la función de distribución (acumulada)
• q: Devuelve la función de distribución (acumulada) inversa (quantiles)
• r: devuelve los números generados aleatoriamente

#valores al azar de la distribución normal


randNorm <- rnorm(300000)
#calculo de su densidad
randDensity <- dnorm(randNorm)
#gráfica
library(ggplot2)
ggplot(data.frame(x = randNorm, y = randDensity)) +
aes(x = x, y = y) +
geom_point() +
labs(x = "Random Normal Variable", y = "Densidad")

0.4

0.3
Densidad

0.2

0.1

0.0

−5.0 −2.5 0.0 2.5


Random Normal Variable

Estándarización
Para calcular probabilidades en el caso de variables normales, con media µ y desviación típica

N (µ, σ)

, se debe transformar la variable a una variable normal tipificada,

N (0, 1)

realizando el siguiente proceso:

7
Xi − µ
Z=
σ
Si
X ∼ N (µ = 120, σ = 15), determine : P (x ≤ 97)

X − µ 97 − 120 
P (X ≤ 97) = P (X − 120 ≤ t − 120) = P ≤ =
σ 15

 97 − 120 
P Z≤ = P (Z ≤ −1, 533) = 0, 063
15

Ejemplo 1 Puntuación Z

## Distribución Normal
#Calcular P(z<=2.31)
pnorm(2.31)

## [1] 0.9895559
pnorm(-1.53)

## [1] 0.06300836
## Distribución Normal con media y desviación estándar
#Calcular P(x<=97), con mu = 120 ; sd = 15
pnorm(97, mean = 120, sd = 15)

## [1] 0.06259687

Ejemplo 2 Distribución Normal con media y desviación estándar.

#Calcular P(x<=140), con mu = 120 ; sd = 15


pnorm(140, mean = 125, sd = 10)

## [1] 0.9331928
a<-pnorm(834,mean=800,sd=40)
b<-pnorm(778,mean=800,sd=40)
a-b

## [1] 0.5111778

Ejemplo 3 Lectura inversa de la tabla normal estándar:

#Si x~N(mu=125;sd=10), determine:P(x<=a)=0.95


qnorm(0.95, mean = 125, sd = 10)

## [1] 141.4485
qnorm(0.10, mean = 5500, sd = 1300)

## [1] 3833.983
1-qnorm(0.10, mean = 5500, sd = 1300)

## [1] -3832.983

8
Ejemplo 4 Distribución de pesos
Se desea estudiar las características físicas de los habitantes de determinado pueblo. Para hacer el estudio se
consideran aquellos que tengan entre 18 y 35 años. Entre las variables de interés se encuentra el peso de
cada habitante (por el tipo de alimentación y el ritmo de vida que llevan). Si se considera que la distribución
de los pesos es Normal con media 60,5 kg y desviación estándar 5 kg. Si se selecciona un individuo al azar:
a. ¿Cuál es la probabilidad que pese más de 60 kg? b. ¿Cuál es la probabilidad que pese entre 50 y 65 kg?
c. ¿Qué peso tiene a lo más el 75% de los individuos?
mu <- 60.5
sd <- 5

#Distribución Normal con media y desviacion estándar

#Calcular P(x>60)=1-p(x<=60), con mu = 60,5 ; sd = 5


#a. ¿Cuál es la probabilidad que pese más de 60 kg?
pnorm(60, mu, sd, lower.tail = FALSE)

## [1] 0.5398278
##[1] 0.5398278
1-pnorm(60, mu, sd)

## [1] 0.5398278
## [1] 0.5398278
#b) ¿Cuál es la probabilidad que pese entre 50 y 65 kg? P(50<=X<=65)
pnorm(65, mu, sd)-pnorm(50, mu, sd)

## [1] 0.7980755
#c)¿Qué peso tiene a lo más el 75% de los individuos? Recordar:
#Lectura inversa de la tabla normal estándar:
qnorm(0.75, mean = 60.5, sd = 5)

## [1] 63.87245

Aproximación Binomial a Normal


Un fabricante sabe por experiencia que de 17000 productos, el 4% es rechazado por defectos. Supongamos
que un nuevo lote de 800 unidades va a ser inspeccionado. a. Calcule la probabilidad aproximada de que
menos de 35 productos sean rechazados.
k <- 34
n <- 800
p <- 0.04
q <- 1-p
muSi <- n*p
muNo <- n*q
mu <- muSi
sigma <- sqrt(n*p*q)
z <- (k +0.5-mu)/sigma
probabilidad_e <- pnorm(z)
probabilidad_e

## [1] 0.674025

9
Distribución Exponencial
La distribución de Poisson es una distribución discreta que mide el número de ocurrencias sobre algún
intervalo de tiempo o espacio. Describe por ejemplo, el número de clientes que pueden llegar durante un
determinado tiempo. Por el contrario la distribución exponencial es una distribución continua. Mide el paso
del tiempo entre tales ocurrencias.
Mientras que la distribución de Poisson describe las tasas de llegadas dentro de algún período dado, la
distribución exponencial estima el lapso entre tales arribos. Si el número de ocurrencias tiene distribución
Poisson, el lapso entre las ocurrencias estará distribuido exponencialmente.
La función de densidad de probabilidad (pdf) de una distribución exponencial se expresa como

f (x; λ) = λ exp(−λx)
donde
λ>0
es la tasa del evento (también conocida como parámetro de tasa, tasa de llegada, tasa de mortalidad, tasa de
fracaso, tasa de transición). La variable exponencial
La función de distribución acumulada de la distribución exponencial corresponde a

1 − e−λx x≥0

F (x) = Pr(X ≤ x) =
0 x<0

Ejemplo 3 Distribución Exponenecial


La duración de vida de una ampolleta sigue una distribución exponenecial. La probabilidad de que sobrepase
100 horas de uso es 0,9.
• a) ¿Cuál es la probabilidad de que sobrepase 200 horas de uso?
• b) ¿Cuántas horas se mantiene funcionando con una probabilidad 0,95?
x <- 200 #horas de uso
mu <- 952.381 #media de horas de uso

# a) ¿Cuál es la probabilidad de que sobrepase 200 horas de uso?


1-pexp(x, rate = 1/mu)

## [1] 0.8105843
# b) ¿Cuántas horas se mantiene funcionando con una probabilidad 0,95?
qexp(0.95, rate = 0.00105, lower.tail = F, log.p = F)

## [1] 48.85076

10

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy