Distribuciones Discretas y Continuas en R
Distribuciones Discretas y Continuas en R
Distribuciones Discretas y Continuas en R
Cristian Gutiérrez N.
2022-08-04
Contents
Distribuciones de probabilidad 2
Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Esperanza de una variable aleatoria discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Funciones en R disponibles para distribuciones discretas . . . . . . . . . . . . . . . . . . . . . 3
Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Funciones en R disponibles para distribuciones continuas . . . . . . . . . . . . . . . . . . . . . 6
Estándarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Ejemplo 1 Puntuación Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ejemplo 2 Distribución Normal con media y desviación estándar. . . . . . . . . . . . . . . . . 8
Ejemplo 3 Lectura inversa de la tabla normal estándar: . . . . . . . . . . . . . . . . . . . . . 8
Ejemplo 4 Distribución de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Aproximación Binomial a Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Ejemplo 3 Distribución Exponenecial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1
Distribuciones de probabilidad
Definición: Una variable aleatoria es un número que depende del resultado aleatorio de un experimento. Una
variable aleatoria es una regla que asigna un valor numérico (sólo uno) a cada punto en el espacio muestral
de un experimento aleatorio.
Nota: normalmente se usan letras mayúsculas, y del final de abecedario, (X, Y, o Z) para denotar variables
aleatorias. Si la variable aleatoria es discreta la describimos según su distribución de probabilidades, que
consiste en una lista de valores posibles de la variable y la proporción de veces que esperamos que ocurran.
Distribuciones discretas
La función de probabilidad o función de cuantía f es una función
f : R → [0, 1]
P (X = x), si x = x1 , x2 , . . .;
f (x) =
0, de otra forma.
f (x) ≥ 0 ∀ x ∈ R.
X
f (x) = 1
x∈R
.
La distribución de probabilidades de una variable aleatoria discreta X es una función (tabla o regla), denotada
por p(x) o P (X = x), que asigna una probabilidad a cada valor posible de la variable aleatoria X.
X
µ = E(X) = xk · f (xk )
k
o bien como
X
µ = E(X) = xi · P (X = xi )
R
La esperanza de una variable aleatoria X es un promedio ponderado, cuyas ponderaciones son las probabilidades
de cada xi del Recorrido de X Rec(X).
La varianza de X se define así:
X
σ 2 = V (X) = (xk − µ)2 · f (xk ).
k
o bien
2
V (X) = E(X 2 ) − E(X)
2
Funciones en R disponibles para distribuciones discretas
• dxxx(x, . . . ) # Función de masa de probabilidad, f(x)
• pxxx(q, . . . ) # Función de distribución acumulada hasta q, F(x)
• qxxx(p, . . . ) # Cuantil para el cual P(X <= q) = p
• rxxx(n, . . . ) # Generador de números aleatorios.
En el lugar de las letras xxx se de debe colocar el nombre de la distribución en R, a continuación el listado de
nombres disponibles para las 6 distribuciones discretas básicas.
• binom # Binomial
• geo # Geométrica
• nbinom # Binomial negativa
• hyper # Hipergeométrica
• pois # Poisson
Distribución binomial
Cada ensayo de una distribución binomial termina en sólo uno de dos resultados mutuamente excluyentes, uno
de los cuales se identifica como éxito y el otro como fracaso, proviene de un ensayo Bernoulli. Sin embargo,
se advierte que estos términos no tienen ninguna connotación de “bueno” o “malo”.
• La probabilidad de éxito, p, para cada resultado permanece constante en un ensayo al siguiente, al igual
que lo hace la de fracaso (1-p).
• La probabilidad de éxito es independiente en cada ensayo
• El experimento puede repetirse muchas veces La probabilidad de que de n número de individuos o
unidades, un x número dado se obtiene mediante la siguiente expresión:
n k
P (X = k) = p (1 − p)n−k , x = 0, 1, 2, . . . , n
x
Donde: n: tamaño de la muestra p: probabilidad de éxito q: probabilidad de fracaso q=1-p
La media y desviación estándar para esta distribución son: Media o valor esperado:
E(X) = np
Desviación estándar:
V (X) = np(1 − p)
Ejemplo 1
Una de las medidas de control de calidad de un amortiguador para automóvil, es probarlo en los baches de
una pista, se encontró que el 20% de los amortiguadores sometidos a la prueba presentaban fuga de aceite y
por lo tanto están defectuosos. Si se instalan 20 de estos amortiguadores, represente y determine:
a) Representación gráfica de la distribución de probabilidades
b) La probabilidad de que más de 5 estén defectuosos.
c) La probabilidad de que de 3 a 6 amortiguadores estén defectuosos.
d) La probabilidad de que a lo más 5 estén defectuosos.
e) La probabilidad de que 5 estén defectuosos.
# a) realice una representación gráfica de la distribución de probabilidades,
x <- 0:20 # Recorrido de la variable
n <- 20 # muestra
p <- 0.2 # probabilidad de éxito
prob <- dbinom(x,n,p)
df.binom <- as.data.frame(cbind(x,prob))
3
library(ggplot2)
q <- ggplot(df.binom, aes(x,prob))
q+geom_col(fill="orange", color="black")
0.20
0.15
prob
0.10
0.05
0.00
0 5 10 15 20
x
#b) la probabilidad de que más de 5 estén defectuosos.
x <- 6:20
sum(dbinom(x,n,p))
## [1] 0.1957922
## [1] 0.1957922
#c) la probabilidad de que de 3 a 6 amortiguadores estén defectuosos.
x <- 3:6
sum(dbinom(x,n,p))
## [1] 0.7072228
## [1] 0.7072228
#d) la probabilidad de que a lo más 5 estén defectuosos.
x <- 0:5
sum(dbinom(x,n,p))
## [1] 0.8042078
#e) la probabilidad de que 5 estén defectuosos.
x <- 5
dbinom(x,n,p)
## [1] 0.1745595
4
Distribución de Poisson
Una variable aleatoria en la medición de la frecuencia relativa de un evento sobre alguna unidad de tiempo o
espacio es la distribución de Poisson. Con frecuencia se utiliza para describir el número de llegadas de clientes
por hora, número de accidentes industriales en cada mes, número de fallas en una línea eléctrica, y otras.
Mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio.
Son necesarios dos supuestos para la aplicación de la distribución.
• La probabilidad de ocurrencia del evento es constante para dos intervalos de tiempo o espacio
• La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera
La función de probabilidad de Poisson puede expresarse como:
e−µ · µx
P (X = x) = f (x) =
x!
Donde:
f (x)
es la función de probabilidad para valores de
x = 0, 1, 2, 3.., n
µ
es el valor medio esperado en cierto lapso de tiempo. Algunas veces expresado como
x
es la variable aleatoria. Es una variable aleatoria discreta (x=0,1,2,. . . )
Ejemplo 2
Supongamos que está interesado en la probabilidad de que exactamente 5 clientes lleguen durante la siguiente
hora laboral. La observación simple de las últimas 80 horas ha demostrado que 780 clientes han entrado al
negocio. Además, ¿Cuál es la probabilidad de que lleguen dos o menos personas? Y ¿Cuál es la probabilidad
de que lleguen más de tres personas?
## Distribución Poisson
mu <- 780/80
# la probabilidad de que exactamente 5 clientes lleguen durante la siguiente hora laboral
x <- 5
sum(dpois(x,mu))
## [1] 0.04280265
5
## [1] 0.04280265
#¿Cuál es la probabilidad de que lleguen dos o menos personas?
x <- 0:2
sum(dpois(x,mu))
## [1] 0.003397486
## [1] 0.003397486
# ¿Cuál es la probabilidad de que lleguen más de tres personas?
x <- 0:3
sum(dpois(x,mu))
## [1] 0.01240265
## [1] 0.01240265
1-sum(dpois(x,mu))
## [1] 0.9875974
## [1] 0.9875974
Distribuciones continuas
Distribución Normal
La distribución de probabilidad continua más importante en todo el campo de la estadística es la distribución
normal. Su gráfica, denominada curva normal, es la curva con forma de campana, la cual describe de manera
aproximada muchos fenómenos que ocurren en la naturaleza, la industria y la investigación.
En 1733, Abraham DeMoivre desarrolló la ecuación matemática de la curva normal, la cual sentó las bases
sobre las que descansa gran parte de la teoría de la estadística inductiva. La distribución normal a menudo
se denomina distribución gaussiana en honor de Karl Friedrich Gauss (1777-1855), quien también derivó su
ecuación a partir de un estudio de errores en mediciones repetida de la misma cantidad.
La ecuación matemática para la distribución de probabilidad de la variable normal depende de dos parámetros
y
σ
, su media y su desviación estándar, respectivamente. Su expresión viene dada por:
1 (x−µ)2
f (x) = √ e− 2σ 2 , para todo x real
2πσ 2
6
• p: devuelve la función de distribución (acumulada)
• q: Devuelve la función de distribución (acumulada) inversa (quantiles)
• r: devuelve los números generados aleatoriamente
0.4
0.3
Densidad
0.2
0.1
0.0
Estándarización
Para calcular probabilidades en el caso de variables normales, con media µ y desviación típica
N (µ, σ)
N (0, 1)
7
Xi − µ
Z=
σ
Si
X ∼ N (µ = 120, σ = 15), determine : P (x ≤ 97)
X − µ 97 − 120
P (X ≤ 97) = P (X − 120 ≤ t − 120) = P ≤ =
σ 15
97 − 120
P Z≤ = P (Z ≤ −1, 533) = 0, 063
15
Ejemplo 1 Puntuación Z
## Distribución Normal
#Calcular P(z<=2.31)
pnorm(2.31)
## [1] 0.9895559
pnorm(-1.53)
## [1] 0.06300836
## Distribución Normal con media y desviación estándar
#Calcular P(x<=97), con mu = 120 ; sd = 15
pnorm(97, mean = 120, sd = 15)
## [1] 0.06259687
## [1] 0.9331928
a<-pnorm(834,mean=800,sd=40)
b<-pnorm(778,mean=800,sd=40)
a-b
## [1] 0.5111778
## [1] 141.4485
qnorm(0.10, mean = 5500, sd = 1300)
## [1] 3833.983
1-qnorm(0.10, mean = 5500, sd = 1300)
## [1] -3832.983
8
Ejemplo 4 Distribución de pesos
Se desea estudiar las características físicas de los habitantes de determinado pueblo. Para hacer el estudio se
consideran aquellos que tengan entre 18 y 35 años. Entre las variables de interés se encuentra el peso de
cada habitante (por el tipo de alimentación y el ritmo de vida que llevan). Si se considera que la distribución
de los pesos es Normal con media 60,5 kg y desviación estándar 5 kg. Si se selecciona un individuo al azar:
a. ¿Cuál es la probabilidad que pese más de 60 kg? b. ¿Cuál es la probabilidad que pese entre 50 y 65 kg?
c. ¿Qué peso tiene a lo más el 75% de los individuos?
mu <- 60.5
sd <- 5
## [1] 0.5398278
##[1] 0.5398278
1-pnorm(60, mu, sd)
## [1] 0.5398278
## [1] 0.5398278
#b) ¿Cuál es la probabilidad que pese entre 50 y 65 kg? P(50<=X<=65)
pnorm(65, mu, sd)-pnorm(50, mu, sd)
## [1] 0.7980755
#c)¿Qué peso tiene a lo más el 75% de los individuos? Recordar:
#Lectura inversa de la tabla normal estándar:
qnorm(0.75, mean = 60.5, sd = 5)
## [1] 63.87245
## [1] 0.674025
9
Distribución Exponencial
La distribución de Poisson es una distribución discreta que mide el número de ocurrencias sobre algún
intervalo de tiempo o espacio. Describe por ejemplo, el número de clientes que pueden llegar durante un
determinado tiempo. Por el contrario la distribución exponencial es una distribución continua. Mide el paso
del tiempo entre tales ocurrencias.
Mientras que la distribución de Poisson describe las tasas de llegadas dentro de algún período dado, la
distribución exponencial estima el lapso entre tales arribos. Si el número de ocurrencias tiene distribución
Poisson, el lapso entre las ocurrencias estará distribuido exponencialmente.
La función de densidad de probabilidad (pdf) de una distribución exponencial se expresa como
f (x; λ) = λ exp(−λx)
donde
λ>0
es la tasa del evento (también conocida como parámetro de tasa, tasa de llegada, tasa de mortalidad, tasa de
fracaso, tasa de transición). La variable exponencial
La función de distribución acumulada de la distribución exponencial corresponde a
1 − e−λx x≥0
F (x) = Pr(X ≤ x) =
0 x<0
## [1] 0.8105843
# b) ¿Cuántas horas se mantiene funcionando con una probabilidad 0,95?
qexp(0.95, rate = 0.00105, lower.tail = F, log.p = F)
## [1] 48.85076
10