Resumen

Relación entre dos variables:
En muchas situaciones más que el análisis individual de las variables interesa la relación que
pudiera existir entre dos variables y la fuerza de esta relación. Esto permitirá en algunos casos
proyectar los valores de una de las variables en función de los valores de la otra variable. Por el
contrario, si entre dos variables no existe ningún tipo de relación, el conocimiento de una de las
variables no nos servirá para predecir o suponer los valores de la otra variable, luego se debería
prescindir de una de ellas. La covarianza muestral cuantifica el grado de asociación lineal entre
dos variables, se define
de la siguiente forma:
Sin embargo, esta medida no nos permite medir la fuerza de la relación, pudiéndose señalar
simplemente que cuando esta medida es cero, las variables no están relacionadas linealmente.
Por ello es que una medida de la fuerza de la relación lineal está dada por el Coeficiente de
Correlación Muestral
de Pearson, r.  1  r
1
Regresión Lineal Simple:

El objeto de la Regresión Lineal Simple es la búsqueda de una expresión matemática entre dos
variables que permita explicar o predecir el comportamiento de una variable, con el
conocimiento a priori de la otra variable. La regresión permite intuir una relación de causa y
efecto entre dos variables. Por ejemplo, la demanda de automóviles podría estar determinada por
la baja en las tasas de interés de los préstamos bancarios. Consideremos que una variable de
interés, Y, variable respuesta o variable dependiente, mantiene un cierto nivel de comportamiento
frente a los cambios en una variable independiente o predictora, X. Se plantea entonces la
siguiente ecuación matemática:
Ecuación de regresión:
La regresión analiza la variabilidad de los Y’s
descomponiéndola en una suma de las varianzas
explicada por la ecuación de regresión y la No
Explicada por la regresión, es decir:
Esto permite definir el Coeficiente de Determinación, R²

Este coeficiente representa la fuerza con que la variable
predictora, X, permite explicar la variabilidad de la variable respuesta, Y. Otra forma de calcular
el R² es utilizando el coeficiente de correlación de Pearson (r),
Probabilidades:
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento o suceso. Por
lo tanto, las probabilidades son una medida del grado de incertidumbre asociado a cada uno de
los eventos previamente enunciados. En el contexto de las probabilidades, un experimento es
definido como el proceso que genera resultados.
Conceptos básicos:
a. Experimento: cualquier situación que tiene más de un resultado posible.
b. Espacio muestral, Ω: conjunto de todos los resultados posibles de un experimento.
c. Evento o Suceso: elemento o colección de resultados del espacio muestral.
En términos matemáticos entonces, podemos definir la probabilidad como una función P, que nos
permite evaluar numéricamente la ocurrencia de algún resultado o evento, asignando un valor
entre 0 y 1. 𝑃: Ω → [0, 1]
𝐴 → 𝑃(𝐴)
Axiomas básicos
a. 0 ≤ P (A) ≤ 1
b. P (Ω)=1; P ()= 0
El primero señala que cualquier evento debe ser evaluado con valores entre 0 y 1, de manera que
en la medida que ese valor esté cercano al cero, indica que el evento es poco probable que
ocurra; en cambio, mientras más cercano al valor 1 indica que es más probable que el evento
ocurra. En el segundo axioma, se indica que la probabilidad de todos los eventos del espacio
muestral suma 1 y que la probabilidad de no realizar el experimento, es decir, no obtener un
resultado, es 0.
Relaciones entre los eventos:
a. Complemento de un evento A, Ac: el conjunto de todos los resultados de Ω que no están
en A.
b. Unión, AB: el conjunto de todos los resultados que pertenecen a A, o pertenecen a B o
pertenecen a ambos.
c. Intersección, AB: el conjunto de todos los resultados que pertenecen tanto a A como a
B.
d. Eventos mutuamente excluyentes: A y B son mutuamente excluyentes si A  B no tiene
elementos
Interpretaciones de la probabilidad:
a. Método clásico de asignación de las probabilidades: es apropiado cuando todos los
resultados experimentales tienen la misma posibilidad de ocurrir. Ejemplos, lanzamiento
de 3 monedas, lanzamiento de un
dado, extracción de una carta de un
mazo de naipes.
b. Método de frecuencia relativa o empírica: para la asignación de probabilidades es el más
conveniente cuando existen datos para estimar la proporción de veces que se presentarán
los resultados si el experimento se
repite muchas veces.
c. Método subjetivo de asignación: es el más indicado cuando se dispone de pocos datos
relevantes. Este método usa toda la información disponible, sea por la propia experiencia
o la intuición. La asignación de una probabilidad subjetiva expresa el grado de confianza
(en una escala de 0 a 1) que se tiene acerca de un resultado experimental. Los
profesionales en general utilizan este método para la asignación de la ocurrencia de un
resultado, por ejemplo, el hombre de negocio utiliza su propia información para asignar
la posibilidad de que ocurra un evento, una venta, mayor producción; los médicos utilizan
su experiencia para evaluar las posibilidades que un paciente se mejore o no.
Leyes de la Probabilidad
a. Ley Aditiva: Sean A y B dos eventos cualesquiera P (A  B) = P (A) + P (B) – P (A  B)
Sin embargo, si los eventos A y B son excluyentes, 𝑃 (𝐴) ∪ (𝐵) = 𝑃 (𝐴) + 𝑃 (B)
Esto se puede extender a más de dos eventos: 𝑃 (𝐴 ∪ 𝐵 ∪ 𝐶) = {𝑃 (𝐴) + 𝑃 (𝐵) + 𝑃
(𝐶)} – {𝑃 (𝐴 ∩ 𝐵) + 𝑃 (𝐵 ∩ 𝐶) + 𝑃 (𝐴 ∩ 𝐶)} + {𝑃 (𝐴 ∩ 𝐵 ∩ 𝐶)}
b. Ley del complemento: Tenemos que 𝑃 Ω = 1; 𝑃 Ω = 𝑃 (𝐴 ∪ 𝐴 𝑐) = 1; 𝑃 (𝐴) + 𝑃
(𝐴𝑐) =1
Entonces, 𝑃 (𝐴𝑐) = 1 – 𝑃 (𝐴). Experimento: Lanzamiento de dos dados Sea A: “la
suma de los dados es siete” 𝑃 (𝐴) = 6/36 = 0,1667; 𝑃 (𝐴𝑐) = 1 − 0,1667 = 0,8333 Es
decir, se tiene una posibilidad de un 83,33% que la suma de los dados no resulte ser 7.
c. Ley multiplicativa: P (A  B) = P (B)  P (A/B) = P (A)  P (B/A) Esto permite definir la
probabilidad condicional de A dado que B ocurrió. 𝑃 (𝐴/𝐵) = 𝑃 (𝐴 ∩ 𝐵) / 𝑃 (𝐴).
Experimento: Extraer una carta de un naipe inglés, mantenerla sin revisar el resultado y
luego extraer una segunda carta. Sean A1: “la primera carta es un As” A2: “la segunda
carta también es un As”. 𝑃 (𝐴1) = 4/52; 𝑃 (𝐴2/𝐴1) = 3/51; 𝑃 (𝐴1 ∩ 𝐴2) = 𝑃 (𝐴1) ∙
𝑃 (𝐴2/𝐴1) = 4/52 ∙ 3/51 = 0,0045. Se lee: la posibilidad de tener 2 Ases es de un 0,45%,
extrayendo una carta primero sin devolverla al mazo (sin restitución) y luego sacando la
segunda carta. Notar que al extraer la primera carta sin devolverla al mazo, cambia la
condición para la extracción de la segunda carta. Este resultado es similar a extraer las
dos cartas simultáneamente y evaluar la probabilidad de tener 2 Ases. Ver Técnicas de
conteo, uso de las combinaciones Se tienen 4/2 = 6 combinaciones para extraer los 2
ases y 52/2 = 1,326 combinaciones en total para extraer las 2 cartas desde las 52 del
mazo.
Independencia estadística
A y B son sucesos independientes si: P(A/B) = P(A) o P(B/A) = P(B) o bien P (A  B) = P(A)
P(B).
Probabilidad Total
Sean (A1), (A2), ..., (An), sucesos excluyentes entre sí que forman una partición de Ω, tal que,
A1  A2  ... An = Ω y sea B un evento cualquiera, entonces, P (B) = P (B/A1) P (A1) + P
(B/A2) P (A2) + ... + P (B/An) * P (An)
Variables aleatorias
Permiten asignar a los eventos de un espacio muestral, valores numéricos con una probabilidad
de ocurrencia. Se anotan con las letras X, Y, Z, … Matemáticamente, es una función: X:  
Variables Aleatorias Discretas:
Son aquellas cuyos valores resultan de un conteo de elementos, conjunto de los números
naturales. Por ejemplo, número de accidentes de tránsito, número de errores en la digitación; o
bien, sus valores corresponden a número limitado o fijo, que indican un código: -3, -2, -1, 0, 1, 2,
3.
Se define la Función de Probabilidad o de Cuantía, f(x), a aquella que evalúa la probabilidad de
ocurrencia de los valores x, es decir, 𝑓(𝑥) = 𝑃 (𝑋 = 𝑥)
Su representación es a través de una tabla de frecuencias o de probabilidades:
x 0 1 2 3 4 5
f(x) 0,07776 0,2592 0,3456 0,2304 0,0768 0,01024
O bien, una formulación matemática: 𝑐𝑜𝑛 𝑥 = 0,1,2,3,4,5.
Esta función cumple con:
a) 0 ≤ 𝑓 𝑥 ≤ 1; ∀𝑥
b) Σ𝑥𝜖𝑅𝑒𝑐𝑋 𝑓(𝑥) = 1
Se representa gráficamente por su Histograma:
Variables Aleatorias Continuas:
Son aquellas con infinitos resultados dentro de un intervalo cualquiera. Por ejemplo, tiempos de
espera, precio de un producto, ratios financieros, monto de una cuenta del balance, peso de una
persona en un grupo etario, edad de las personas. Se define la Función de Densidad de
Probabilidad, f(x), que asigna a cada valor de x la densidad de masa de las probabilidades que
corresponde a un intervalo infinitesimal centrado en x, es decir, esta función no representa la
probabilidad en el valor x (𝑓(𝑥) ≠ 𝑃 (𝑋 = 𝑥)).
Se representa mediante una formulación matemática:
Esta función cumple con:
a) 𝑓(𝑥) ≥ 0; ∀𝑥
b) ഽ−∞ +∞ 𝑓(𝑥) 𝑑𝑥 = 1
Representación gráfica:
Variables aleatorias discretas:
Se define la Función de Distribución, F(x), como la
probabilidad acumulada hasta el valor x, esto es:
La función de distribución permite calcular en forma directa probabilidades del tipo:

𝑃 (𝑋 ≤ 3) = 𝐹 (3) = 0,91296
𝑃 (𝑋 ≥ 2) = 1 – 𝑃 (𝑋 < 2) = 1 – 𝑃 (𝑋 ≤ 1)
= 1 − 𝐹 (1) = 1 − 0,33696 = 0,66304
𝑃 (2 ≤ 𝑋 ≤ 4) = 𝑃 (𝑋 ≤ 4) − 𝑃 (𝑋 < 2)
= 𝑃 (𝑋 ≤ 4) − 𝑃 (𝑋 ≤ 1)
= 𝐹 (4) − 𝐹 (1)
= 0,98976 − 0,33696 = 0,6528
Medidas descriptivas de las variables discretas:

Estas medidas al igual que en el análisis exploratorio de los datos, permiten describir el
comportamiento de la variable y su distribución. Se pueden desarrollar las medidas de posición,
de centro, de dispersión y de forma.
- Medidas de Posición:
Percentil q: que lo anotamos como Pq es tal que, 𝑃 (𝑋 ≤ 𝑃𝑞) = 𝑞%
- Medidas de Centro:
Moda: que lo anotamos como Mo es el valor de X para el cual f (Mo) es el max{f (x)}
Mediana: que lo anotaremos como Me es el valor de X para el cual F(Me) ≤ 0,5
- Valor esperado o esperanza, µ: indica el valor de la variable que ponderado por las
probabilidades asignadas a cada valor de x, tiene
mayores posibilidades de ocurrir. Propiedades de
E(X), con a, b  :
1. 𝐸 (𝑎) = 𝑎
2. 𝐸 (𝑎 ∙ 𝑋) = 𝑎 ∙ 𝐸 (𝑋)
3. 𝐸 (𝑎 ∙ 𝑋 ± 𝑏) = 𝑎 ∙ 𝐸 (𝑋) ± 𝑏
4. Sea g(x) una función, 𝐸 (g (𝑥)) = Σ𝑥𝜖𝑅𝑒𝑐𝑋 g(𝑥) ∙ 𝑓(𝑥)
- Medidas de Dispersión:
Desviación Media, DM(X): indica la variabilidad que tiene la variable, en términos
absolutos, respecto a la media µ. 𝐷𝑀(𝑋) = Σ𝑥𝜖𝑅𝑒𝑐𝑋 |𝑥 – 𝜇| ∙ 𝑓(𝑥)
Varianza, σ²: indica la variabilidad de la variable respecto a la media µ, en términos
cuadráticos, por lo que no resulta práctica su interpretación
𝜎² = 𝑉 (𝑋) = 𝐸 (𝑋 − 𝐸 (𝑋))² = 𝐸 (𝑋 – 𝜇)² = 𝐸 (𝑋²) − 𝜇²
= Σ𝑥𝜖𝑅𝑒𝑐𝑋 (𝑥 – 𝜇)² ∙ 𝑓(𝑥) = (Σ𝑥𝜖𝑅𝑒𝑐𝑋 𝑥² ∙ 𝑓(𝑥)) − 𝜇²
Desviación Estándar, σ: indica la dispersión de la variable respecto a su media µ. 𝜎 = √
𝑉(𝑋)
Coeficiente de Variación, CV: es una medida de la proporción de la dispersión de la
σ
variable respecto a su media µ. CV= con µ ≠ 0.
¿ μ∨¿ ¿
Propiedades de V(X), con a, b:
1. 𝑉 (𝑎) = 0
2. 𝑉 (𝑎 ∙ 𝑋) = 𝑎² ∙ 𝑉 (𝑋)
3. 𝑉 (𝑎 ∙ 𝑋 ± 𝑏) = 𝑎² ∙ 𝑉 (𝑋)
- Medidas de Forma:
Coeficiente de Asimetría, As: indica la concentración de la variable respecto a la media µ
donde 𝐸 [(𝑋 – 𝜇)³] = Σ𝑥𝜖𝑅𝑒𝑐𝑋 (𝑥 – 𝜇)³ ∙ 𝑓(𝑥)
Si As > 0, indica que los valores de X se encuentran más
concentrados o sus probabilidades son mayores en los valores menores de X. Si As < 0,
indica que los valores de X se encuentran más concentrados o sus probabilidades son
mayores en los valores mayores de X. Si As = 0, las probabilidades son mayores entorno
a la media µ, con una distribución simétrica hacia ambos extremos.
- Curtosis, Kur: indica el nivel de concentración de la variable entorno a la media µ
donde 𝐸 [(𝑋 – 𝜇)⁴] = Σ𝑥𝜖𝑅𝑒𝑐𝑋 (𝑥 – 𝜇) ⁴ ∙ 𝑓(𝑥)
Si Kur > 0, indica que las probabilidades son
mayores en los valores cercanos a la media µ. Si Kur < 0, indica que las probabilidades
no están concentradas alrededor de la media µ. Si Kur = 0, distribución de las
probabilidades simétrica hacia los extremos respecto a la media µ.
Variables aleatorias continuas
Supongamos que el gerente de personal de un supermercado mide el tiempo de trabajo semanal
de los empleados (semana laboral de 40 horas).
Una gráfica que indique la distribución de probabilidades del tiempo
medido en horas sería: Considerando la variable como discreta y su
histograma.
La gráfica de la distribución de probabilidades del tiempo medido
cada 10 minutos sería: Considerando la variable como discreta y su
histograma.
La distribución de probabilidades del tiempo medido en segundos
sería de la forma: Considerando la variable continua y su polígono de
frecuencias.
En algunas situaciones es posible describir matemáticamente la línea que representa el polígono
de frecuencia en los valores que se ha expresado en forma continua, que representa a la
distribución de esta variable aleatoria continua y que recibe el nombre de función de densidad,
f(x), que en ningún caso representa una probabilidad, sino más bien describe la forma de la
distribución de los valores de la variable. La función f(x) se dice que es una función de densidad
de probabilidad si cumple las siguientes condiciones:
1. 𝒇 (𝒙) ≥ 𝟎, ∀𝒙
∞
2. ∫ f ( x ) dx=1
−∞
Función de distribución, F(x), indica la probabilidad acumulada hasta un valor x, que representa
el área bajo la curva que describe la función de densidad.
P(X=a) = 0 en el punto “a” no existe área; sin embargo,

tratándose de una variable continua pero que sólo toma valores
enteros, es posible evaluar P (X=a) = P (a-0,5 ≤ X  a+0,5) como
una aproximación.
Medidas descriptivas de las variables continuas:
Estas medidas al igual que en el análisis exploratorio de los datos, permiten describir el
comportamiento de la variable y su distribución. Se pueden desarrollar las medidas de posición,
de centro, de dispersión y de forma.
- Medidas de Posición:
Percentil q: que lo anotamos como Pq es tal que,
- Medidas de centro:
Moda, que lo anotamos como Mo es el valor de x para el cual f(M o) es el max{f(x)} La
moda se obtiene con la ecuación:
Mediana, que lo anotaremos como Me es el valor de x para el cual F(M e) ≤ 0,5. Se
obtiene con el percentil 50.
- Valor esperado o esperanza, µ: indica el valor de la variable que tiene mayores
posibilidades de ocurrir.
Notar la importancia de aplicar los límites de
integración −∞, ∞ , que permite asignar 0 al área de integración en algunos tramos del
recorrido de la variable, cuando f(x) = 0.
Propiedades de E(X), con a
1. 𝐸 (𝑎) = 𝑎
2. 𝐸 (𝑎 ∙ 𝑋) = 𝑎 ∙ 𝐸 𝑋
3. 𝐸 (𝑎 ∙ 𝑋 ± 𝑏) = 𝑎 ∙ 𝐸 𝑋 ± 𝑏
4. Sea g(x) una función, 𝐸 (g (𝑥)) =

∞
∫ g(x )∙ f (x)d x
−∞
- Medidas de Dispersión
Desviación Media, DM(X): indica la variabilidad que tiene la variable, en términos
absolutos, respecto a la media µ. El desarrollo matemático
que implica el valor absoluto nos hace desestimar la
aplicación de esta medida. Escapa a los objetivos de este curso.
Varianza, σ²: indica la variabilidad de la variable respecto a la media µ, en términos
cuadráticos, por lo que no resulta práctica su
interpretación.
Desviación Estándar, σ: indica la dispersión de la variable respecto a su media µ. 𝜎 = √
𝑉(𝑋).
Coeficiente de Variación, CV: es una medida de la proporción de la dispersión de la
variable respecto a su media µ. con 𝜇 ≠ 0.
Propiedades de V(X), con a, b
1. 𝑉 (𝑎) = 0
2. 𝑉 (𝑎 ∙ 𝑋) = 𝑎² ∙ 𝑉 (𝑋)
3. 𝑉 (𝑎 ∙ 𝑋 ± 𝑏) = 𝑎² ∙ 𝑉 (𝑋)
- Medidas de forma
Coeficiente de Asimetría, As, indica la concentración de la variable respecto a la media µ.
donde Si As >
0, indica una mayor concentración en los valores
menores de X. Si As < 0, indica una mayor concentración en los valores mayores de X. Si
As = 0, distribución simétrica, áreas similares en ambos extremos respecto a la media µ.
Curtosis, Kur: indica el nivel de concentración de la variable entorno a la media µ.
donde Si
Kur > 0, indica que el área es mayor en valores
cercanos a la media µ. Leptocúrtica. Si Kur < 0, indica que el área se encuentra más
dispersa respecto de la media µ. Platicúrtica. Si Kur = 0, distribución simétrica, áreas
similares en ambos extremos respecto a la media µ. Mesocúrtica.

Resumen

Cargado por

Copyright:

Formatos disponibles

Resumen

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen

Cargado por

Copyright:

Formatos disponibles

Relación entre dos variables:

Regresión Lineal Simple:

Esto permite definir el Coeficiente de Determinación, R²

La función de distribución permite calcular en forma directa probabilidades del tipo:

Medidas descriptivas de las variables discretas:

P(X=a) = 0 en el punto “a” no existe área; sin embargo,

4. Sea g(x) una función, 𝐸 (g (𝑥)) =

También podría gustarte

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.