Estadistica 1

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 33

ESTADISTICA 1

Unidad 1 (Programa) UNIDAD I: Estadística descriptiva y análisis de datos. Definiciones:


población, muestra, variable estadística, unidad de análisis. Tipos de variables. Escalas de
medición. Codificación de datos. Representación de datos. Distribuciones unidimensionales de
frecuencias: variables cualitativas y cuantitativas. Tratamiento de datos agrupados. Series de
tiempos. Indices.
Rama de la matemática se encarga de recopilar datos y organizar datos

Población y muestra: Una población es el conjunto completo de todos los objetos que
interesan a un investigador. El tamaño de la población, N, puede ser muy grande o incluso
infinito. Una muestra es un subconjunto observado de valores poblacionales que tiene un
tamaño muestral que viene dado por n.

Ejemplos de poblaciones son:

 Todos los votantes inscritos en un país.


 Todos los estudiantes de una universidad.
 Todas las familias que viven en una ciudad.
 Todas las acciones que cotizan en una bolsa de valores.
 Todas las reclamaciones que recibe en un año dado una compañía de seguros médicos.
 Todas las cuentas pendientes de cobro de una empresa.

Muestreo aleatorio es un método que se emplea para seleccionar una muestra de n objetos
de una población en el que cada miembro de la población se elige estrictamente al azar, cada
miembro de la población se elige con la misma probabilidad y todas las muestras posibles de
un tamaño dado, n, tienen la misma probabilidad de ser seleccionadas.

Este método es tan frecuente que generalmente se suprime el adjetivo simple y la muestra
resultante se denomina muestra aleatoria. El muestreo se utiliza mucho en todas las áreas de
los negocios, así como en otras disciplinas. Para averiguar si un proceso de producción está
funcionando correctamente, se selecciona una muestra de bienes producidos. Las auditorías
de las cuentas pendientes de cobro generalmente se basan en una muestra.

Parámetro y estadístico Un parámetro es una característica específica de una población. Un


estadístico es una característica específica de una muestra.

La estadística descriptiva está formada por los métodos gráficos y numéricos que se utilizan
para resumir y procesar los datos y transformarlos en información. La estadística inferencial
constituye la base para hacer predicciones, previsiones y estimaciones que se utilizan para
transformar la información en conocimiento.

La estadística inferencial es un proceso, no un mero resultado numérico. Este proceso puede


consistir en una estimación, un contraste de hipótesis, un análisis de relaciones o una
predicción

Las variables estadísticas son las características observables de un objeto, problema o evento
que se puede describir según un esquema de medición bien definido.

Verdadero

Variables cualitativas Son las variables que expresan distintas cualidades, características o
modalidades. Cada modalidad que se presenta se denomina atributo o categoría y la medición
consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales
y nominales. Además pueden distinguirse en dicotómicas, cuando sólo pueden tomar dos
valores posibles (como sí y no, hombre y mujer), o politómicas cuando pueden adquirir tres o
más valores. (frío templado y caliente, por ejemplo)

Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una
escala establecida, aunque no es necesario que el intervalo entre ediciones sea uniforme.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio
de orden.

Variables cuantitativas Son las variables que se expresan mediante cantidades numéricas. Las
variables cuantitativas además pueden ser:

 Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala


de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia
de valores entre los distintos valores específicos que la variable pueda asumir.
 Variable continua: Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores.

Escalas de medición: Las escalas de medición son sistemas de clasificación que se utilizan para
asignar números o etiquetas a las características o atributos de los elementos en un conjunto
de datos. Las escalas de medición pueden variar en su nivel de precisión y capacidad para
realizar cálculos estadísticos. Las principales escalas de medición son:

Escala nominal: Es la escala más básica donde los datos se clasifican en categorías sin ningún
orden específico. Ejemplos: género, estado civil, color favorito, etc.

Escala ordinal: Los datos se clasifican en categorías que tienen un orden natural, pero la
distancia entre las categorías no es constante ni medible. Ejemplos: nivel de satisfacción (bajo,
medio, alto), clasificaciones (primero, segundo, tercero), etc.

Escala de intervalo: Además de tener un orden, las diferencias entre las categorías son
consistentes y medibles, pero no hay un punto cero absoluto. Ejemplo: temperatura Celsius,
puntajes en pruebas estandarizadas como el TOEFL o el SAT.

Escala de razón: Similar a la escala de intervalo, pero con un punto cero absoluto, lo que
permite realizar operaciones matemáticas como suma, resta, multiplicación y división.
Ejemplo: altura, peso, ingresos, tiempo, etc.

Codificación de datos: La codificación de datos es el proceso de asignar valores numéricos o


códigos a las categorías o respuestas de una variable. Esta técnica se utiliza para transformar
datos cualitativos en datos cuantitativos, lo que facilita su análisis estadístico. Por ejemplo, en
una encuesta donde se pregunta por el nivel de satisfacción, se podría asignar el valor 1 para
"insatisfecho", 2 para "medianamente satisfecho" y 3 para "satisfecho".

Representación de datos: La representación de datos implica mostrar la información recopilada


de manera visual, generalmente a través de gráficos, tablas o diagramas. Esta representación
visual facilita la comprensión de los datos y permite identificar patrones, tendencias o
relaciones entre las variables. Algunas formas comunes de representar datos incluyen
histogramas, gráficos de barras, gráficos circulares, diagramas de dispersión, entre otros.
Distribuciones de frecuencias Una distribución de frecuencias de datos numéricos es, al igual
que una distribución de frecuencias de datos categóricos (apartado 2.2), una tabla que resume
datos enumerando las clases en la columna de la izquierda y el número de observaciones de
cada clase en la columna de la derecha. Sin embargo, en una distribución de frecuencias de
datos numéricos las clases o intervalos no son fácilmente identificables.

1. Número de intervalos El número de intervalos (clases) utilizados en una distribución de


frecuencias se decide de una manera algo arbitraria.
2. Después de elegir el número de intervalos, el paso siguiente es elegir la amplitud de los
intervalos: La amplitud de los intervalos a menudo se redondea a un número entero
para facilitar la interpretación.

3. ntervalos inclusivos y que no se solapen Los intervalos deben ser inclusivos y no


solaparse. Cada observación debe pertenecer a uno y sólo un intervalo. Los límites o
extremos de cada clase deben estar claramente definidos. No debemos hacer excesivo
hincapié en las reglas para determinar el número de intervalos y su amplitud o hacer
demasiado poco hincapié en la selección del número de clases que muestren las
pautas de los datos más claras

No podemos clasificar las variables según la escala de medición o la influencia que asignemos a
unas variables sobre otras. Falso

Podemos clasificar las variables según la escala de medición y la influencia que asignemos a
unas variables sobre otras. Por ejemplo, las variables pueden ser clasificadas como cualitativas
o cuantitativas, y dentro de las cuantitativas, podemos distinguir entre variables discretas y
continuas. Además, en análisis estadístico, a menudo se considera la influencia o relación entre
variables, lo que puede clasificarse como variables independientes y variables dependientes,
entre otros tipos de clasificaciones.

FALTA . Tratamiento de datos agrupados. Series de tiempos. Indices.

UNIDAD II: Medidas de tendencia central y de dispersión. Medidas de tendencia central y de


dispersión absolutas y relativas. Medidas de posición (no centradas): fractiles. Características
de forma. Gráfico de caja y extensiones
Media, mediana, moda
En el Capítulo 1 presentamos los términos parámetro y estadístico. Un parámetro se refiere a
una característica poblacional específica. Un estadístico se refiere a una característica muestral
específica. Las medidas de la tendencia central normalmente se calculan a partir de datos
muestrales más que a partir de datos poblacionales. Una de las medidas de la tendencia
central que nos viene rápidamente a la mente es la media

-----------------------------------------------------------------------------------

MEDIDAS DE POSICION NO CENTRALES O CUANTILES

CUARTILES: DIVIDIR NUESTRA DISTRIBUCION, DIVIDIR EN 4 PARTES IGUALES (Q)


QUINTILES: DIVIDIR 5 PARTES IGUALES(K)

DECILES: DIVIDRI 10 PARTES IGUALES(D)

PERCENTILES: DIVIDIR 100 P IGUALES(P)


Tercer cuartil q3 = 45,75 (K.(N+1))/4

VALOR

Leer interpretación…

Series de Tiempo
Son colecciones de observaciones sobre un determinado fenómeno efectuadas en sucesivos
momentos del tiempo, usualmente equiespaciados. Corresponde a una realización de un
proceso generador de datos.

ANÁLISIS BIVARIABLE: Se utiliza cuando se desea comparar dos muestras aleatorias


independientes, una de cada población

FACTORES QUE LA AFECTAN

Tendencia secular: son movimientos suaves a través del tiempo que tienden a aumentar o
disminuir la variable en períodos largos de tiempo.

Fluctuación cíclica: con frecuencia las series de tiempo presentan secuencias alternas de
puntos abajo y arriba de la línea de tendencia que duran más de un año. El ejemplo más
común de fluctuación cíclica es el ciclo económico. A través del tiempo, hay años en los que el
ciclo económico llega a un pico arriba de la línea de tendencia; en otros, es probable que la
actividad de los negocios disminuya abajo de la línea de tendencia

Variación estacional: esta variación corresponde a los movimientos de la serie que recurren
año tras año en los mismos meses (o en los mismos trimestres) del año poco más o menos con
la misma intensidad. Este tipo de variación implica patrones de cambio en el lapso de un año
que tienden a repetirse anualmente

Variación aleatoria (o irregular): En muchas situaciones, el valor de una variable puede ser
completamente impredecible cambiando de manera aleatoria. Por lo general obedecen a
factores de corto plazo, imprevisibles y no recurrentes que afectan a la serie de tiempo.

Para el caso en el que la tendencia de una serie de tiempo siga una línea recta, para ello
repasaremos la metodología para determinar una recta en el plano.

 Donde: ŷ = valor estimado dela variable dependiente


 x= variable independiente (en el análisis de tendencia es tiempo)
 a= ordenada y (valor de y cuando x=0)
 b= pendiente de la recta de tendencia (inclinación)

siendo: ∑ 𝑥𝑦 − 𝑛𝑥̅𝑦̅

𝑏 = ∑ 𝑥2 − 𝑛 𝑥̅2

𝑎 = 𝑦̅ − 𝑏𝑥̅

 Y=valores de la variable dependiente

𝑦̅= media de los valores de la variable dependiente


 X= valores de la variable independiente

𝑥̅= media de los valores de la variable independiente




 n= número de datos en la serie de tiempo

. MÉTODO DE LASPEYRES
ÍNDICE DE PRECIOS (IPL) Establece una comparación entre los ingresos que pudieran haberse
obtenido a precios actuales considerando la producción de un determinado año de referencia
(año base):

ÍNDICE DE CANTIDAD (ICL) Establece una comparación entre los ingresos que pudieran haberse
obtenido en la actualidad si se hubieran mantenido los precios del año de referencia:

INDICE DE VALOR (IVL)

Mide los cambios en el valor monetario total, combina los cambios en precio y cantidad para
presentar un índice con más información:

MÉTODO DE PAASCHE

ÍNDICE DE PRECIOS (IPP)

Establece una comparación entre los ingresos obtenidos en la actualidad y los ingresos que
pudieran haberse obtenido si se hubieran mantenido los precios del año de referencia

ÍNDICE DE CANTIDAD (ICP) Establece una comparación entre los ingresos obtenidos en la
actualidad y los ingresos que pudieran haberse obtenido si se hubiese mantenido la
producción del periodo de referencia:
ÍNDICE DE VALOR (IVP)

Mide los cambios en el valor monetario total, combina los cambios en precio y cantidad para

presentar un índice con más información:

MÉTODO DE FISCHER. Este método combina los dos métodos anteriores, lo que permite
obtener una información más completa

ÍNDICE DE PRECIOS (IPF) Mide los cambios entre los ingresos actuales y los ingresos del año de
referencia teniendo en cuenta la variación en los precios de los dos periodos

considerados:

ÍNDICE DE VALOR (IVF): Mide los cambios en el valor monetario total, combina los cambios en
precio y cantidad para presentar un índice con más información:

INDICE DE CANTIDAD (ICF) Mide los cambios entre los ingresos actuales y los ingresos del año
de referencia teniendo en cuenta la variación en la productividad de los dos periodos

considerados:

Series de tiempo
VENTAJAS Y DESVENTAJAS LASPEYRES :

 V- Para calcularla, no es necesarios saber cantidades consumidas en cada


periodo ,únicamente son necesarias las cantidades del año base.
 D- No tiene en cuenta los posibles cambios de demanda de los diferentes bienes. Por
tanto, es poco representativo cuando los periodos están alejados del año base.

VENTASJAS Y DESVENTAJAS DE PAASHE:

 V- Tiene en cuenta la estructura de consumo de cada periodo.


 D- Hay grandes dificultades para conseguir la información a corto plazo sobre las
cantidades pedidas en cada periodo.
Clase 8
le guts leer no le gusta total
hombre 10 20 30
mujer 90 30 120
total 100 50 150
le gusta
leer no le gusta
0.8 0.6 0.2
Teoremas de bayes
Variable Aleatoria: “Una variable aleatoria es una función matemática que asigna un valor
numérico, al resultado de un experimento aleatorio.”

Entonces, supongamos que se lanza la moneda dos veces. Los resultados posibles son

(C,C)(C,+)(+,C)(+,+). Si definimos la variable aleatoria “X: número de caras”, los valores de X

serán diferentes en cada caso. Veamos

Estadística | Unidad 2 | Página 3 de 14

(C,C) En esta caso, dado que hay dos caras, X=2

(C,+) y (+,C) en ambos casos X=1

(+,+) y en este último, X=0

Entonces…¿Es lo mismo el espacio muestral que los valores posibles que puede tomar la

variable aleatoria?
La respuesta es NO.

El espacio muestral del experimento es S={(C,C)(C,+)(+,C)(+,+)} mientras que los valores

posibles de X son el 0,1 y 2, siempre son número reales, y se denotan como x1=0, x2=1, x3=2.

Por lo general al conjunto de los valores de X, se le suele llamar Rx. Esto es Rx= {0,1,2}

VARIABLES ALEATORIAS DISCRETAS

Si el conjunto de resultados posibles de la variable aleatoria es finito o infinito numerable,

decimos que X es una variable aleatoria discreta

Ejemplo: la variable “número que sale al lanzar un dado con seis caras” es una variable
aleatoria

discreta (toma los valores del 1 al 6).

Y en caso de querer calcular la probabilidad para X, es importante que siempre se debe cumplir

con que:

1) 0 ≤ P(xi) ≤ 1 para cada valor posible de X

2) Σ P(xi) =1, donde la sumatoria se extiende sobre todos los valores contenidos en su dominio.

VARIABLES ALEATORIAS CONTINUAS

Una variable aleatoria es continua cuando el conjunto de sus valores posibles son todos los
valores de un intervalo o de una unión de intervalos de números reales

Por ejemplo, el conjunto de los pesos de un grupo de personas, o las distancias de Mendoza a
distintos puntos del país. Son valores que por lo general se miden con decimales.

se trabajaba agrupando los datos en intervalos y en base a ellos se realizaba la tabla de


frecuencia
La distribución de una variable aleatoria continua se describe mediante la función de densidad
de probabilidad, o simplemente función de densidad fX, y calcula la probabilidad de obtener un
valor dentro de un intervalo determinado

PROPIEDADES DE LA ESPERANZA Y LA VARIANZA


FUNCIÓN DE DISTRIBUCIÓN ACUMULADA

La función de distribución acumulada de una variable aleatoria X, cualquiera, es: Fx (x)= P(X≤x)

Ejemplo de los alumnos (Ver mas arriba)

Una variable aleatoria es una función que asigna un número real a cada
resultado en el espacio muestral de un experimento estadístico.
Verdadero
Por convención, las variables aleatorias se denotan con una letra mayúscula de nuestro
alfabeto, por ejemplo X, y los particulares valores de la misma con su correspondiente letra
minúscula, en este ejemplo x FALSA

Sólo es posible definir una variable aleatoria para cada espacio muestral. FALSA
El número de valores que puede tomar una variable aleatoria discreta es
contable (ya sea finito o infinito numerable). Verdadero
Una variable aleatoria discreta sólo puede tomar valores enteros.
Verdadero
Una variable aleatoria discreta sólo puede asumir valores positivos. Falso

Las variables aleatorias continuas representan datos que se obtienen continuamente, mientras
que las variables aleatorias discretas representan datos que se obtienen de vez en cuando. F

En la mayoría de las aplicaciones prácticas, las variables aleatorias continuas representan datos
medidos, mientras que las variables aleatorias discretas representan datos contados. V

Distribución Binomial
Es un experimentos que cumple 4 condiciones:

 El experimento consta de una secuencia de N ensayos idénticos


 En cada ensayo hay dos resultados, a uno de ellos se los llama Éxito y al otro Fracaso
 La probabilidad de éxito es constante de un ensayo a otro , nunca cambia y se denota
p. Por ello la probabilidad de fracaso es 1-p
 Los ensayos son independientes, de modo que el resultado de cualquiera de ello no
influye en el resultado de cualquier otro ensayo.
Distribución de Poisson
Características:
 Los datos son conteos de eventos (enteros no negativos, sin límite superior).
 Todos los eventos son independientes.
 La tasa promedio de ocurrencias es constante y no cambia durante el período de
interés. C
PROCESO DE BERNULLI
Distribucion de variables discretas(var discretas , aquella que podía contar , ejemplo :
valor de las caras del DADO , Clientes que entran al local en el dia)
Dos resultados; Éxito o Fracaso
Cada ensayo es independiente
P(E) =P / P(F) = 1-P = Q
−x
P(X=X) = p x × q1
Teorema de Chebyshev

Preguntas y respuestas Parciales


¿A qué llamamos población?
Texto de la respuesta
Una población es el conjunto completo de todos los objetos que interesan a un
investigador. El tamaño de la población, N, puede ser muy grande o incluso infinito.
Una muestra es un subconjunto observado de valores poblacionales que tiene un
tamaño muestral que viene dado por n
Ejemplos de poblaciones son:
 Todos los votantes inscritos en un país.
 Todos los estudiantes de una universidad.
 Todas las familias que viven en una ciudad
¿De qué forma pueden ordenarse los datos? Explique brevemente c/u
Texto de la respuesta
 Orden ascendente: Los datos se ordenan de menor a mayor valor. Este tipo de
ordenamiento es útil para encontrar el valor mínimo y analizar la distribución
de los datos desde los valores más bajos hasta los más altos.
 Orden descendente: Los datos se ordenan de mayor a menor valor. Este tipo de
ordenamiento es útil para encontrar el valor máximo y analizar la distribución
de los datos desde los valores más altos hasta los más bajos.
 Orden cronológico: Los datos se ordenan según su fecha o tiempo de
ocurrencia, desde la fecha más temprana hasta la más reciente
 Falta incluir la forma de ordenar datos cualitativos.
La media es: a.
La medida de posición que divide al conjunto de datos en dos partes exactamente
iguales.
Es una medida de desviación
Es una medida de tendencia central que rara vez se usa
Ninguna de las anteriores. Correcta
La mediana es: La medida de posición que divide al conjunto de datos en dos partes
exactamente iguales.
La moda es: La medida de posición que divide al conjunto de datos en dos partes
exactamente iguales. Es una medida de desviación Es una medida de tendencia central
que rara vez se usa
Ninguna de las anteriores. Correcta
¿Qué diferencia hay entre la Estadística Descriptiva y la Inferencial?
La estadística descriptiva se basa en describir y resumir los datos de una muestra o
población mediante el uso de la media, la mediana, la moda, la desviación estándar, los
percentiles, etc. Su objetivo es organizar y presentar los datos de manera
comprensible para facilitar la comprensión de su estructura y características y la
estadística inferencial se ocupa de hacer inferencias, sobre una población, basadas en
los datos de una muestra. Utiliza técnicas como la estimación de parámetros y las
pruebas de hipótesis para sacar conclusiones sobre características o relaciones en la
población en función de la información proporcionada por la muestra.
Explique brevemente en qué consiste el índice de Base fija y cuál es la diferencia con el
Índice por eslabones
Base fija: Es el cociente que resulta de dividir el dato del año considerado, por el dato
tomado como base y multiplicarlo por 100
Indicie por Eslabones: Es el cociente que resulta de dividir el dato del año considerado
y el dato del año anterior.
osea que la diferencia conciste en el que el primero solo dividimos el año ejemplo con
el base y en el otro; el año de ejemplo con otro año seleccionado en la tabla (año
anterior).

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy