Entregable 2 de Estadistica
Entregable 2 de Estadistica
Entregable 2 de Estadistica
PLAN DE TRABAJO
DEL ESTUDIANTE
1. INFORMACIÓN GENERAL
2. PREGUNTAS GUIA
Nº PREGUNTAS
1
¿Qué es una encuesta y cuál es su estructura?
3
¿Qué es una tabla de distribución de frecuencias y cuál es su estructura?
1
TRABAJO FINAL DEL CURSO
Una encuesta es un método de investigación y recopilación de datos utilizadas para obtener información sobre
diversos temas que se aplican a un grupo de personas. Estas tienen una variedad de propósitos y se pueden
llevar a cabo de muchas maneras dependiendo de la metodología elegida y los objetivos que se deseen
alcanzar.
Estructura
ENCUESTA
Cuerpo de
Presentación la Encuesta Preguntas Fin de
Demográficas Encuesta
En la presentación Aquí es donde
debes mencionar se concentra Al final de la
Agradece a los
breve y la mayor encuesta las
encuestados por
claramente: parte de personas pueden
su tiempo o, si
las preguntas concentrarse en
La entidad o responder las quieres
persona realizante relacionadas co proporcionarles
n los objetivos preguntas
de la encuesta información
de la encuesta. del cuerpo de la
adicional
Objetivos de la encuesta
encuesta
La importancia de
la opinion del
publico
Duracion de
encuesta
A. Para entender cómo organizar la información de una encuesta, es necesario que tengas claro
los objetivos que quieres alcanzar al realizarla. Por ello es necesario saber lo siguiente:
2
TRABAJO FINAL DEL CURSO
Medir la antigüedad: consultar hace cuánto tiempo el cliente usa tus servicios te permite
medir tu crecimiento y la posición que tienes en el mercado.
Medir la satisfacción con el servicio al cliente: muchos clientes aprecian que las
empresas valoren su tiempo y eso puede traducirse en ventas.
Tabulación manual: Un tabulador de encuestas manual permite agregar a las tablas los
datos obtenidos en las encuestas. Para esto, se utilizan herramientas como Excel, que
permite crear tablas y ecuaciones que deberían hacer más fácil el trabajo de registrar los
datos. Sin embargo, esta herramienta no es recomendable por las siguientes razones:
Tabulación automática: Este método es el más eficaz para el análisis de datos, ya que
ofrece resultados más completos en infografías, reportes cualitativos y cuantitativos
personalizados y tablas cruzadas.
Es menos costosa
Los resultados se obtienen más rápido
Los cálculos son más precisos
Conexión de los resultados
3
TRABAJO FINAL DEL CURSO
En la primera columna se ordenan de menor a mayor los diferentes valores que tiene
la variable en el conjunto de datos.
En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y
las frecuencias absolutas acumuladas.
Las columnas cuarta y quinta contienen las frecuencias relativas y las frecuencias relativas
acumuladas.
1. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),
4
representando la frecuencia relativa y la frecuencia relativa acumulada como
tanto por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias
por cien
TRABAJO FINAL DEL CURSO
Obtener el rango R de los datos. Es la diferencia entre el dato mayor y el menor del
conjunto de valores que toma la variable a tabular. Se llama también amplitud total.
R = Xmáx – Xmín
Fijar cuántos intervalos o clases se desea. Se tiende a que el número de clases sea
impar y que esté entre 5 y 15. Hay dos maneras de hacerlo:
A criterio del investigador.
Mediante el método de Sturges, que emplea la siguiente fórmula:
El valor obtenido en esta división no tiene porqué ser un número entero. En ese caso,
se redondearía al valor entero más próximo. Los dos redondeos, el que se haya podido
hacer en el número de intervalos nint y el de la amplitud del intervalo I modificarán el
valor de la amplitud total o rango, apareciendo un nuevo valor ajustado, con los valores
definitivos, repartiendo la diferencia entre R’ y R entre los dos extremos del rango:
1. Formar los diferentes intervalos o clases, partiendo del valor mínimo del
nuevo rango R’. Cada intervalo tendrá unos extremos a y b separados por
TRABAJO FINAL DEL CURSO
Formar los diferentes intervalos o clases, partiendo del valor mínimo del
nuevo rango R’. Cada intervalo tendrá unos extremos a y b separados por la amplitud
de clase o intervalo I. En variables continuas, normalmente los intervalos son cerrados
por la izquierda y abiertos por la derecha, [a, b) en el que b no pertenece a este
intervalo sinó que es el valor mínimo del intervalo siguiente. En variables discretas
ordinales o en variables continuas en los que el procedimiento de medición no pueda
apreciar más allá de un valor entero, los intervalos o clases serán cerrados por los
extremos [a, b].
Cada intervalo está representado por la llamada marca de clase. Es la media entre
sus extremos.
Representará a los valores del intervalo o clase en los cálculos a partir de la tabla.
4. ¿Qué son las medidas de variabilidad?, explicar (varianza, desviación media y estándar, medida de
asimetría).
Esta medida de variabilidad se calcula a través del promedio de los valores absolutos de las
desviaciones respecto a la media. Denotando la desviación media como DM, para datos no
agrupados, la desviación media se calcula mediante la siguiente fórmula:
6
TRABAJO FINAL DEL CURSO
La desviación media permite conocer, en promedio, en cuantas unidades los datos se desvían de
la media aritmética y tiene la ventaja de tener las mismas unidades que los datos con los que se
trabaja.
La varianza no tiene la misma unidad que la de la variable en estudio, por ejemplo, si los datos
vienen en metros, la varianza resulta en metros cuadrados. O en el ejemplo de los goles sería en
goles al cuadrado, que no tiene sentido.
Por ello se define la desviación estándar, también llamada desviación típica, como la raíz cuadrada
de la varianza:
s = √s2
De esta forma se obtiene una medida de variabilidad de los datos en las mismas unidades que
estos, y cuanto menor sea el valor de s, más agrupados están los datos alrededor de la media.
Tanto la varianza como la desviación estándar son las medidas de variabilidad a escoger cuando
la media aritmética es la medida de tendencia central que mejor describe el comportamiento de los
datos.
Y es que la desviación estándar tiene una importante propiedad, conocida como el teorema de
Chebyshev: al menos el 75% de las observaciones se encuentran en el intervalo definido por x̄ ±
2s. En otras palabras, un 75% de los datos está, a lo sumo, a una distancia igual a 2s alrededor de
la media.
Asimismo, al menos un 89% de los valores están a una distancia de 3s de la media, un porcentaje
que puede ampliarse, siempre que se disponga de muchos datos y estos sigan una distribución
normal.
7
TRABAJO FINAL DEL CURSO
La desviación media es una medida de variabilidad mucho más fina que el rango, pero como se
calcula a través del valor absoluto de las diferencias entre cada dato y la media, no ofrece mayor
versatilidad desde el punto de vista algebraico.
Por ello se prefiere la varianza, que corresponde al promedio de la diferencia cuadrática de cada
dato con la media y se calcula mediante la fórmula:
En esta expresión, s2 denota la varianza, y como siempre xi representa a cada uno de los datos, x̄
es la media y n el total de datos.
Cuando se trabaja con una muestra en vez de la población, se prefiere calcular la varianza así:
En todo caso, varianza se caracteriza por ser siempre una cantidad positiva, pero al ser el promedio
de las diferencias cuadráticas, es importante observar que no tiene las mismas unidades que las
de los datos.
Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o
asimetría) que presenta una distribución de probabilidad de una variable aleatoria sin tener que hacer
su representación gráfica. Como eje de simetría consideramos una recta paralela al eje de
ordenadas que pasa por la media de la distribución. Si una distribución es simétrica, existe el mismo
8
TRABAJO FINAL DEL CURSO
número de valores a la derecha que a la izquierda de la media, por tanto, el mismo número de
desviaciones con signo positivo que con signo negativo. Decimos que hay asimetría positiva (o a
la derecha) si la "cola" a la derecha de la media es más larga que la de la izquierda, es decir, si
hay valores más separados de la media a la derecha. Diremos que hay asimetría negativa (o a la
izquierda) si la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si hay
valores más separados de la media a la izquierda.
5.
¿Qué es la distribución normal?, (indicar sus propiedades, estandarización de variables).
9
TRABAJO FINAL DEL CURSO
más bajos que 69 pulgadas. Solo unos pocos serán mucho más altos o mucho más
Aproximadamente, el 68% de los hombres de Pennsylvania tiene una estatura de entre 66.5 (μ - 1σ) y 71.5
(μ + 1σ) pulgadas.
Aproximadamente, el 95% de los hombres de Pennsylvania tiene una estatura de entre 64 (μ - 2σ) y 74 (μ +
2σ) pulgadas.
10
TRABAJO FINAL DEL CURSO
Aproximadamente, el 99.7% de los hombres de Pennsylvania tiene una estatura entre 61.5 (μ - 3σ) y 76.5 (μ
+ 3σ) pulgadas.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales,
sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de
fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen,
el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de
unas pocas causas independientes.
De hecho, la estadística descriptiva solo permite describir un fenómeno, sin explicación alguna. Para la
explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y
sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos cuadrados,
uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
11
TRABAJO FINAL DEL CURSO
Dadas las siguientes variables aleatorias independientes que siguen una distribución normal:
La distribución normal es muy conocida y se emplea en la mayoría de los casos porque gran parte de las
asunciones y teoría estadística se basa en la distribución normal. A destacar, la distribución normal es
simétrica, solo depende de dos parámetros y tiene una única moda (unimodal).
Simétrica respecto a su media. En otras palabras, la media actúa como espejo en la distribución y
hace que ambas colas sean idénticas y, por tanto, simétricas.
1.
2. Media = Moda = Mediana. Las medidas de centralización son iguales porque la distribución es
simétrica.
3.
4. La distribución cambia de curvatura o tiene puntos de inflexión en los puntos del eje horiz
12
TRABAJO FINAL DEL CURSO
HOJA DE PLANIFICACIÓN
PROCESO DE EJECUCIÓN
SEGURIDAD / MEDIO AMBIENTE /
OPERACIONES / PASOS /SUBPASOS NORMAS -ESTANDARES
1 PRIMERO RESPONDER MI INFORMACION INFORMACION PERSONAL
GENERAL.
2 PLANIFICACION DE TRABAJO. CULMINADO
LISTA DE RECURSOS
INSTRUCCIONES: debes ser lo más explícito posible. Los gráficos ayudan a transmitir
mejor las ideas. No olvides los aspectos de calidad, medio ambiente y SHI.
13