Capítulos 1 2 3 4

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 88

CAPITULO 1

ESTADÍSTICA
DESCRIPTIVA

HUGO GRISALES ROMERO, PhD


Profesor Titular Universidad de Antioquia
“La estadística es la esencia del método
científico: se usa en todas las principales
disciplinas”
DB Owen
Nancy R Mann
Estadística

“Conjunto de métodos y teorías desarrollados para


recolectar, describir, analizar e interpretar información
con el fin de llegar a conclusiones válidas y tomar
decisiones racionales, las cuales están sometidas a
condiciones de incertidumbre debido a que la
información disponible es incompleta”
Bioestadística

Rama de la estadística aplicada, que estudia la


utilización de métodos estadísticos en las ciencias
biológicas y médicas
Aplicaciones de la bioestadística
• Salud pública
• Epidemiología
• Investigación en servicios de salud
• Nutrición
• Salud ambiental
• Seguridad y salud en el trabajo
• Diseño y análisis de pruebas clínicas
• Genética
• Ecología
• Otros
METODOLOGÍA ESTADÍSTICA

Planificación

Recolección de
datos

Procesamiento
de datos

Análisis e
interpretación

Conclusiones
(decisiones)
PREGUNTAS

• ¿Qué importancia tiene la estadística en la Sociedad de la


Información?
• ¿Qué es la estadística y en qué se fundamenta?

• ¿Cómo podría clasificarse la estadística principalmente?


• ¿Es posible entender una sociedad moderna o Sociedad de la
Información, sin la estadística? Explicar

• ¿Cómo podría aplicarse la estadística a la Epidemiología?

• Cite tres ejemplos de aplicaciones específicas de la estadística


en la Epidemiología
CONCEPTOS BÁSICOS

Conjunto de todas la unidades individuales


Población de las cuales se desea tener información

Conjunto de elementos, personas,


Muestra instituciones o cosas que son objeto de
observación

Proceso mediante el cual se obtienen los


Muestreo datos de la muestra
CONCEPTOS BÁSICOS

Es una característica obtenida de toda una


Parámetro población. Generalmente se desconoce. Se
estima

Es una característica obtenida de una


Estadístico muestra. Resume la información en un solo
dato

Unidad de Es el elemento unitario del que se obtienen


datos. A esta se le aplica el instrumento de
análisis medición
VARIABLE

Es una característica observable que varía entre


los diferentes individuos de una población
VARIABLES

En los individuos de la ciudad, de uno a otro es variable:

• Grupo sanguíneo (A, B, AB, O) → Cualitativa nominal

• Nivel educativo (ninguno, primaria, → Cualitativa ordinal


secundaria, técnica, tecnológica, profesional)

• Número de hijos (0, 1, 2, 3, 4…) → Cuantitativa discreta

• Peso (48,5 – 71,4 – 84,0 – 91,2) → Cuantitativa continua


CLASIFICACIÓN DE LAS VARIABLES

Según su Según su nivel de


naturaleza medición

Nominal
Cualitativa
Ordinal
Variables
Intervalo
Cuantitativa
De razón

Discreta
Continua
VARIABLES CUALITATIVAS

Se refieren a características o cualidades que no pueden ser


medidas con números. Podemos distinguir:

Presenta modalidades no
numéricas que no admiten un criterio de orden
Nominales
Estado civil – ocupación – sexo
Dicotómicas
Cantidad de opciones
Politómicas

Presenta modalidades no numéricas, en las que sí


Ordinales existe un orden
Estrato – nivel educativo – Satisfacción
VARIABLES CUANTITATIVAS

Aquellas que pueden tratarse numéricamente. Representa


una característica que se refiere a cantidades

Discretas 1 – 2 – 3 - 4 - 5- - - ∞

Continuas 1,1 – 2,56 – 5,81 - - - ∞

Valores numéricos, con un cero arbitrario, importa el


Intervalo orden y distancias iguales entre un valor y otro
Temperatura, decibeles, escalas
Valores numéricos, con un cero real o absoluto,
De razón importa el orden y distancias iguales entre un valor y
otro
Edad, peso, número de hijos
CAPITULO 2
FORMAS DE
PRESENTACIÓN DE
LA INFORMACIÓN
Representación ordenada de la distribución
Tablas de las variables relacionadas con un
fenómeno

Representación visual de la información.


Gráficos Permiten percibir fácilmente las variaciones
más sobresalientes de un fenómeno
Toda tabla debe tener:

Corto, claro y preciso


Título
Indica: Qué, Cuándo y Dónde

Cuerpo Matriz de datos en columnas y filas

Fuente de información
Fuente
Notas explicativas
Ejemplo de títulos

Porcentaje sobre la prevalencia del sobrepeso y la obesidad


entre las mujeres adultas de 20 a 60 años que residen en la
zona urbana de la ciudad de Medellín durante el año 2013.

Prevalencia de sobrepeso y obesidad en mujeres de 20 a


60 años. Zona Urbana de Medellín, 2013.

33 palabras
Ahora: 17 palabras
¿CÓMO PRESENTAR TABLAS
PARA UNA Y DOS VARIABLES
CUALITATIVAS?
TABLA PARA UNA VARIABLE CUALITATIVA

Tabla 1. Distribución porcentual de la respuesta a la pregunta: ¿Sufrió lesión


genital? en un estudio sobre las características de los delitos
sexuales. Medellín, 1995-2000

¿Sufrió lesión n %
genital?
Si 509 15,7
No 2730 84,3
Total 3239 100
TABLA PARA UNA VARIABLE CUALITATIVA

Tabla 2. Distribución porcentual de la valoración de los adolescentes


de sus relaciones con la familia, Medellín, 2006

Porcentaje
Frecuencia Porcentaje acumulado
Excelentes 178 24,5 24,5

Buenas 383 52,6 77,1


Regulares 142 19,5 96,6
Malas 25 3,4 100,0

Total 728 100,0


TABLA PARA DOS VARIABLES CUALITATIVAS

Tabla 3. Percepción de mala salud según creencia de inseguridad en el


trabajo en la población trabajadora afiliada a la ARL Y, 2015

Percepción de Percepción de mala salud


Total
inseguridad en Si No
el trabajo n % n % n %
Si 650 65,0 1.395 69,8 2.045 68,2

No 350 35,0 605 30,3 955 31,8

Total 1.000 100,0 2.000 100,0 3.000 100,0


TABLA PARA UNA VARIABLE CUANTITATIVA
DATOS SIN AGRUPAR
• ¿Cuántos individuos tienen menos Número de hijos
de dos hijos?
Porcent. Porcent.
Frecuencia de individuos sin hijos Frec. (válido) acum.
+ 0 419 27,8 27,8
Frecuencia de individuos con un hijo
419 + 255 1 255 16,9 44,7
2 375 24,9 69,5 ≥50%
= 674 = 44,7% 3 215 14,2 83,8
4 127 8,4 92,2
• ¿Qué porcentaje de individuos tiene
seis hijos o menos? 5 54 3,6 95,8
6 24 1,6 97,3
97,3%
7 23 1,5 98,9
• ¿Qué cantidad de hijos es tal que al Ocho+ 17 1,1 100,0
menos el 50% de la población tiene Total 1509 100,0
una cantidad inferior o igual?
2 hijos
TABLA PARA UNA VARIABLE CUANTITATIVA

Construcción de una tabla a partir de una variable


cuantitativa

Consideraciones

• ¿Cuántos intervalos se • ¿Cuáles son los límites de los


elegirán? intervalos?

• ¿Cuál es rango de los datos? • ¿Cuál es la marca de clase?

• ¿Cuál es la amplitud de cada • ¿Cómo se hace el conteo de


intervalo? los datos?
TABLA PARA UNA VARIABLE CUANTITATIVA

Tabla 5. Distribución de la edad de los trabajadores de una empresa


dedicada al cultivo de flores. Cali, 2015

Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalo Marca de absoluta relativa
absoluta relativa
(años) clase acumulada acumulada
fi Fi hi (%) Hi (%)
17-20 18,5 45 45 20,1 20,1
21-24 22,5 54 99 24,1 44,2
25-28 26,5 32 131 14,3 58,5
29-32 30,5 28 159 12,5 71,0
33-36 34,5 25 184 11,2 82,2
37-40 38,5 20 204 8,9 91,1
41-44 42,5 15 219 6,7 97,8
45-48 46,5 5 224 2,2 100,0
Total 224 100,0
FORMAS DE PRESENTACIÓN DE
LA INFORMACIÓN - GRÁFICOS
¿CÓMO PRESENTAR GRÁFICOS O
FIGURAS PARA UNA Y DOS
VARIABLES CUALITATIVAS?
UNA VARIABLE
CUALITATIVA
GRÁFICO DE BARRAS SIMPLES

Gráfico 1. Distribución porcentual del régimen al cual se


encuentra afiliado el paciente diabético, Medellín,
1997-2007
43,6
50,0

40,0
26,0
30,0
16,7
13,8
20,0

10,0

0,0
Contributivo Subsidiado Vinculado Sin dato
Régimen de seguridad social
GRÁFICO DE BARRAS SIMPLES
Gráfico 2. Distribución porcentual de la calidad de vida en general de las
enfermeras de un hospital de gran complejidad. Medellín, 2015

100

80
Porcentaje

62,3
60

40
28,6
20
9,1

0
Muy mala Lo normal Muy buena

Calidad de vida general


GRÁFICO DE BARRAS SIMPLES
Gráfico 3. Distribución porcentual del sitio de ocurrencia del accidente,
seis seccionales, ARP- ISS, 1998-1999. Colombia.

Areas de producción 6,0

Estructuras 6,0

Oficinas 6,0

Almacenes 7,0
Área

Vías 9,8

Otros 17,0

Instalaciones 19,6

Taller 28,6

0 10 20 30 40
Porcentaje
GRÁFICO DE SECTORES
Gráfico 3. Porcentaje de trabajadores con alguna discapacidad. Empresa de
Cundinamarca, 2010

8,3

Con alguna discapacidad

Sin discapacidad

91,7
GRÁFICO DE SECTORES
Gráfico 3. Porcentaje mundial de muertes por lesiones, 1999

5.0% Guerra
5.0% Homicidio y violencia
11.0%
4.0% Lesiones auto-infligidas
14.0%
Otras lesiones no intencionales
23.0%
Minas antipersonales
17.0%
0.3% Tránsito
18.0% Envenenamiento
Caídas
Incendios

Fuente: OMS
DOS VARIABLES
CUALITATIVAS
BARRAS COMPUESTAS O CRUZADAS
Gráfico 4. Tasas de alfabetismo de adultos, por sexo. Regiones del mundo.
2000

100 90
85 88
83
80 74 72
69 68
Tasa

60 51 48
40

20

0
Mundo África América Latina Asia Estados árabes
y el Caribe
Hombres Mujeres
BARRAS COMPUESTAS O CRUZADAS
Gráfico 5.Distribución de los APVP por grupo de causas y nivel socioeconómico.
Medellín, 1994-1996

% 70

60

50

40

30

20

10

0
Bajo Medio Alto

Nivel Socioeconómico

Enf. transm. Enf. no transm. Lesiones Mal definidas


BARRAS COMPUESTAS O CRUZADAS
BARRAS APILADAS
Gráfico 7. Nivel de riesgo al que se encuentran expuestos los trabajadores
según sexo. ARL, 2015

60

50
Proporción

40 27,3
23,4 21,8
30 20,7

20
6,8 23,1 26,8
10 21,7 20,6
7,8
0
I II III IV V

Mujeres Hombres
BARRAS APILADAS
Gráfico 8. El envejecimiento por sexo. Población mundial, por
sexo y grupos etarios específicos, 2025
P
o
r
c
e
n
t
a
j
e

Fuente: ONU, World Population Prospects:The 2002 Revision (escenario medio), 2003.
UNA VARIABLE
CUANTITATIVA
HISTOGRAMA
Gráfico 9. Distribución de las edad de los odontólogos en un estudio del
perfil laboral, Medellín, 1999

300

250

200

150
Frecuencia

100

50

0
20,0 28,0 36,0 44,0 52,0 60,0 68,0 76,0 84,0 92,0

Edad en años cumplidos


HISTOGRAMA
Gráfico 10. Distribución de la edad de la persona agredida,
en un estudio sobre la caracterización de los delitos sexuales,
Medellín 1995-2000

1000

800
Frecuencia

600

400

200

0
0 10 20 30 40 50 60 70 80 90

Edad
Gráfico 11. Distribución por edad de las personas que murieron por las cinco
primeras causas de muerte. Medellín, 1987-1996
12000 3000 1200

10000 1000

8000 2000 800


Frecuencia

Frecuencia
Frecuencia
6000 600

4000 1000 400

2000 200

0 0 0

-5.0 15.0 35.0 55.0 75.0 95.0


0.0 20.0 40.0 60.0 80.0 100.0 -5.0 5.0 15.0 25.0 35.0 45.0 55.0 65.0 75.0 85.0
10.0 30.0 50.0 70.0 90.0 0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0
5.0 25.0 45.0 65.0 85.0

Edad Edad
Edad
a)Ataque con arma de fuego y explosivos b) Infarto agudo del miocardio c)Ataque con instrumentos cortantes y punzantes

1000
600

800
500
Frecuencia

600 400

Frecuencia
300
400

200
200
100

0
0
0 .0 2 0 .0 4 0 .0 6 0 .0 8 0 .0 1 0 0 .0
-5 .0 1 5 .0 3 5 .0 5 5 .0 7 5 .0 9 5 .0
1 0 .0 3 0 .0 5 0 .0 7 0 .0 9 0 .0
5 .0 2 5 .0 4 5 .0 6 5 .0 8 5 .0

Edad Edad

d)Obstrucción crónica de vías respiratorias e)Accidente de tráfico de vehículo automotor


16
FUENTE: TOMADO DE ESTRUCTURA DE LA MORTALIDAD SEGÚN CINCO PRIMERAS CAUSAS Y SU MODELACIÓN TEMPORAL MEDELLÍN, 1987-1996
LÍNEAS

Gráfico 12. Tasa de mortalidad en menores de cinco años. Medellín,


2009 - 2013
LÍNEAS
Gráfico 13. Tasa global de fecundidad en el mundo y en países
desarrollados y en desarrollo. Estimaciones y variante media: 1950
2050
LÍNEAS

Gráfico 14. Mortalidad por ataque con arma de fuego y explosivos,


Medellín, 1987-2000
DOS VARIABLES
CUANTITATIVAS
NUBE DE PUNTOS

Gráfico 15. Salario final en función del salario inicial, Empresa X año Y
NUBE DE PUNTOS

Gráfico 16. Tasa de natalidad en función del porcentaje de mujeres


alfabetizadas en 109 países del mundo
NUBE DE PUNTOS

Gráfico 17. Peso y talla inicial de los niños y niñas que participaron en
el Programa Familias Saludables. Clínica Y, 2014
DIAGRAMA DE CAJA –BIGOTES-.
CAJAS DE BIGOTES

Gráfico 18. Tiempo de lactancia materna total en meses según grupo


de intervención. Programa Familias Saludables. Clínica Y
CAJAS DE BIGOTES

Gráfico 19. Cuartiles del puntaje del ICVAJ según sexo del adolescente
joven.
CAPITULO 3
MEDIDAS DE
RESUMEN
MEDIDAS DE RESUMEN

Tendencia central • Media


Expresan el valor al que
tienden los datos
• Percentiles:
Cuartiles
Quintiles
Posición Deciles
Expresan un lugar en la Moda
Medida de distribución de la variable

resumen • Rango
• Rango intercuartílico
Dispersión • Varianza
• Desviación típica
Expresan el grado de
alejamiento • Coeficiente de variación

• Curtosis
Forma • Simetría
MEDIDAS DE TENDENCIA
CENTRAL
MEDIDAS DE TENDENCIA CENTRAL

Media

Aritmética Geométrica Armónica


PROPIEDADES DE LA MEDIA

• Es única

• Puede no coincidir con un dato

• Depende del número y tamaño de los datos


• No es recomendable cuando la variable es
heterogénea
• Puede ser distorsionada por valores extremos
grandes o pequeños
VENTAJAS

• Facilidad de comprensión y cálculo

• Necesitan todos los valores de la variable, lo que la


hace más confiable

DESVENTAJAS

• Su validez puede ser afectada por valores extremos,


no siendo recomendable cuando la variable los
presenta
MEDIA ARITMÉTICA

Es la medida de tendencia central más utilizada

También se le conoce como promedio

Se suman todos los datos de la muestra y el resultado se divide


entre el número total de datos
EJEMPLO

La antigüedad (en años) de ocho trabajadores en una


empresa es la siguiente:

5 4 2 6 1 3 5 4

El promedio entonces sería:



3,75 3,8 ñ

En promedio, los trabajadores


tienen una antigüedad de 3,8 años
EJERCICIO

El número de horas laboradas por los trabajadores es

5 3 6 10 12 7 6 8

Calcular el promedio
MEDIDAS DE POSICIÓN
PERCENTILES (Pi )

Dividen la distribución de los datos en 100 partes iguales

1% 2% 3% 98% 99%

1 2 1 3 1
Cálculo: 100 100 100

99 1
100

DECILES (Di )

Dividen la distribución de los datos en 10 partes iguales

$% & 'ú)*%+) ,& 10


"
!
$% & 'ú)*%+) ,& 10
" "#
Cálculo: 2
$% 9 & 'ú)*%+) ,& 10
"
!
" "# $% 9 & 'ú)*%+) ,& 10
2
CUARTILES (Qi )

Dividen la distribución de los datos en 4 partes iguales

$% 1
# & 'ú)*%+) ,& 4
.
- # $% 1 no
/ 0/12 3á5 6/167 2 7 .
& 'ú)*%+) ,& 4
Cálculo:
$% 3 1
# & 'ú)*%+) ,& 4
.
- $% 3 1 no
#
/ 0/12 3á5 6/167 2 7 . & 'ú)*%+) ,& 4
MEDIANA

Es el valor que ocupa la posición central de un conjunto


de observaciones ordenadas. El 50% de las
observaciones son menores que este valor

Cálculo: :/
#
$% & + ;
2
:/ # $% & %'+ ;
PROPIEDADES DE LA MEDIANA

• Es única o existen varias

• No la deforman los valores extremos

• Depende del orden y la posición de los datos


• Es un valor que divide la curva en dos partes de
igual área, puede no coincidir con un dato
• Es recomendable cuando la variable es
heterogénea
RELACIONES

Cuartil 1 = Percentil 25

Cuartil 2 = Mediana = Percentil 50

Cuartil 3 = Percentil 75

Cuartil 4 = Percentil 100


LA MODA

Es el dato que tiene la frecuencia mayor. Es la medida


más descriptiva de los datos

Cálculo: :2 ! * <=& 'á & ;&+%*&

Si existe, debe coincidir con un dato


Depende de la frecuencia de ocurrencia de los datos
VENTAJAS

• Se puede calcular a todo tipo de variable

• No se ve influenciada por los valores extremos

• Puede ser bimodal, trimodal o polimodal.

DESVENTAJAS

• Es inestable de muestra a muestra


• Puede no existir, si los valores de la variable tienen
igual frecuencia
MEDIDAS DE DISPERSIÓN
Ejemplo de dos conjuntos de datos con igual media

Datos con baja dispersión Datos con alta dispersión


MEDIDAS DE DISPERSIÓN

> Rango

>? Rango intercuartílico

@A Varianza

@ Desviación típica (estándar)

BC Coeficiente de variación
RANGO (R )

Representa la diferencia entre el valor máximo y el


mínimo de los datos.

Cálculo: D E3áF − E3í

Ventajas
• Es una medida de dispersión absoluta

Desventajas
• Solo toma en cuenta los valores extremos de los datos
• Es sensible al tamaño de la muestra
RANGO INTERCUARTÍLICO (Rq )

Indica la dispersión o variabilidad en el 50% de los


datos centrales, ignorando valores extremos

Cálculo: DI - −-

Rq = distancia existente en el 50%


central de la distribución

Ventajas
• Sirve para conocer la variabilidad de una variable
• Sirve para detectar valores atípicos y extremos
VARIANZA (S 2 )
Es el valor absoluto positivo que acumula la variación
promedio de los valores de la variable con respecto a
la media en forma cuadrática
∑ −
Cálculo: $
−1
Ventajas
• Es de gran utilidad en los procedimientos de
inferencia estadística
• Es una de las medidas estadísticas más importantes,
con ella se calcula la desviación estándar
Desventajas
• No tiene una interpretación clara
DESVIACIÓN ESTÁNDAR (S )
Describe la variabilidad de los datos alrededor de la
media aritmética, elegida como medida de tendencia
central. Se calcula como la raíz cuadrada positiva de la S2
∑ −
Cálculo: $=
−1

Ventajas
• Es la medida de dispersión más conocida y usada
• Recomendable cuando se usa la media
Desventajas
• Es sensible a la variabilidad de los datos
COEFICIENTE DE VARIACIÓN (CV )

Es una medida relativa de la variación de un conjunto de


datos
$
Cálculo: JE % = L 100

Características
• Es adecuado cuando se desea comparar la
variabilidad en dos o más grupos
MEDIDAS DE FORMA
Cuando la variable es cuantitativa, muchas veces nos interesa
saber si su forma se asemeja o no a una distribución normal.

Para esto, podemos calcular dos medidas que nos resumen la


forma de la distribución:

Asimetría MN : indica si los valores se distribuyen


simétricamente o no alrededor de la media aritmética. Indica la
deformación horizontal de la distribución.
Curtosis P : indica cuán pronunciada es la elevación de los
valores centrales, o sea, la deformación vertical en comparación a
una distribución normal con igual media y varianza
Existen varios estadísticos para describir la simetría y la curtosis.

Asimetría:
n (Xi - X)3
k3 , donde k3 =
g=
1 3 (n-1)(n-2)
S

Si g1 = 0, entonces la distribución es simétrica

Si g1 < 0, la distribución es asimétrica negativa

Si g1 > 0, la distribución es asimétrica positiva


k4
Curtosis: g=2 4
S

Si g2 = 0, la distribución es mesocúrtica

Si g2 < 0, la distribución es platicúrtica

Si g1 > 0, la distribución es leptocúrtica


CURVA NORMAL
LA CURVA NORMAL
, :/ , :2

$, JE%
PROPIEDADES DE LA CURVA NORMAL

• Es en forma de campana

• Simétrica alrededor de la media

• Asintótica con el eje horizontal

• Aproximadamente, el 68% del área se encuentra entre ± 1


desviación típica a cada lado de la media

• Aproximadamente, el 95% del área se encuentra entre ± 2


desviaciones típicas a cada lado de la media

• Aproximadamente, el 99,7% del área se encuentra entre ± 3


desviaciones típicas a cada lado de la media
APLICACIÓN

Tabla 4. Medidas de tendencia central, de posición y dispersión de la edad


de los profesores de la Facultad Nacional de Salud Pública según
tipo de vinculación a la Universidad, segundo semestre, 2008

Tipo de De tendencia central De posición De dispersión


Vinculación Me Md Mo Q1 Q3 DE Min Máx
Planta 49,5 51,0 53,0 45,3 56,0 7,6 34,0 61,0
Ocasional 42,4 43,0 48,0 35,0 48,5 7,9 29,0 57,0
Cátedra 46,1 50,0 50,0 36,8 53,8 11,0 25 71,0
Total 46,4 48 48 39 53 9,6 25 71
Me:Media, Md:Mediana, Mo:Moda, Q1:Cuartil 1, Q3:Cuartil 3, DE:Desviación Estándar, Min:Mínimo,
Máx:Máximo

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy