Paso 3. Estadística Descriptiva

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 17

PASO 3.

ANÁLISIS DE LA INFORMACIÓN

ESTADÍSTICA DESCRIPTIVA

DAGNERY ALEXANDRA LEAL SANTACRUZ

TUTOR:

GUIDO JESÚS VIDAL

GRUPO:

100105_49

PERIODO 16-02

2021

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD

1
INTRODUCCIÓN

En la fase de análisis de un estudio estadístico encontramos el uso de las medidas univariantes


(medidas de tendencia central, medidas de posición, medidas de dispersión y medidas de asimetría).
El cálculo de estas medidas nos da luz sobre la información de comportamiento de una determinada
muestra o población. Para este trabajo se realizarán los cálculos estadísticos para poder comprender
el comportamiento de dos variables escogidas dentro de la base de datos de evolución de COVID 19.
JUSTIFICACIÓN

La comprensión de las medidas univariantes de tendencia central y medidas de posición nos permiten
tomar mejores decisiones al abordar una problemática.
OBJETIVOS

Aplicar las medidas estadísticas univariantes mediante un software estadístico


Actividad 1. Mapa mental
ACTIVIDAD 2. MEDIDAS UNIVARIANTES-VARIABLE DISCRETA

La variable cuantitativa discreta elegida es: población de departamento

a. Tabla de frecuencias datos no agrupados

Población Frecuencia Frecuencia Frecuencia Frecuenciar Frecuencia Frecuencia


por Absoluta Acumulada Relativa elacumulada Porcentual Porcentual
departam Acumulada
ento
82438 6 6 0,0200 0,020 2,00 35,00
581505 8 14 0,0267 0,047 2,67 4,67
914552 21 35 0,0700 0,117 7,00 11,67
978614 6 41 0,0200 0,137 2,00 13,67
1243113 9 50 0,0300 0,167 3,00 16,67
1415934 10 60 0,0333 0,200 3,33 20,00
1427984 8 68 0,0267 0,227 2,67 22,67
1854546 1 69 0,0033 0,230 0,33 23,00
2111086 3 72 0,0100 0,240 1,00 24,00
2891713 13 85 0,0433 0,283 4,33 28,33
4532152 50 135 0,1667 0,450 16,67 45,00
6855517 26 161 0,0867 0,537 8,67 53,67
7743955 136 297 0,4533 0,990 45,33 99,00
8743955 1 298 0,0033 0,993 0,33 99,33
9743955 1 299 0,0033 0,997 0,33 99,67
10743955 1 300 0,0033 1,000 0,33 100,00
Total 300 Total 1,00 100,00
Población de Departamento
160
140
120
100
80
60
40
20
0
8 5 2 4 3 4 4 6 6 3 2 7 5 5 5 5
43 50 55 61 11 93 98 54 08 71 15 51 95 95 95 95
82 581 914 978 243 415 427 854 111 891 532 855 743 743 743 743
1 1 1 1 2 2 4 6 7 8 9 10

Población de Departamento

Población de Departamento
160
140
120
100
80
60
40
20
0
8 5 2 4 3 4 4 6 6 3 2 7 5 5 5 5
43 50 55 61 11 93 98 54 08 71 15 51 95 95 95 95
82 581 914 978 243 415 427 854 111 891 532 855 743 743 743 743
1 1 1 1 2 2 4 6 7 8 9 10

Población de Departamento
b. Medidas de tendencias central y de posición

Media:

∑ xi∗f
Media= i=1
n
1600036033
Media= =5333453.44
300

Mediana:
Se calcula la posición central de la muestra
300
k= =150
2

Al buscar este valor en la muestra se tiene que la mediana para la población por departamento
es de: 6855517

Cuartiles:

Se calcula la posición para cada cuartil, para luego encontrarla en la tabla de frecuencias, en la
columna de frecuencia acumuladas. Si el valor de la posición no se encuentre, se busca el
siguiente valor más próximo.

300∗1
Q 1= =75
4
300∗2
Q 2= =150
4
300∗3
Q 3= =225
4

Q 1=2891713

Q 2=6855517
Q 3=7743955
Percentiles

Para el cálculo de los percentiles se calcula la posición igual que en los cuartiles y se realiza el
mismo procedimiento.

( 25∗300 )
P 25= =75
100
50∗300
P 50= =150
100

D 25=2891713
D 50=6855517

Asimetría

Para encontrar el tipo de asimetría se utiliza la siguiente ecuación

5333453.44−7743955
A= =−0.858
2809260.39

Al ser negativa, el tipo de asimetría es a la izquierda.

Curtosis

La curtosis se calcula de la siguiente forma

( ( xi−Media ) ¿¿ 4∗f )
K= 4
−3 ¿
n∗s

3.26 x 10 28
K= −3=−1.255
300∗2809260.394
Se tiene una curtosis platicurtica.

Al analizar la población por departamento de la base de datos de la evolución de 300 pacientes


COVID-19 de diferentes departamentos de Colombia se logró determinar que en los
departamentos donde la población es mayor, hay una mayor cantidad de personas infectadas
por el virus. Se tiene que el departamento donde hay más contagiados es en Bogotá con 136
infectados. Sin embargo, se tiene que hay departamentos con una mayor población lo que nos
indica que el contagio del virus depende de otros factores y no solo de la población del
departamento.

c. Medidas de dispersión

Rango:
R=10743955−824738=10661517

Varianza y desviación estándar:

∑ ( xi−Media )2∗f
s2= i=1
n−1

2 2.36 x 1015 12
s= =7.89 x 10
299

s= √7.89 x 1012=2809260.39

Coeficiente de variación:

2809260.39
Cv= =0.527
5333453.44

El coeficiente de variación es del 84% indicando que los datos están muy dispersos. Se tiene
que la población de los departamentos de Colombia es muy variable.

Actividad 3. Medidas Univariantes-variable Continua


La variable continua elegida es: peso (kg)

a. Tabla de frecuencia datos agrupados

F. F. F.
MARCA DE F.
INTERVALOS ABSOLUT ABS.ACUMULAD REL.ACUMULAD
CLASE RELATIVA
A A A
Xmin Xmax Xi ni hi Ni Hi
60,8 61,5 61,17 2 0,67% 2 0,67%
61,5 62,2 61,88 44 14,67% 46 15,33%
62,2 62,9 62,59 65 21,67% 111 37,00%
62,9 63,7 63,30 37 12,33% 148 49,33%
63,7 64,4 64,01 41 13,67% 189 63,00%
64,4 65,1 64,72 49 16,33% 238 79,33%
65,1 65,8 65,43 31 10,33% 269 89,67%
65,8 66,5 66,14 16 5,33% 285 95,00%
66,5 67,2 66,85 9 3,00% 294 98,00%
67,2 67,9 67,56 6 2,00% 300 100,00%
TOTAL 300 100,00%    

70

60

50

40

30

20

10

0
61.17 61.88 62.59 63.30 64.01 64.72 65.43 66.14 66.85 67.56
70

60

50

40

30

20

10

0
60.00 61.00 62.00 63.00 64.00 65.00 66.00 67.00 68.00

En el diagrama de barras se puede observar que en una marca de clase de 62.59 Kg se encuentra la
moda con un aproximado de 65 personas contagiadas.

b. Medidas de tendencias central y de posición

Media:
n

∑ xi∗f
Media= i=1
n

Media=63.81
Mediana:

300
p= =150
2

Mediana=Li + ( p−fn )∗A


i−1
Donde :

Li=Limite inferior
f i−1=frecuencia absoluta acumulada anterior
A=amplitud
150−148
Mediana=63.7+ ( 300 ) ∗0.71=63.56

Cuartiles:

El cálculo de los cuartiles es mediante la siguiente ecuación:

kn
Qk=Li+ A
4
( −Fi−1
Fi−F i−1 )
75−46
Q 1=62.2+0.71∗ ( 111−46 )=62.55
Q 2=63.7+ 0.71∗ ( ( 150−148 )
189−148 )
=63.799

Q 3=64.4 +0.71∗ ( 225−189


238−189 )
=63.84

Percentiles:
kn
p=
100
kn
Pk=Li + A (
100
−F i−1
Fi−F i−1 )
Como la ecuación de los percentiles es similar a de los cuartiles, se tiene que el percentil
25% es equivalente al cuartil 1 y el percentil 50 equivale al cuartil 2.

P 25=Q 1=62.55
P 50=Q 2=63.799

Curtosis

( ( x−Media ) ¿¿ 4∗f )
K= −3 ¿
n∗s 4

3537.049
K= −3=−0.609
300∗1.494
Asimetría

As=0.023

Para la variable peso de los contagiados en marzo se tiene que el promedio de los
contagiados es de 36.81Kg. También podemos conocer que el 25% de los contagiados
esta entre 61 y 62.54 kg. El 50% de los contagiados esta entre los 61 63.8 kg. El 75% está
entre 61 y 63.84Kg. Se tiene una dispersión asimétrica a la derecha y platicurtica.

c. Medidas de dispersión

Rango: Se tiene un rango de 7.1 kg para la muestra de 300 contagiados.


Varianza y desviación estándar:
n

∑ ( xi−Media )2∗f
s2= i=1
n−1

664.04
s2= =2.22
300−1

s=1.49

Coeficiente de variación
1.49
Cv= =0.02
63.81

Se tiene un coeficiente de variación del 2% indicando una muy poca dispersión y una
distribución homogénea, indicando que los 300 contagiados no tiene una gran variación del
peso.
CONCLUSIONES

Analizando los valores obtenidos se tiene que el contagio de los departamentos se ven
medianamente influenciados por su población. Ya que se observa que Bogotá tiene la
mayor cantidad de contagios dentro del país. Sin embargo, se tienen departamentos con
mayor población y presentan una menor cantidad de contagios. Con respecto al peso se
tiene que los contagiados casi no presentan dispersión no se ve una influencia del peso en
los contagios de COVID-19.
REFERENCIAS BIBLIOGRÁFICAS

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -42).
Recuperado de 

https://link.gale.com/apps/doc/CX4052300007/GVRL?u=unad&sid=GVRL&xid=c94d9295

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico Nacional. (pp 55-
79).  Recuperado de 

https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy