Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)
Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)
United
34105 99 5.01 79.4
Kingdom
>fisier
2
>set.seed(5)
> km <- kmeans(fisier[,2:4], 3, 15) Datele sunt clusterizate cu algoritmul k-means cu 3 clustere si 15
iteratii.
>print(km)
> plot(fisier, col = km$cluster)
0 20000 0 40 80
5 10
Tara
20000
Venit
0
Alfabetizare 40 60 80 100
80
Mortalitate
40
0
70
Varsta
50
5 10 40 60 80 100 50 70
Sunt reprezentate observatiile grupate in cele 3 clustere in raport cu cele 4 atribute numerice.
3
70
60
50
40
fisier[, 2]
>o<-order(km$cluster)
>data.frame(fisier$Tara[o], km$cluster[o])
fisier.Tara.o. km.cluster.o.
1 Brazil 1
4
2 Argentina 1
3 South Africa 1
4 Turkey 1
5 Lithuania 1
6 Germany 2
7 Australia 2
8 UK 2
9 Sweden 2
10 Greece 2
11 Italy 2
12 Japan 2
13 Mozambique 3
14 China 3
15 Zambia 3
16 Namibia 3
17 Georgia 3
18 Pakistan 3
19 India 3
100
Turkey
Namibia
South Africa
80
fisier[, 3]
70
Zambia
India
60
50
Pakistan
40
Mozambique
fisier[, 2]
INTERPRETARE:
clusterul format din Germany, United Kingdom, Greece, Australia, Japan, Italy si Sweden, are cel
mai mare venit per capita, cea mai mare rata de alfabetizare, cea mai mare durata medie de viata si
cea mai mica rata a mortalitatii infantile. Deci, acest cluster reprezinta tarile dezvoltate.
Clusterul format din Mozambique, Georgia, Pakistan, India, Zambia si Namibia are cele mai
mici valori pentry toate atributele si deci, reprezinta tarile subdezvoltate.
6
Clusterul format din restul de tari, Brazil, South Africa, Turkey, Argentina siLithuania
reprezinta grupul tarilor in curs de dezvoltare.
Gruparea tarilor dupa algoritmul K-Means a fost comparata cu clasificarea tutoror tarilor bazata pe
indicele dezvoltarii umane. Acest indice (HDI) este o masura comparativa a bunastarii care ia in
considerare aspecte precum: durata medie de viata, rata de alfabetizare si educatia. In comparatie
cu gruparea tarilor pe baza HDI, numai 4 tari au fost clasificate in grupe diferite: Namibia, Georgia,
Pakistan si India. Aceste tari trebuiau plasate in clusterul tarilor in curs de dezvoltare.
> library(kohonen)
>set.seed(100)
>fisier1
>standard
>plot(somexemplu)
7
Venit Mortalitate
Alfabetizare Varsta
S-au obtinut 6 clustere, 3 pe linie si 2 pe coloana. Primul cluster este caracterizat de venit mare, rata de
alfabetizare ridicata si durata medie de viata ridicata.
mapping plot
Lithuania Mozambique
Zambia
Argentina South
Namibia
Africa
Am obtinut ca tarile din primul cluster sunt Germania, Australia , UK, Japonia, Suedia, deci tarile
dezvoltate, caracterizate de venit mare, rata de alfabetizare ridicata si durata medie de viata ridicata.