0% found this document useful (0 votes)

104 views8 pages

Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)

The k-means clustering algorithm grouped the 19 countries into 3 clusters based on 4 quantitative attributes: per capita income, literacy rate, infant mortality rate, and life expectancy. Cluster 1 consists of developed countries like Germany, UK, and Japan. Cluster 2 includes countries in development like Brazil, Turkey and Argentina. Cluster 3 contains underdeveloped nations such as Mozambique, India and Pakistan. Self-organizing maps also clustered the countries into 6 groups based on the attributes, with the first group characterized by high income, literacy and life expectancy.

Uploaded by

HaMu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

104 views8 pages

Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)

Uploaded by

HaMu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 8

1

Venit per capita Rata de Rata de mortalitate Durata medie de

Tara
(US$) alfabetizare(%) infantila(%) viata(ani)

Brazil 10326 90 23.6 75.4

Germany 39650 99 4.08 79.4

Mozambique 830 38.7 95.9 42.1

Australia 43163 99 4.57 81.2

China 5300 90.9 23 73

Argentina 13308 97.2 13.4 75.3

United
34105 99 5.01 79.4
Kingdom

South Africa 10600 82.4 44.8 49.3

Zambia 1000 68 92.7 42.4

Namibia 5249 85 42.3 52.9

Georgia 4200 100 17.36 71

Pakistan 3320 49.9 67.5 65.5

India 2972 61 55 64.7

Turkey 12888 88.7 27.5 71.8

Sweden 34735 99 3.2 80.9

Lithuania 19730 99.6 8.5 73

Greece 36983 96 5.34 79.5

Italy 26760 98.5 5.94 80

Japan 34099 99 3.2 82.6

>fisier<-data.frame(Tara=c("Brazil", "Germany", "Mozambique", "Australia", "China", "Argentina", "UK",

"South Africa","Zambia", "Namibia", "Georgia", "Pakistan", "India", "Turkey", "Sweden", "Lithuania",
"Greece", "Italy", "Japan"), Venit=c(10326, 39650, 830, 43163, 5300,13308,34105, 10600, 1000,
5249,4200, 3320, 2972, 12888, 34735, 19730, 36983, 26760, 34099),
Alfabetizare=c(90,99,38.7,99,90.9,97.2,99,82.4,68,85,100,49.9,61,88.7,99,99.6,96,98.5,99),Mortalitate=c
(23.6,4.08,95.9,4.57,23,13.4,5.01,44.8,92.7,42.3,17.36,67.5,55,27.5,3.2,8.5,5.34,5.94,3.2),Varsta=c(75.4,
79.4,42.1,81.2,73,75.3,79.4,49.3,42.4,52.9,71,65.5,64.7,71.8,80.9,73,79.5,80,82.6))

>fisier
2

>set.seed(5)

> km <- kmeans(fisier[,2:4], 3, 15) Datele sunt clusterizate cu algoritmul k-means cu 3 clustere si 15
iteratii.

>print(km)
> plot(fisier, col = km$cluster)

0 20000 0 40 80

5 10
Tara
20000

Venit
0

Alfabetizare 40 60 80 100
80

Mortalitate
40
0

Varsta
50

5 10 40 60 80 100 50 70

Sunt reprezentate observatiile grupate in cele 3 clustere in raport cu cele 4 atribute numerice.
3

> plot(fisier[,2],fisier[,3], col=km$cluster) Sunt vizualizate observatiile grupate in clustere in functie de

atributele numerice Venit per capita (coloana 2) si Rata de alfabetizare (coloana 3).

>points(km$centers, col = 1:3, pch = 8) Sunt afisati centroizii celor 3 clustere.

100
90
80
fisier[, 3]

70
60
50
40

0 10000 20000 30000 40000

fisier[, 2]

>o<-order(km$cluster)

>data.frame(fisier$Tara[o], km$cluster[o])

Sunt afistate tarile si apartenenta lor la cele 3 clustere.

fisier.Tara.o. km.cluster.o.

1 Brazil 1
4

2 Argentina 1

3 South Africa 1

4 Turkey 1

5 Lithuania 1

6 Germany 2

7 Australia 2

8 UK 2

9 Sweden 2

10 Greece 2

11 Italy 2

12 Japan 2

13 Mozambique 3

14 China 3

15 Zambia 3

16 Namibia 3

17 Georgia 3

18 Pakistan 3

19 India 3

> text(x=fisier$Venit, y=fisier$Alfabetizare, labels=fisier$Tara, col=km$cluster)

Observatiile din grafic sunt etichetate cu numele tarilor.

100

Georgia Lithuania Japan

UK Germany
Sweden Australia
Argentina Italy
Greece
China Brazil
90

Turkey
Namibia
South Africa
80
fisier[, 3]

Zambia

India
60
50

Pakistan
40

Mozambique

0 10000 20000 30000 40000

fisier[, 2]

INTERPRETARE:

Implementarea algoritmului k-means a generat 3 clustere, relativ omogene, constand din 5, 7 si 7

tari. Analizand media clusterului (=centroidul), putem relationa fiecare grup cu tarile componente
astfel:

 clusterul format din Germany, United Kingdom, Greece, Australia, Japan, Italy si Sweden, are cel
mai mare venit per capita, cea mai mare rata de alfabetizare, cea mai mare durata medie de viata si
cea mai mica rata a mortalitatii infantile. Deci, acest cluster reprezinta tarile dezvoltate.

 Clusterul format din Mozambique, Georgia, Pakistan, India, Zambia si Namibia are cele mai
mici valori pentry toate atributele si deci, reprezinta tarile subdezvoltate.
6

 Clusterul format din restul de tari, Brazil, South Africa, Turkey, Argentina siLithuania
reprezinta grupul tarilor in curs de dezvoltare.

Gruparea tarilor dupa algoritmul K-Means a fost comparata cu clasificarea tutoror tarilor bazata pe
indicele dezvoltarii umane. Acest indice (HDI) este o masura comparativa a bunastarii care ia in
considerare aspecte precum: durata medie de viata, rata de alfabetizare si educatia. In comparatie
cu gruparea tarilor pe baza HDI, numai 4 tari au fost clasificate in grupe diferite: Namibia, Georgia,
Pakistan si India. Aceste tari trebuiau plasate in clusterul tarilor in curs de dezvoltare.

SOM (=SELF-ORGANIZING MAPS)

> library(kohonen)

>set.seed(100)

>fisier1<-fisier[-1] Se elimina prima coloana.

>fisier1

> standard<-scale(fisier1, center = attr(train.set, "scaled:center"),scale = attr(train.set, "scaled:scale"))

Se standardizeaza setul de date numerice.

>standard

>somexemplu <- som(standard, grid = somgrid(3, 2, "hexagonal"))

>plot(somexemplu)
7

Venit Mortalitate
Alfabetizare Varsta

S-au obtinut 6 clustere, 3 pe linie si 2 pe coloana. Primul cluster este caracterizat de venit mare, rata de
alfabetizare ridicata si durata medie de viata ridicata.

Ultimul cluster este caracterizat de tari cu o rata de mortalitate infantila ridicata.

Hartile SOM pot fi vizualizate si cu comanda urmatoare:

>plot(somexemplu, type="mapping", labels=fisier$Tara, main="mapping plot")

mapping plot

Germany Georgia India

Italy
Australia
Greece
Sweden China
UK Turkey
Brazil Pakistan
Japan

Lithuania Mozambique
Zambia
Argentina South
Namibia
Africa

Am obtinut ca tarile din primul cluster sunt Germania, Australia , UK, Japonia, Suedia, deci tarile
dezvoltate, caracterizate de venit mare, rata de alfabetizare ridicata si durata medie de viata ridicata.

Celelalte clustere se analizeaza similar.

Fraud Analytics Using Descriptive, Predictive, and Social Network Techniques: A Guide to Data Science for Fraud Detection
From Everand
Fraud Analytics Using Descriptive, Predictive, and Social Network Techniques: A Guide to Data Science for Fraud Detection
Bart Baesens
No ratings yet
Statele Lumii: Populatie Milioane
No ratings yet
Statele Lumii: Populatie Milioane
33 pages
GDP Growth (Annual %)
No ratings yet
GDP Growth (Annual %)
5 pages
Quality of Life
No ratings yet
Quality of Life
2 pages
WorldHappinessReport2013 Indicatori
No ratings yet
WorldHappinessReport2013 Indicatori
15 pages
S Stata A # 3: First, Create A Log File by Going To The Overhead Menu: File, Log, Begin
No ratings yet
S Stata A # 3: First, Create A Log File by Going To The Overhead Menu: File, Log, Begin
6 pages
Range of Rank On The PISA 2006 Science Scale Mean Score Standard Error OECD Countries All Countries/economies
No ratings yet
Range of Rank On The PISA 2006 Science Scale Mean Score Standard Error OECD Countries All Countries/economies
1 page
Capitalist Mentality Data
No ratings yet
Capitalist Mentality Data
20 pages
Ranking Aportes A OMP
No ratings yet
Ranking Aportes A OMP
4 pages
Data Extract From World Development Indicators
No ratings yet
Data Extract From World Development Indicators
17 pages
Venture Capital Per Investment Location: Number of Deals (Per Trillion PPP$ GDP) - 2011
No ratings yet
Venture Capital Per Investment Location: Number of Deals (Per Trillion PPP$ GDP) - 2011
1 page
Ene5 2005
No ratings yet
Ene5 2005
5 pages
Olympic Data 1996 - 2012
No ratings yet
Olympic Data 1996 - 2012
640 pages
GDP Categorized Emissions
No ratings yet
GDP Categorized Emissions
12 pages
Demografia
No ratings yet
Demografia
27 pages
The Need For Measurement Beyond GDP: - Measuring - Quality - of - Life#framework - For - Measuring - Quality - of - Life
No ratings yet
The Need For Measurement Beyond GDP: - Measuring - Quality - of - Life#framework - For - Measuring - Quality - of - Life
5 pages
EconomyPolitics, 2010 Global 10 Yr Growth Rates
No ratings yet
EconomyPolitics, 2010 Global 10 Yr Growth Rates
10 pages
En Peacekeeping Contributors 2014 Jul14 2
No ratings yet
En Peacekeeping Contributors 2014 Jul14 2
4 pages
Kte309 C1.2 BT6
No ratings yet
Kte309 C1.2 BT6
19 pages
Global Top Ten 2007-08
100% (1)
Global Top Ten 2007-08
19 pages
Country Power Distance Index Individualism Masculinity Uncertainty Avoidance Corruption Index
No ratings yet
Country Power Distance Index Individualism Masculinity Uncertainty Avoidance Corruption Index
14 pages
Entrepreneurship Index
No ratings yet
Entrepreneurship Index
1 page
Gross National Income 2007
No ratings yet
Gross National Income 2007
5 pages
MAS291 Group5 Project Dũng
No ratings yet
MAS291 Group5 Project Dũng
30 pages
WUP2018-F21-Proportion Urban Annual
No ratings yet
WUP2018-F21-Proportion Urban Annual
71 pages
Traffic Deaths
No ratings yet
Traffic Deaths
20 pages
Human Development Index (HDI)
No ratings yet
Human Development Index (HDI)
30 pages
FLifeGDPhiv2
No ratings yet
FLifeGDPhiv2
2 pages
SAC 1 - Data Analysis - 1. PRE DATA
No ratings yet
SAC 1 - Data Analysis - 1. PRE DATA
2 pages
Gender-Related Development Index-2007/2008
No ratings yet
Gender-Related Development Index-2007/2008
4 pages
UnsupervisedML project - country cluster analysis
No ratings yet
UnsupervisedML project - country cluster analysis
3 pages
UnsupervisedML project - country cluster analysis (1)
No ratings yet
UnsupervisedML project - country cluster analysis (1)
3 pages
Fsi 2006
No ratings yet
Fsi 2006
6 pages
Data Extract From World Development Indicators
No ratings yet
Data Extract From World Development Indicators
17 pages
WHR+24
No ratings yet
WHR+24
3 pages
IQ Levels Analysis With Python PDF 1701793924
No ratings yet
IQ Levels Analysis With Python PDF 1701793924
11 pages
Worldwide Look at Reserves and Production
No ratings yet
Worldwide Look at Reserves and Production
2 pages
10 1 - Challenges Absenteeism M4
No ratings yet
10 1 - Challenges Absenteeism M4
1 page
International Schooling Women Solution
No ratings yet
International Schooling Women Solution
38 pages
STATISTICI
No ratings yet
STATISTICI
23 pages
World Water Quality Indicator
No ratings yet
World Water Quality Indicator
1 page
Fsi 2010
No ratings yet
Fsi 2010
8 pages
Porter's Diamond
No ratings yet
Porter's Diamond
82 pages
Economic Efficiency 2013
No ratings yet
Economic Efficiency 2013
8 pages
Education Index
No ratings yet
Education Index
94 pages
Country Analysis 1707545820
No ratings yet
Country Analysis 1707545820
16 pages
Imf DM Export 20210930
No ratings yet
Imf DM Export 20210930
30 pages
chessResultsList
No ratings yet
chessResultsList
10 pages
The Global Economic Environment
No ratings yet
The Global Economic Environment
89 pages
Drinking Water National Rural Urba
No ratings yet
Drinking Water National Rural Urba
14 pages
MAS291_Group5_Project
No ratings yet
MAS291_Group5_Project
37 pages
Fsi 2007
No ratings yet
Fsi 2007
8 pages
Broadband Prices Worldwide
No ratings yet
Broadband Prices Worldwide
4 pages
Країни Світу Заготовка (Копія)
No ratings yet
Країни Світу Заготовка (Копія)
14 pages
3365 1467964822 PDF
No ratings yet
3365 1467964822 PDF
18 pages
Disponibilidad de Las Últimas Tecnologías - WEF
No ratings yet
Disponibilidad de Las Últimas Tecnologías - WEF
1 page
Determinants of Economic Growth in A Panel of Countries
No ratings yet
Determinants of Economic Growth in A Panel of Countries
44 pages
101 Reasons Why I Lost My Homework Again: The Snotty Snail
From Everand
101 Reasons Why I Lost My Homework Again: The Snotty Snail
Ofir Lobel
No ratings yet
Learn To Read For Preschoolers 2
From Everand
Learn To Read For Preschoolers 2
Beth Costanzo
No ratings yet
Cooking at Home
From Everand
Cooking at Home
Martha Frommert Kausch
No ratings yet
K Means Clustering Algorithm - BECOC316
No ratings yet
K Means Clustering Algorithm - BECOC316
5 pages
CSE3506 - Essentials of Data Analytics: Facilitator: DR Sathiya Narayanan S
No ratings yet
CSE3506 - Essentials of Data Analytics: Facilitator: DR Sathiya Narayanan S
17 pages
DBSCAN
No ratings yet
DBSCAN
18 pages
Non-Hierarchical Cluster Analysis Using K-Modes Method On Student of Statistics Major 2015 at The Faculty of Mathematics and Natural Sciences Mulawarman University
No ratings yet
Non-Hierarchical Cluster Analysis Using K-Modes Method On Student of Statistics Major 2015 at The Faculty of Mathematics and Natural Sciences Mulawarman University
8 pages
Agglomerative Hierarchical Clustering
No ratings yet
Agglomerative Hierarchical Clustering
21 pages
CC282 Unsupervised Learning (Clustering) : Lecture 7 Slides For CC282 Machine Learning, R. Palaniappan, 2008 1
No ratings yet
CC282 Unsupervised Learning (Clustering) : Lecture 7 Slides For CC282 Machine Learning, R. Palaniappan, 2008 1
38 pages
Clustering With R
No ratings yet
Clustering With R
4 pages
Lecture 3. Partitioning-Based Clustering Methods
No ratings yet
Lecture 3. Partitioning-Based Clustering Methods
27 pages
Clustering - Jupyter Notebook
100% (1)
Clustering - Jupyter Notebook
11 pages
Abstract Density K-Means
No ratings yet
Abstract Density K-Means
3 pages
Clustering Algorithms
No ratings yet
Clustering Algorithms
61 pages
Chapter 4
No ratings yet
Chapter 4
18 pages
Agglomerative Clustering
No ratings yet
Agglomerative Clustering
6 pages
Cluster Analysis Hierarchical Cluster
No ratings yet
Cluster Analysis Hierarchical Cluster
12 pages
Assignment 10: Introduction To Machine Learning Prof. B. Ravindran
100% (1)
Assignment 10: Introduction To Machine Learning Prof. B. Ravindran
4 pages
CSE 319 Pattern Recognition: Clustering
No ratings yet
CSE 319 Pattern Recognition: Clustering
58 pages
Implementasi Data Mining Clustering Tingkat Kepuasan Konsumen Terhadap Pelayanan Go-Jek
No ratings yet
Implementasi Data Mining Clustering Tingkat Kepuasan Konsumen Terhadap Pelayanan Go-Jek
7 pages
BSE181055-Assignment 3
No ratings yet
BSE181055-Assignment 3
16 pages
Jurnal 4 Statistik
No ratings yet
Jurnal 4 Statistik
6 pages
Understanding DBSCAN Algorithm and Implementation From Scratch - by Andrewngai - Towards Data Science
No ratings yet
Understanding DBSCAN Algorithm and Implementation From Scratch - by Andrewngai - Towards Data Science
10 pages
An Incremental Clustering Algorithm Based On Mahalanobis Distance
No ratings yet
An Incremental Clustering Algorithm Based On Mahalanobis Distance
1 page
Estimasi Sumberdaya Batubara Dengan Menggunakan Geostatistik Krigging
100% (1)
Estimasi Sumberdaya Batubara Dengan Menggunakan Geostatistik Krigging
11 pages
19 Jurnal Erizal Respatti EDIT
No ratings yet
19 Jurnal Erizal Respatti EDIT
8 pages
Basics 1 Vario Gram
No ratings yet
Basics 1 Vario Gram
37 pages
Clustering Example
No ratings yet
Clustering Example
18 pages
Partitioning Around Medoid: K-Medoids
No ratings yet
Partitioning Around Medoid: K-Medoids
5 pages
DBSCAN Presentation
No ratings yet
DBSCAN Presentation
10 pages
Introduction To Data Mining Clustering Analysis
No ratings yet
Introduction To Data Mining Clustering Analysis
84 pages
Código K-Means en Spyder
No ratings yet
Código K-Means en Spyder
3 pages
Density Based Spatial Clustering (DBSCAN) : With Data Analysis
No ratings yet
Density Based Spatial Clustering (DBSCAN) : With Data Analysis
36 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)

Uploaded by

Tara Venit Per Capita (US$) Rata de Alfabetizare (%) Rata de Mortalitate Infantila (%) Durata Medie de Viata (Ani)

Uploaded by

1

Venit per capita Rata de Rata de mortalitate Durata medie de

Brazil 10326 90 23.6 75.4

Germany 39650 99 4.08 79.4

Mozambique 830 38.7 95.9 42.1

Australia 43163 99 4.57 81.2

China 5300 90.9 23 73

Argentina 13308 97.2 13.4 75.3

South Africa 10600 82.4 44.8 49.3

Zambia 1000 68 92.7 42.4

Namibia 5249 85 42.3 52.9

Georgia 4200 100 17.36 71

Pakistan 3320 49.9 67.5 65.5

India 2972 61 55 64.7

Turkey 12888 88.7 27.5 71.8

Sweden 34735 99 3.2 80.9

Lithuania 19730 99.6 8.5 73

Greece 36983 96 5.34 79.5

Italy 26760 98.5 5.94 80

Japan 34099 99 3.2 82.6

>fisier<-data.frame(Tara=c("Brazil", "Germany", "Mozambique", "Australia", "China", "Argentina", "UK",

> plot(fisier[,2],fisier[,3], col=km$cluster) Sunt vizualizate observatiile grupate in clustere in functie de

>points(km$centers, col = 1:3, pch = 8) Sunt afisati centroizii celor 3 clustere.

0 10000 20000 30000 40000

Sunt afistate tarile si apartenenta lor la cele 3 clustere.

> text(x=fisier$Venit, y=fisier$Alfabetizare, labels=fisier$Tara, col=km$cluster)

Observatiile din grafic sunt etichetate cu numele tarilor.

Georgia Lithuania Japan

0 10000 20000 30000 40000

Implementarea algoritmului k-means a generat 3 clustere, relativ omogene, constand din 5, 7 si 7

SOM (=SELF-ORGANIZING MAPS)

>fisier1<-fisier[-1] Se elimina prima coloana.

> standard<-scale(fisier1, center = attr(train.set, "scaled:center"),scale = attr(train.set, "scaled:scale"))

>somexemplu <- som(standard, grid = somgrid(3, 2, "hexagonal"))

Ultimul cluster este caracterizat de tari cu o rata de mortalitate infantila ridicata.

Hartile SOM pot fi vizualizate si cu comanda urmatoare:

>plot(somexemplu, type="mapping", labels=fisier$Tara, main="mapping plot")

Germany Georgia India

Celelalte clustere se analizeaza similar.

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.