0% found this document useful (0 votes)

38 views8 pages

Introduction To Hadoop

Uploaded by

lamaeidlm2000

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

38 views8 pages

Introduction To Hadoop

Uploaded by

lamaeidlm2000

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Introduction to Hadoop

Certified Big Data & Hadoop Training – DataFlair

Topics

 Introduction to Hadoop

 Hadoop nodes & daemons

 Hadoop Architecture

 Characteristics Hadoop

Certified Big Data & Hadoop Training – DataFlair

What is Hadoop?

An Open Source framework that

allows distributed processing of
large data-sets across the cluster
of commodity hardware

Certified Big Data & Hadoop Training – DataFlair

What is Hadoop?

An Open Source framework that Open Source

allows distributed processing of
large data-sets across the cluster  Source code is freely available
of commodity hardware  It may be redistributed and
modified

Certified Big Data & Hadoop Training – DataFlair

What is Hadoop?

An open source framework that Distributed Processing

allows Distributed Processing of
large data-sets across the cluster  Data is processed distributedly
of commodity hardware on multiple nodes / servers
 Multiple machines processes
the data independently

Certified Big Data & Hadoop Training – DataFlair

What is Hadoop?

An open source framework that Cluster

allows distributed processing of
large data-sets across the Cluster  Multiple machines connected
of commodity hardware together
 Nodes are connected via LAN

Certified Big Data & Hadoop Training – DataFlair

What is Hadoop?

An open source framework that Commodity Hardware

allows distributed processing of
large data-sets across the cluster  Economic / affordable
of Commodity Hardware machines
 Typically low performance
hardware

Certified Big Data & Hadoop Training – DataFlair

What is Hadoop?

• Open source framework written in Java

• Inspired by Google's Map-Reduce programming model

Certified Big Data & Hadoop Training – DataFlair

Hadoop History
Doug Cutting added Hadoop defeated
DFS & MapReduce Super computer
in
converted 4TB of
Doug Cutting started Doug Cutting
image archives over
working on joined Cloudera
100 EC2 instances

2002 2003 2004 2005 2006 2007 2008 2009

published GFS & Hadoop became

Development of
MapReduce papers top-level project
started as Lucene sub-project

launched Hive,
SQL Support for Hadoop

Certified Big Data & Hadoop Training – DataFlair

Hadoop Components
Hadoop consists of three key parts

Certified Big Data & Hadoop Training – DataFlair

Hadoop Nodes
Nodes

Master Node Slave Node

Certified Big Data & Hadoop Training – DataFlair

Hadoop Daemons
Nodes

Master Node Slave Node

Resource Node
Manager Manager

NameNode DataNode

Certified Big Data & Hadoop Training – DataFlair

Basic Hadoop Architecture
Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Work Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Certified Big Data & Hadoop Training – DataFlair

Hadoop Characteristics

Certified Big Data & Hadoop Training – DataFlair

Open Source

• Source code is freely

available Free Transparent

• Can be redistributed
• Can be modified Inter- Open Affordable
operable
Source

No vendor
Community
lock

Certified Big Data & Hadoop Training – DataFlair

Distributed Processing

• Data is processed distributedly

on cluster
• Multiple nodes in the cluster
process data independently

Centralized Processing

Distributed Processing
Certified Big Data & Hadoop Training – DataFlair

Fault Tolerance

• Failure of nodes are recovered

automatically
• Framework takes care of failure
of hardware as well tasks

Certified Big Data & Hadoop Training – DataFlair

Reliability

• Data is reliably stored on the

cluster of machines despite
machine failures
• Failure of nodes doesn’t
cause data loss

Certified Big Data & Hadoop Training – DataFlair

High Availability

• Data is highly available and

accessible despite hardware
failure
• There will be no downtime for
end user application due to
data

Certified Big Data & Hadoop Training – DataFlair

Scalability

• Vertical Scalability – New

hardware can be added to the
nodes

• Horizontal Scalability – New

nodes can be added on the fly

Certified Big Data & Hadoop Training – DataFlair

Economic

• No need to purchase costly license

• No need to purchase costly hardware

Commodity
Open Source + Hardware = Economic

Certified Big Data & Hadoop Training – DataFlair

Easy to Use

• Distributed computing challenges

are handled by framework
• Client just need to concentrate on
business logic

Certified Big Data & Hadoop Training – DataFlair

Data Locality

•
Data Data
Move computation to data
instead of data to computation
•
Data Data
Data is processed on the nodes
Storage Servers App Servers
where it is stored
Algo Algo
Data Data
Algorithm
Algo Algo
Data Data

Servers
Certified Big Data & Hadoop Training – DataFlair

Summary
• Everyday we generate 2.3 trillion GBs of data
• Hadoop handles huge volumes of data efficiently
• Hadoop uses the power of distributed computing
• HDFS & Yarn are two main components of Hadoop
• It is highly fault tolerant, reliable & available

Certified Big Data & Hadoop Training – DataFlair

Beyond Plastic - Bio Press - Blueprints
No ratings yet
Beyond Plastic - Bio Press - Blueprints
16 pages
Download The Cambridge Handbook of Intelligence 2nd Edition Robert J. Sternberg ebook All Chapters PDF
100% (17)
Download The Cambridge Handbook of Intelligence 2nd Edition Robert J. Sternberg ebook All Chapters PDF
55 pages
Unit 5
No ratings yet
Unit 5
32 pages
unit 2,3
No ratings yet
unit 2,3
24 pages
BDA UNIT-2
No ratings yet
BDA UNIT-2
37 pages
BAD601 Module 2 PDF
No ratings yet
BAD601 Module 2 PDF
61 pages
Introduction to
No ratings yet
Introduction to
7 pages
IBM Hadoop
No ratings yet
IBM Hadoop
11 pages
Module 1 Part 7 Bigdata Technology
No ratings yet
Module 1 Part 7 Bigdata Technology
8 pages
BT C1.pps
No ratings yet
BT C1.pps
6 pages
Module 2.1
No ratings yet
Module 2.1
21 pages
Part 02 - Big Data Solutions
No ratings yet
Part 02 - Big Data Solutions
17 pages
BAD601 Module 2 PDF
No ratings yet
BAD601 Module 2 PDF
58 pages
Approved Flash Devices
No ratings yet
Approved Flash Devices
29 pages
Bda Unit 4 Material
No ratings yet
Bda Unit 4 Material
37 pages
Hadoop Introduction
No ratings yet
Hadoop Introduction
26 pages
Hadoop
No ratings yet
Hadoop
14 pages
DATA228 Lecture Notes Week 3
No ratings yet
DATA228 Lecture Notes Week 3
21 pages
Hadoop Intro
No ratings yet
Hadoop Intro
25 pages
Hadoop and Spark Interview Questions - Sree
No ratings yet
Hadoop and Spark Interview Questions - Sree
74 pages
Replenium vs. Albertsons
No ratings yet
Replenium vs. Albertsons
42 pages
Bda Unit 2
No ratings yet
Bda Unit 2
44 pages
90918243221
No ratings yet
90918243221
2 pages
Platform - Application Signed Certificate
No ratings yet
Platform - Application Signed Certificate
2 pages
Hadoop Architecture and Its Functionality
No ratings yet
Hadoop Architecture and Its Functionality
7 pages
Cat5 Cable Modeling DVI HDMI
No ratings yet
Cat5 Cable Modeling DVI HDMI
12 pages
TYPE 59U/59B: DIN Standard PTFE Wedge Seals
No ratings yet
TYPE 59U/59B: DIN Standard PTFE Wedge Seals
6 pages
QA Rukmini Latest
No ratings yet
QA Rukmini Latest
6 pages
Unit 2 Part A
No ratings yet
Unit 2 Part A
34 pages
FPS Smart SCADA MANUAL With Exor Hmi
No ratings yet
FPS Smart SCADA MANUAL With Exor Hmi
117 pages
BDA Module-02 Search Creators
No ratings yet
BDA Module-02 Search Creators
33 pages
Impedancematching
No ratings yet
Impedancematching
17 pages
Bigdata
No ratings yet
Bigdata
6 pages
108 - Power Factor Meter Commissioning
No ratings yet
108 - Power Factor Meter Commissioning
6 pages
Hadoop Ankit
No ratings yet
Hadoop Ankit
20 pages
16043078653004zMWTcIiJONeiCve PDF
No ratings yet
16043078653004zMWTcIiJONeiCve PDF
2 pages
Unit-5 -Hadoop.pptx
No ratings yet
Unit-5 -Hadoop.pptx
29 pages
Unit 2-1
No ratings yet
Unit 2-1
43 pages
unit 2
No ratings yet
unit 2
28 pages
Big Data?: Hadoop?
No ratings yet
Big Data?: Hadoop?
2 pages
Hadoop Chapter 1
No ratings yet
Hadoop Chapter 1
6 pages
Report On An Exploratory Analysis of The
No ratings yet
Report On An Exploratory Analysis of The
19 pages
DSCI 5350 - Lecture 2 PDF
No ratings yet
DSCI 5350 - Lecture 2 PDF
54 pages
Unit II Big Data
No ratings yet
Unit II Big Data
27 pages
Hadoop Tutorial: Certified Big Data & Hadoop Training - Dataflair
No ratings yet
Hadoop Tutorial: Certified Big Data & Hadoop Training - Dataflair
10 pages
INtroduction To Big DAta and HAdoop
No ratings yet
INtroduction To Big DAta and HAdoop
30 pages
HADOOP
No ratings yet
HADOOP
18 pages
Dsa Hi 000125491
No ratings yet
Dsa Hi 000125491
21 pages
Naïve Bayes-DecisionTrees-RandomForest-SVM
No ratings yet
Naïve Bayes-DecisionTrees-RandomForest-SVM
26 pages
Hadoop-How It Works
No ratings yet
Hadoop-How It Works
5 pages
Unit 2 - Determinants
No ratings yet
Unit 2 - Determinants
10 pages
Hadoop, A Distributed Framework For Big Data
No ratings yet
Hadoop, A Distributed Framework For Big Data
55 pages
HADOOP
No ratings yet
HADOOP
55 pages
Xyz
No ratings yet
Xyz
69 pages
A New Way To Store and Analyze Data: Presented By:: Harsha Jain
No ratings yet
A New Way To Store and Analyze Data: Presented By:: Harsha Jain
20 pages
Chapter 2
No ratings yet
Chapter 2
19 pages
CC Unit - 5
No ratings yet
CC Unit - 5
27 pages
HADOOP
No ratings yet
HADOOP
10 pages
csvtu_subjects_only_sem3_to_8
No ratings yet
csvtu_subjects_only_sem3_to_8
7 pages
Hadoop Features 2
No ratings yet
Hadoop Features 2
3 pages
Hadoop Important Lecture
No ratings yet
Hadoop Important Lecture
38 pages
Introduction: Hadoop's History and Advantages 2. Architecture in Detail 3. Hadoop in Industry
No ratings yet
Introduction: Hadoop's History and Advantages 2. Architecture in Detail 3. Hadoop in Industry
53 pages
KINETIC ARCHITECTURE
No ratings yet
KINETIC ARCHITECTURE
18 pages
Big Data
No ratings yet
Big Data
67 pages
HDFS 79
No ratings yet
HDFS 79
74 pages
BIG Data_Unit_2
No ratings yet
BIG Data_Unit_2
24 pages
PPT04-Hadoop Infrastructure Layer
No ratings yet
PPT04-Hadoop Infrastructure Layer
40 pages
Unit III
No ratings yet
Unit III
15 pages
Exploring Bigdata With Hadoop: Dr.A.Bazila Banu Associate Professor Department of Cse
No ratings yet
Exploring Bigdata With Hadoop: Dr.A.Bazila Banu Associate Professor Department of Cse
23 pages
CDC UP Project Management Plan Template LITE
No ratings yet
CDC UP Project Management Plan Template LITE
14 pages
Unit-2 Hadoop and MapReduce
No ratings yet
Unit-2 Hadoop and MapReduce
32 pages
DBMS Unit-5
No ratings yet
DBMS Unit-5
92 pages
Big Data – Introduction to Hadoop
No ratings yet
Big Data – Introduction to Hadoop
61 pages
Mohammed Shaban, M.SC., PMP®: About Me
No ratings yet
Mohammed Shaban, M.SC., PMP®: About Me
3 pages
Course Creation Blueprint - How To Create, Promote, and Profit From Online Courses
No ratings yet
Course Creation Blueprint - How To Create, Promote, and Profit From Online Courses
8 pages
Hadoop, A Distributed Framework For Big Data
No ratings yet
Hadoop, A Distributed Framework For Big Data
55 pages
Finite Element Analysis of Automobile Transmission Shaft
No ratings yet
Finite Element Analysis of Automobile Transmission Shaft
5 pages
Hadoop Interview Question
No ratings yet
Hadoop Interview Question
25 pages
KEKA SOFTWARE - Employee Learning & Tutorial
No ratings yet
KEKA SOFTWARE - Employee Learning & Tutorial
20 pages
McCormick C-MAX Tier 2 (2003-) - RS20 - 95 Tractor Service Repair Manual PDF
No ratings yet
McCormick C-MAX Tier 2 (2003-) - RS20 - 95 Tractor Service Repair Manual PDF
29 pages
Testing Big Data: Camelia Rad
No ratings yet
Testing Big Data: Camelia Rad
31 pages
Hadoop PDF
0% (1)
Hadoop PDF
4 pages
Hadoop Lab
100% (1)
Hadoop Lab
32 pages
Bigdata Interview Preparation Guide
No ratings yet
Bigdata Interview Preparation Guide
292 pages
Digital Electronics (Group Activity) : (R OBO TI CS)
No ratings yet
Digital Electronics (Group Activity) : (R OBO TI CS)
7 pages
Mastering Hadoop
From Everand
Mastering Hadoop
Sandeep Karanth
No ratings yet
Exam: 1Z0-931 1Z0-931-F: NO.1 A. B. C. D. E
No ratings yet
Exam: 1Z0-931 1Z0-931-F: NO.1 A. B. C. D. E
15 pages
Process Design of Industrial Deaerator
100% (1)
Process Design of Industrial Deaerator
6 pages
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
From Everand
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
Wei Liu
No ratings yet
Ate Que Nada Mais Importe - Luciano Subirá
100% (1)
Ate Que Nada Mais Importe - Luciano Subirá
146 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Introduction To Hadoop

Uploaded by

Introduction To Hadoop

Uploaded by

Introduction to Hadoop

Certified Big Data & Hadoop Training – DataFlair

 Hadoop nodes & daemons

Certified Big Data & Hadoop Training – DataFlair

An Open Source framework that

Certified Big Data & Hadoop Training – DataFlair

An Open Source framework that Open Source

Certified Big Data & Hadoop Training – DataFlair

An open source framework that Distributed Processing

Certified Big Data & Hadoop Training – DataFlair

An open source framework that Cluster

Certified Big Data & Hadoop Training – DataFlair

An open source framework that Commodity Hardware

Certified Big Data & Hadoop Training – DataFlair

• Open source framework written in Java

Certified Big Data & Hadoop Training – DataFlair

2002 2003 2004 2005 2006 2007 2008 2009

published GFS & Hadoop became

Certified Big Data & Hadoop Training – DataFlair

Certified Big Data & Hadoop Training – DataFlair

Master Node Slave Node

Certified Big Data & Hadoop Training – DataFlair

Master Node Slave Node

Certified Big Data & Hadoop Training – DataFlair

Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Work Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Sub Work Sub Work Sub Work Sub Work

Certified Big Data & Hadoop Training – DataFlair

Certified Big Data & Hadoop Training – DataFlair

• Source code is freely

Certified Big Data & Hadoop Training – DataFlair

• Data is processed distributedly

• Failure of nodes are recovered

Certified Big Data & Hadoop Training – DataFlair

• Data is reliably stored on the

Certified Big Data & Hadoop Training – DataFlair

• Data is highly available and

Certified Big Data & Hadoop Training – DataFlair

• Vertical Scalability – New

• Horizontal Scalability – New

Certified Big Data & Hadoop Training – DataFlair

• No need to purchase costly license

Certified Big Data & Hadoop Training – DataFlair

• Distributed computing challenges

Certified Big Data & Hadoop Training – DataFlair

Certified Big Data & Hadoop Training – DataFlair

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.