Welcome to Scribd!

0% found this document useful (0 votes)

16 views

DWDM Final Lab Syllabus

Uploaded by

This document outlines the objectives and outcomes of a course on Data Warehousing and Data Mining. The main objective is to teach students conceptual, logical, and physical design of data warehouses and OLAP applications. Students will gain hands-on experience working with real data sets. Course outcomes include the ability to preprocess raw data, design data warehouses, extract knowledge using data mining techniques, and apply suitable visualization techniques to output analytical results. Students will complete projects in data preprocessing, similarity/dissimilarity measures, data warehousing, and applying algorithms like linear regression, decision trees, Naive Bayes classification, Apriori, k-means clustering, hierarchical clustering, and DBSCAN clustering.

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

DWDM Final Lab Syllabus

Uploaded by

saisimba99

0% found this document useful (0 votes)

16 views2 pages

Original Description:

Hwhw

Original Title

DWDM final lab syllabus (1)

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Download as docx, pdf, or txt

0% found this document useful (0 votes)

16 views2 pages

DWDM Final Lab Syllabus

Uploaded by

saisimba99

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 2

Search inside document

Data Warehousing & Data Mining Lab

Course Objectives:
The main objective of the course is to
1. Inculcate Conceptual, Logical, and Physical design of Data Warehouses OLAP
applications and OLAP deployment
2. Emphasize hands-on experience working with all real data sets.
3. Test real data sets using popular data mining Python Libraries
4. Develop ability to design various algorithms based on data mining tools.
Course Outcomes:
By the end of the course student will be able to
● Pre-process the raw data provided by the client for best results
● Design a data warehouse for any organization and apply operations on it.
● Extract knowledge using data mining techniques and enlist various algorithms used in
information analysis of Data Mining Techniques
● Implement and Analyse on knowledge flow application on data sets and Apply the
suitable visualization techniques to output analytical results

Software Requirements: Python, pentaho /Microsoft-SSIS/ Informatica

1. Demonstrate the following data preprocessing tasks using python libraries.

a. Loading the dataset
b. Dealing with missing data
2. Demonstrate the following data preprocessing tasks using python libraries.
a. Dealing with categorical data
b. Scaling the features
c. Splitting dataset into Training and Testing Sets
3. Demonstrate the following Similarity and Dissimilarity Measures using python.
a. Pearson’s Correlation
b. Cosine Similarity
c. Jaccard Similarity
d. Euclidean Distance
e. Manhattan Distance
4. Creation of a Data Warehouse
a. Build Data Warehouse/Data Mart (using open source tools like Pentaho Data
Integration Tool, Pentaho Business Analytics; or other data warehouse tools like
Microsoft-SSIS, Informatica, Business Objects,etc.,)
b. Design multi-dimensional data models namely Star, Snowflake and Fact
Constellation schemas for any one enterprise (ex. Banking, Insurance, Finance,
Healthcare, manufacturing, Automobiles, sales etc).
c. Write ETL scripts and implement using data warehouse tools.
d. Perform Various OLAP operations such slice, dice, roll up, drill up and pivot
5. Build a model using linear regression algorithm on any dataset.
6. Build a classification model using Decision Tree algorithm on iris dataset
7. Apply Naïve Bayes Classification algorithm on any dataset
8. Generate frequent itemsets using Apriori Algorithm in python and also generate association
rules for any market basket data.
9. Apply K- Means clustering algorithm on any dataset.
10. Apply Hierarchical Clustering algorithm on any dataset.
11. Apply DBSCAN clustering algorithm on any dataset.

Reference:
1. https://analyticsindiamag.com/data-pre-processing-in-python/
2.https://towardsdatascience.com/decision-tree-in-python-b433ae57fb93
3. https://towardsdatascience.com/calculate-similarity-the-most-relevant-metrics-in-a-
nutshell9a43564f533e
4. https://www.springboard.com/blog/data-mining-python-tutorial/
5. https://medium.com/analytics-vidhya/association-analysis-in-python-2b955d0180c
6. https://www.datacamp.com/community/tutorials/naive-bayes-scikit-learn
7. https://www.analyticsvidhya.com/blog/2019/05/beginners-guide-hierarchical-clustering/
8. https://towardsdatascience.com/dbscan-algorithm-complete-guide-and-application-with-
pythonscikit-learn-d690cbae4c5d

Guide - Data Science 2.0 Capstone Project
Document37 pages
Guide - Data Science 2.0 Capstone Project
nirupamgangurde
No ratings yet
Python For Data Analysis
Document4 pages
Python For Data Analysis
codewithtushpat
No ratings yet
Data Scientist Nanodegree Syllabus: Before You Start
Document5 pages
Data Scientist Nanodegree Syllabus: Before You Start
Aditya the Retro
No ratings yet
All Units MAAL BDA - Chatgpt
Document17 pages
All Units MAAL BDA - Chatgpt
Pancham Bandishti
No ratings yet
DSBDA Lab Manual
Document167 pages
DSBDA Lab Manual
B34-Samruddhi Latore
No ratings yet
DWDN Lab
Document7 pages
DWDN Lab
gswapna51
No ratings yet
Machine L-Lab-Manual
Document90 pages
Machine L-Lab-Manual
Vijai Kumarr Gottipati
No ratings yet
ML Lab Manual
Document90 pages
ML Lab Manual
geetha.r
No ratings yet
Anomaly Detection in Social Networks Twitter Bot
Document11 pages
Anomaly Detection in Social Networks Twitter Bot
Mallikarjun patil
No ratings yet
Tushar Verma 21scse1310012 Data Analysis Using Big Data Tools 21scse1310012 Report
Document6 pages
Tushar Verma 21scse1310012 Data Analysis Using Big Data Tools 21scse1310012 Report
stkzd8zrqm
No ratings yet
Data Scientist Nanodegree Syllabus
Document16 pages
Data Scientist Nanodegree Syllabus
lavanya
No ratings yet
RBQ
Document8 pages
RBQ
shaiksaifali883
No ratings yet
Predictive Data Analytics With Python
Document97 pages
Predictive Data Analytics With Python
toon town
100% (1)
Data Mining and Warehousing Lab
Document4 pages
Data Mining and Warehousing Lab
PhamThi Thiet
No ratings yet
Kamal ML
Document38 pages
Kamal ML
arinjaytheprime
No ratings yet
Dev
Document33 pages
Dev
kishorkiki14
No ratings yet
Assignment JTW115E 2023-2024 v5
Document5 pages
Assignment JTW115E 2023-2024 v5
Sha Finna
No ratings yet
Internship Training Programs-Python
Document23 pages
Internship Training Programs-Python
kundu mundu
No ratings yet
DAM1
Document6 pages
DAM1
neerajchauhan84399
No ratings yet
Digital Transformation in Banking
Document4 pages
Digital Transformation in Banking
Sharlee Jain
No ratings yet
DS&BD Lab Manul
Document98 pages
DS&BD Lab Manul
Ajeet Gupta
No ratings yet
PDS_Exp_13_to_16
Document14 pages
PDS_Exp_13_to_16
desainaitik48
No ratings yet
Ayush Machine Learning Lab
Document38 pages
Ayush Machine Learning Lab
aryan.srivastava2312
No ratings yet
ITECH2302 MainAssessment Report
Document8 pages
ITECH2302 MainAssessment Report
sedobi1512
No ratings yet
UpdatedNew Lp3LabManual
Document118 pages
UpdatedNew Lp3LabManual
sefeb65570
No ratings yet
VTU ML (1)
Document62 pages
VTU ML (1)
Srusti Shripurna
No ratings yet
Python For Data Science Certificate: Who Should Enroll Inside The Program
Document3 pages
Python For Data Science Certificate: Who Should Enroll Inside The Program
chiahaoguang
No ratings yet
DWDM RECORD PRINT1
Document100 pages
DWDM RECORD PRINT1
bitenos563
No ratings yet
Internship Report (1)
Document15 pages
Internship Report (1)
zenithteacho
No ratings yet
Da Unit Ii
Document25 pages
Da Unit Ii
odugukumari81
No ratings yet
Python For Data Science and Machine Learning
Document31 pages
Python For Data Science and Machine Learning
Kassandra Kay Fabia Mislang
100% (2)
Ad3301 Data Exploration and Visualization
Document30 pages
Ad3301 Data Exploration and Visualization
Shamilie M
100% (3)
Joseph Manoj
Document5 pages
Joseph Manoj
Karthik Murasu
No ratings yet
Synopsis
Document9 pages
Synopsis
sanjeev jangir
No ratings yet
BDA Lab 9 Manual
Document3 pages
BDA Lab 9 Manual
aaleem.bscs21seecs
No ratings yet
Data Ty
Document59 pages
Data Ty
Inaara Rajwani
No ratings yet
Algorithm
Document4 pages
Algorithm
Gaurav chotaliya
No ratings yet
Document
Document10 pages
Document
techmasterplay
No ratings yet
Project PPTX Lyst5585
Document8 pages
Project PPTX Lyst5585
deepali sacha
No ratings yet
Ad3301 Data Exploration and Visualization
Document38 pages
Ad3301 Data Exploration and Visualization
vishveswari surendran
No ratings yet
First
Document35 pages
First
thesoulmatecreation
No ratings yet
Data Mining & Warehousing Exam
Document28 pages
Data Mining & Warehousing Exam
deepika02jtn
No ratings yet
AIDI - 1010 - WEEK2 - Google Colab - v1.2
Document17 pages
AIDI - 1010 - WEEK2 - Google Colab - v1.2
Shafat Khan
No ratings yet
project
Document2 pages
project
Hager Ahmed
No ratings yet
PDS Exp 1 To 3
Document17 pages
PDS Exp 1 To 3
X
No ratings yet
IIM PBA Assignment 2
Document3 pages
IIM PBA Assignment 2
luckysharma201995
No ratings yet
Multidimensional Data Modeling in Pentaho
Document6 pages
Multidimensional Data Modeling in Pentaho
thamasi kandi
No ratings yet
Smai A1 PDF
Document3 pages
Smai A1 PDF
Zubair Ahmed
No ratings yet
New Data Warehouse Lab Manual
Document19 pages
New Data Warehouse Lab Manual
svkarthik83
No ratings yet
Data Science
Document7 pages
Data Science
rana sami
No ratings yet
Panda's Cheat Sheet
Document18 pages
Panda's Cheat Sheet
samer salem
No ratings yet
ME P4252-II Semester - MACHINE LEARNING
Document46 pages
ME P4252-II Semester - MACHINE LEARNING
Bibsy Adlin Kumari R
No ratings yet
Big Data Framework Final Project
Document2 pages
Big Data Framework Final Project
Jasleen Jaswal
No ratings yet
Lab Manual Ds&Bdal
Document100 pages
Lab Manual Ds&Bdal
SEA110 Kshitij Bhosale
No ratings yet
Machine Learning with Python: A Comprehensive Guide with a Practical Example
From Everand
Machine Learning with Python: A Comprehensive Guide with a Practical Example
MARTIN NEEL
No ratings yet
Important Questions
Document4 pages
Important Questions
Adilrabia rsl
No ratings yet
MySkill X Lion Parcel - Short Class Data Science Fundamental
Document7 pages
MySkill X Lion Parcel - Short Class Data Science Fundamental
Muham Anis
No ratings yet
ML Lab Manual-18csl76
Document52 pages
ML Lab Manual-18csl76
sameehana
No ratings yet
ML Lab Manual 18csl76 1
Document54 pages
ML Lab Manual 18csl76 1
Kollipara Sai Sandeep
No ratings yet
Hands-On Data Preprocessing in Python: Learn how to effectively prepare data for successful data analytics
From Everand
Hands-On Data Preprocessing in Python: Learn how to effectively prepare data for successful data analytics
Roy Jafari
No ratings yet
Adaptive Filter Analysis For System Identification Using Various Adaptive Algorithms
Document7 pages
Adaptive Filter Analysis For System Identification Using Various Adaptive Algorithms
gantayat
No ratings yet
11
Document5 pages
11
Kasthuri Letchuman
No ratings yet
DSML Curriculum Doc - Google Sheets
Document12 pages
DSML Curriculum Doc - Google Sheets
siddhantjaiswal12345
0% (1)
Paper 105
Document6 pages
Paper 105
Ahmed Srhan
No ratings yet
Classification With Logistic Regression, Newton's Method For Optimization, Generalized Linear Models
Document55 pages
Classification With Logistic Regression, Newton's Method For Optimization, Generalized Linear Models
mr robot
No ratings yet
Doc2vec Explain
Document5 pages
Doc2vec Explain
Pushkar Mishra
No ratings yet
Empirical Analysis of Ensemble Learning For Imbalanced Credit Scoring
Document18 pages
Empirical Analysis of Ensemble Learning For Imbalanced Credit Scoring
YanOner
No ratings yet
Deep Learning-Based Depression Detection From Social Media
Document20 pages
Deep Learning-Based Depression Detection From Social Media
Iqra Saher
No ratings yet
Zep Sqoop Big Data Interview Questions
Document25 pages
Zep Sqoop Big Data Interview Questions
Oluwadamilare
No ratings yet
MGMT 2006 Module 5
Document64 pages
MGMT 2006 Module 5
seanie.dj
No ratings yet
Papper To Read Successfuly 11
Document6 pages
Papper To Read Successfuly 11
thrithun
No ratings yet
Dbms Unit II
Document49 pages
Dbms Unit II
labeebahuda2003
No ratings yet
Design of Internal Model Control Based Fractional Order PID Controller PDF
Document6 pages
Design of Internal Model Control Based Fractional Order PID Controller PDF
Holly Gardner
No ratings yet
Artificial Intelligence and Machine Learning For Healthcare
Document13 pages
Artificial Intelligence and Machine Learning For Healthcare
Kholid Bui
No ratings yet
Artificial Intelligence High Technology PowerPoint Templates
Document33 pages
Artificial Intelligence High Technology PowerPoint Templates
Cleofe Jane Patnubay
No ratings yet
Assignment 3
Document3 pages
Assignment 3
06–Yash Bhusal
No ratings yet
Artificial Intelligence
Document30 pages
Artificial Intelligence
vishnu m v
67% (3)
Fabric Get Started
Document99 pages
Fabric Get Started
Ismail Cassiem
No ratings yet
Similarity Learning
Document4 pages
Similarity Learning
watson191
No ratings yet
Plant Leaf Disease Recognition Using Random Forest KNN SVM and CNN
Document7 pages
Plant Leaf Disease Recognition Using Random Forest KNN SVM and CNN
Tom Holland
No ratings yet
DRC Guidebook PDF
Document20 pages
DRC Guidebook PDF
Wira Pramoeja
100% (1)
Communication
Document5 pages
Communication
Manojit
No ratings yet
ME 461 Control Engineering: Semester: July 2017
Document32 pages
ME 461 Control Engineering: Semester: July 2017
Sudipta Paul
No ratings yet
Introduction To Information Systems People Technology and Processes 3rd Edition Wallace Solutions Manual 1
Document26 pages
Introduction To Information Systems People Technology and Processes 3rd Edition Wallace Solutions Manual 1
mary
100% (67)
Formalizing Supervised Learning Model Selection
Document1 page
Formalizing Supervised Learning Model Selection
MuhdHusaini
No ratings yet
Planning and Decision-Making For Autonomous Vehicles: Annual Review of Control, Robotics, and Autonomous Systems
Document26 pages
Planning and Decision-Making For Autonomous Vehicles: Annual Review of Control, Robotics, and Autonomous Systems
Imam Fakhrurrozi Hidayat
No ratings yet
The Application of Computer Vision Machine and Deep Learning Alg
Document58 pages
The Application of Computer Vision Machine and Deep Learning Alg
Crissa Mae Gannaban
No ratings yet
Automated Vehicle Security System Using ALPR and Face Detection
Document9 pages
Automated Vehicle Security System Using ALPR and Face Detection
akinlabi aderibigbe
No ratings yet
FLab-08 EXP8
Document8 pages
FLab-08 EXP8
Carl Kevin Cartijano
No ratings yet
Automated Error Classification and Root Cause Determination
Document11 pages
Automated Error Classification and Root Cause Determination
Peter Sovak
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

DWDM Final Lab Syllabus

Uploaded by

Copyright:

Available Formats

DWDM Final Lab Syllabus

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

DWDM Final Lab Syllabus

Uploaded by

Copyright:

Available Formats

Data Warehousing & Data Mining Lab

Software Requirements: Python, pentaho /Microsoft-SSIS/ Informatica

1. Demonstrate the following data preprocessing tasks using python libraries.

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.