0% found this document useful (0 votes)

4 views12 pages

surbhi

The document discusses the importance of Python in data science, highlighting its simplicity, readability, and extensive libraries for various tasks such as numerical computing, data manipulation, and machine learning. Key libraries mentioned include NumPy, pandas, Matplotlib, and scikit-learn, each serving specific functions in the data science pipeline. Additionally, it provides real-world case studies demonstrating the application of these libraries in predicting house prices, customer segmentation, and sentiment analysis on tweets.

Uploaded by

textvideo83

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views12 pages

surbhi

Uploaded by

textvideo83

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Python

Libraries For
Data Science

By surbhi, raushani,shalini
• Data Science is the process of
extracting insights and knowledge from
What is data structured or unstructured data.

science? • It combines skills from statistics,

computer science, and domain
expertise.
• Common tasks include data cleaning,
analysis, visualization, modeling, and
prediction.
Simplicity & Large
Readability: Community:
Why Python for Python has a
clean and easy-
Vast community
support and

Data Science?
to-understand active
syntax. development.

Rich
Integration:
Ecosystem:
Works well with
Extensive
other languages
libraries for every
(C, R, SQL) and
stage of the data
tools.
science pipeline.
Some libraries are

• Numerical Computing: NumPy, SciPy

Python • Data Manipulation: pandas
offers • Visualization: matplotlib, seaborn,
plotly
specialized • Machine Learning & AI: scikit-learn,
libraries to TensorFlow, PyTorch
• Big Data & Databases: PySpark,
handle: SQLAlchemy
NumPy (Numerical Python)

Foundation of numerical computing in Python.

Provides multi-dimensional arrays (ndarray) which are

faster and more efficient than native Python lists.

Supports a wide range of mathematical functions: linear

algebra, Fourier transform, statistical operations.

Enables vectorized operations (apply functions on whole

arrays without loops).
pandas (Panel
Data)
Data Cleaning Data Transformation
(handling missing (grouping, merging,
values, duplicates). filtering, reshaping).

Very powerful for

Time Series Analysis. real-world data
manipulation.
The foundation of data visualization in Python.

Used for creating basic static plots like: Line

Matplotlib plots ,Bar charts ,Histograms, Scatter plots

Highly customizable (axes, titles, labels,

colors).

Useful for quick visual checks and

publication-quality graphics.
Machine Learning Libraries

Scikit-learn XGBoost / LightGBM

• Preprocessing • Gradient boosting for

• Supervised and performance
unsupervised learning • Feature importance
algorithms
• Model evaluation and
selection
Real-World Example Case Study 1: Predicting House Prices

Case Studies
/ Examples Dataset: Boston Housing / Kaggle House Prices dataset.

Libraries Used:
seaborn/matplotlib for EDA and visualizing scikit-learn for model training and evaluation
pandas for loading and cleaning data.
relationships. (e.g., Linear Regression, Random Forest).

Goal: Predict price of houses based on features like area, location,

number of rooms.
Example Case
Study 2: Dataset: E-commerce or pandas for handling large
retail transaction data. transaction tables.
Customer
Segmentation Libraries Used:
seaborn for visualizing
spending habits.

Goal: Group customers scikit-learn for clustering

by purchasing behavior algorithms (like K-
for targeted marketing. Means).
Example
Case Study Dataset: Twitter data
(CSV or from Twitter
pandas for data
manipulation.
3: Sentiment API).

Analysis on nltk or spaCy for text

preprocessing
Tweets Libraries Used:
(tokenization,
stopwords).

scikit-learn or
Goal: Classify
TextBlob for
tweets as positive,
sentiment
negative, or neutral.
classification.
Thank you

Data Science ppt
No ratings yet
Data Science ppt
17 pages
Lab - Manual FDS
No ratings yet
Lab - Manual FDS
12 pages
Part3 ML
No ratings yet
Part3 ML
201 pages
unit 4
No ratings yet
unit 4
105 pages
l9 Scientific Python Proc
No ratings yet
l9 Scientific Python Proc
30 pages
DAV Notes
No ratings yet
DAV Notes
266 pages
Python for Data Science
No ratings yet
Python for Data Science
8 pages
DS unit 1_ NUMPY
No ratings yet
DS unit 1_ NUMPY
29 pages
D P Lab Manual
No ratings yet
D P Lab Manual
54 pages
unit-2 ds
No ratings yet
unit-2 ds
26 pages
Python for Data Science – Ultimate Library Guide
No ratings yet
Python for Data Science – Ultimate Library Guide
5 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
49 pages
Elc Report
No ratings yet
Elc Report
12 pages
13_Data Visualization
No ratings yet
13_Data Visualization
15 pages
Python Libraries For Data Science
No ratings yet
Python Libraries For Data Science
10 pages
DOC-20250313-WA0013.
No ratings yet
DOC-20250313-WA0013.
12 pages
DAL EXT 1 and 2
No ratings yet
DAL EXT 1 and 2
125 pages
Programming For Data Science
No ratings yet
Programming For Data Science
48 pages
Practical 1
No ratings yet
Practical 1
8 pages
40 Most Popular Python Scientific Libraries
No ratings yet
40 Most Popular Python Scientific Libraries
9 pages
Python Libraries and Packages For Data Science
100% (1)
Python Libraries and Packages For Data Science
5 pages
Python Libraries For Data Science 1679435534
No ratings yet
Python Libraries For Data Science 1679435534
64 pages
Data Preprocessing-AIML Algorithm1
No ratings yet
Data Preprocessing-AIML Algorithm1
47 pages
Python For Data Science ( Anees Ahamad )_20250408_180733_0000
No ratings yet
Python For Data Science ( Anees Ahamad )_20250408_180733_0000
12 pages
15 python libraries for data science
No ratings yet
15 python libraries for data science
17 pages
suraj report file
No ratings yet
suraj report file
17 pages
Top 20 Python Libraries for Data Science
No ratings yet
Top 20 Python Libraries for Data Science
15 pages
Important Libraries For Data Science
No ratings yet
Important Libraries For Data Science
29 pages
Python Data Science - A Beginner's Guide To Mastering Analysis, Visualization, and Machine Learning by A. Eich Liana
No ratings yet
Python Data Science - A Beginner's Guide To Mastering Analysis, Visualization, and Machine Learning by A. Eich Liana
86 pages
Python-Libraries SEMINAR
No ratings yet
Python-Libraries SEMINAR
12 pages
dsbda Unit4
No ratings yet
dsbda Unit4
110 pages
100 Must-Know PythonMl Interview Questions and Answers 2024 – Devinterview.io
No ratings yet
100 Must-Know PythonMl Interview Questions and Answers 2024 – Devinterview.io
1 page
Python Complete Notes Handwritten
No ratings yet
Python Complete Notes Handwritten
216 pages
lab2report
No ratings yet
lab2report
6 pages
AIES Assignment1
No ratings yet
AIES Assignment1
15 pages
Python For Data Science
No ratings yet
Python For Data Science
22 pages
DATA ANALYSIS USING PYTHON2
No ratings yet
DATA ANALYSIS USING PYTHON2
27 pages
Python Libraries For Data Science
No ratings yet
Python Libraries For Data Science
10 pages
tool and lib in Data Science
No ratings yet
tool and lib in Data Science
32 pages
Practical File Artificial Intelligence Class 10 For 2023-24
78% (9)
Practical File Artificial Intelligence Class 10 For 2023-24
26 pages
Introduction to Popular-1
No ratings yet
Introduction to Popular-1
15 pages
practical 1
No ratings yet
practical 1
2 pages
TY FDS Workbook
No ratings yet
TY FDS Workbook
56 pages
data science
No ratings yet
data science
42 pages
Numpy Lib
No ratings yet
Numpy Lib
19 pages
Libraries For Data Science
No ratings yet
Libraries For Data Science
2 pages
Machine Learning Python Packages
No ratings yet
Machine Learning Python Packages
9 pages
Exp-1
No ratings yet
Exp-1
22 pages
Python Week+1 New
No ratings yet
Python Week+1 New
44 pages
Python in Finance & Accounting - Van Der Post, Hayden
No ratings yet
Python in Finance & Accounting - Van Der Post, Hayden
241 pages
Data Ty
No ratings yet
Data Ty
59 pages
Data Science Using With Python
No ratings yet
Data Science Using With Python
14 pages
Core Libraries For Machine Learning
No ratings yet
Core Libraries For Machine Learning
5 pages
Data Visualization
No ratings yet
Data Visualization
25 pages
Basic Libraries For Data Science
No ratings yet
Basic Libraries For Data Science
4 pages
Machine Learning Document
No ratings yet
Machine Learning Document
7 pages
Ass1 DSBDA Writeup
No ratings yet
Ass1 DSBDA Writeup
8 pages
PYTHON
No ratings yet
PYTHON
11 pages
Simulation of a Virtual CPU Executing Mathematical Functions in Python
No ratings yet
Simulation of a Virtual CPU Executing Mathematical Functions in Python
38 pages
Top 18 Python Libraries
100% (1)
Top 18 Python Libraries
11 pages
Computer Science Students Academic Performance Prediction Using Ai[1]
No ratings yet
Computer Science Students Academic Performance Prediction Using Ai[1]
68 pages
Python For Data Science
No ratings yet
Python For Data Science
8 pages
Introduction To Programming With Python: Libfexdlbdsipwp01
No ratings yet
Introduction To Programming With Python: Libfexdlbdsipwp01
188 pages
50 Days of Data Analysis with Python - Sample Document
0% (1)
50 Days of Data Analysis with Python - Sample Document
14 pages
Project Report: Ipl Score and Win Prediction Using Machine Learning
No ratings yet
Project Report: Ipl Score and Win Prediction Using Machine Learning
43 pages
IP Practical, Kanishk Bhati XII-D
No ratings yet
IP Practical, Kanishk Bhati XII-D
37 pages
Record Ip Mithun
No ratings yet
Record Ip Mithun
25 pages
Python Unit 4&5 Que
No ratings yet
Python Unit 4&5 Que
33 pages
22616-winter-23-model-answer
No ratings yet
22616-winter-23-model-answer
21 pages
w1-3 EEF311E Phyton 3
100% (1)
w1-3 EEF311E Phyton 3
80 pages
vector_functions_notes
No ratings yet
vector_functions_notes
3 pages
00 Pytorch Fundamentals - Ipynb - Colab
No ratings yet
00 Pytorch Fundamentals - Ipynb - Colab
24 pages
Numpy Tutorial PDF
60% (5)
Numpy Tutorial PDF
34 pages
goswami
No ratings yet
goswami
2 pages
P-I Controlled Transformerless Inverter for Solar PV Systems: A Python-Based Simulation
No ratings yet
P-I Controlled Transformerless Inverter for Solar PV Systems: A Python-Based Simulation
4 pages
27-33Python_EmpoweringDataScienceApplicationsandResearch
No ratings yet
27-33Python_EmpoweringDataScienceApplicationsandResearch
8 pages
Unit 1 - Data Handling Using Pandas and Data Visualisation: Important Multiple Choice Questions
No ratings yet
Unit 1 - Data Handling Using Pandas and Data Visualisation: Important Multiple Choice Questions
6 pages
MY RESUME FORMAT
No ratings yet
MY RESUME FORMAT
1 page
Mountain Descent
No ratings yet
Mountain Descent
1 page
EDA-4-5
No ratings yet
EDA-4-5
7 pages
Python Sem-4 Codes - Ipynb - Colab
No ratings yet
Python Sem-4 Codes - Ipynb - Colab
10 pages
Create A Voice Recorder Using Python
No ratings yet
Create A Voice Recorder Using Python
6 pages
CartoonEffect
No ratings yet
CartoonEffect
2 pages
Day 2 S1
No ratings yet
Day 2 S1
4 pages
Quantiacs Python Toolbox Documentation PDF
No ratings yet
Quantiacs Python Toolbox Documentation PDF
35 pages
Soln Rally Transmission
No ratings yet
Soln Rally Transmission
1 page
(Numpy) - Extended Cheatsheet
No ratings yet
(Numpy) - Extended Cheatsheet
8 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
4 pages
L01 - Introduction-to-ML
No ratings yet
L01 - Introduction-to-ML
10 pages
New Proposal-Programming in Python
No ratings yet
New Proposal-Programming in Python
3 pages
Alchemyst Data Science and Machine Learning Program
No ratings yet
Alchemyst Data Science and Machine Learning Program
4 pages
Python数据科学速查表 - Scikit-Learn
No ratings yet
Python数据科学速查表 - Scikit-Learn
1 page
Python Data Science Cookbook: Practical solutions across fast data cleaning, processing, and machine learning workflows with pandas, NumPy, and scikit-learn
From Everand
Python Data Science Cookbook: Practical solutions across fast data cleaning, processing, and machine learning workflows with pandas, NumPy, and scikit-learn
Taryn Voska
No ratings yet
Python Programming: General-Purpose Libraries; NumPy,Pandas,Matplotlib,Seaborn,Requests,os & sys: Python, #2
From Everand
Python Programming: General-Purpose Libraries; NumPy,Pandas,Matplotlib,Seaborn,Requests,os & sys: Python, #2
e3
No ratings yet
Python Data Science Cookbook
From Everand
Python Data Science Cookbook
Taryn Voska
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

surbhi

Uploaded by

surbhi

Uploaded by

Python

science? • It combines skills from statistics,

• Numerical Computing: NumPy, SciPy

Foundation of numerical computing in Python.

Provides multi-dimensional arrays (ndarray) which are

Supports a wide range of mathematical functions: linear

Enables vectorized operations (apply functions on whole

Very powerful for

Used for creating basic static plots like: Line

Highly customizable (axes, titles, labels,

Useful for quick visual checks and

Scikit-learn XGBoost / LightGBM

• Preprocessing • Gradient boosting for

Goal: Predict price of houses based on features like area, location,

Goal: Group customers scikit-learn for clustering

Analysis on nltk or spaCy for text

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.