Welcome to Scribd!

0% found this document useful (0 votes)

37 views

Mini Project Sushant 612210154

Uploaded by

sushantsx8.nemesis

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Mini Project Sushant 612210154

Uploaded by

sushantsx8.nemesis

0% found this document useful (0 votes)

37 views3 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

37 views3 pages

Mini Project Sushant 612210154

Uploaded by

sushantsx8.nemesis

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 3

Search inside document

Step 1: Data Acquisition and Understanding

1. Load required Libraries and Dataset

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score
from sklearn.preprocessing import StandardScaler

df = pd.read_csv(‘Dry_Bean_Dataset.csv')
df.head()

2. Perform initial Exploratory Data Analysis (EDA) to understand basic statistics:

df.info()
df.describe()

3. Check for missing values:

df.isnull().sum()

Step 2: Data Preprocessing and Transformation

1. Handling Missing Values: If the dataset has missing values, we can handle them by
imputing the mean for numerical columns or using forward-fill for categorical columns.
2. Spliting dataset using train_test_split:

X = df.drop(columns=['Class'])
y = df['Class']
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=42)

3. Feature scaling on data:

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

Step 3: Data Visualization

1. Correlation Matrix to see relationships between features:

import seaborn as sns

import matplotlib.pyplot as plt
plt.figure(figsize=(10,8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

2. Distribution Plots of key features to understand the spread of values:

sns.displot(df[Area])
sns.displot(df['MajorAxisLength'])

3. Pair Plots to visualize relationships between input features:

sns.pairplot(df[['Area', 'Perimeter', 'MajorAxisLength',

'MinorAxisLength','AspectRation']], hue='Class')

Step 4: Model Building

Implement multiple models for comparison:

1. Logistic Regression:

from sklearn.linear_model import LogisticRegression

logreg = LogisticRegression()
logreg.fit(X_train, y_train)

2. Support Vector Machine (SVM):

from sklearn.svm import SVC

svm = SVC()
svm.fit(X_train, y_train)

3. K-Nearest Neighbors (KNN):

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier()
knn.fit(X_train, y_train)

Step 5: Model Evaluation

1. Accuracy:

Logistic Regression

from sklearn.metrics import accuracy_score

y_pred_logreg = logreg.predict(X_test)
print("Accuracy for Logistic Regression:", accuracy_score(y_test,
y_pred_logreg))
Support Vector Machine (SVM):

from sklearn.metrics import accuracy_score

y_pred_svm = svm.predict(X_test)
print("Accuracy for SVM:", accuracy_score(y_test, y_pred_svm))

K-Nearest Neighbors (KNN):

from sklearn.metrics import accuracy_score

y_pred_knn = knn.predict(X_test)
print("Accuracy for KNN:", accuracy_score(y_test, y_pred_knn))

2. Accuracy across models to select the best one. For instance:

o Logistic Regression: 92.28% accuracy
o SVM : 93.29% accuracy
o K-Nearest Neighbors (KNN): 92.16% accuracy

Conclusion and Insights

The best-performing model is Support Vector Machine (SVM) , with an accuracy of 93.29%.
The most important features contributing to the prediction of Dry Beans are Area,
MajorAxisLength, Perimeter.

Project On Airtel
Document138 pages
Project On Airtel
Rahul Anand
60% (5)
QWE Case Study
Document5 pages
QWE Case Study
Shubhendra vatsa
No ratings yet
New Chat: 1. Predicting Uber Ride Prices
Document16 pages
New Chat: 1. Predicting Uber Ride Prices
manasishivarkar
No ratings yet
Prathamesh KRAI
Document38 pages
Prathamesh KRAI
chaudharyakhilesh660
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Document20 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
Saloni Tuli
No ratings yet
Codes
Document6 pages
Codes
Vamshi Krishna
No ratings yet
Machine Learning LAB
Document20 pages
Machine Learning LAB
asmimcse
No ratings yet
ML Report
Document14 pages
ML Report
kanishk862005
No ratings yet
ML Assignment 1 - Nageswar
Document7 pages
ML Assignment 1 - Nageswar
upendrakomurumallu
No ratings yet
Ml Solution
Document60 pages
Ml Solution
Faizal Shaikh
No ratings yet
Project-4 (KNN CLASSIFICATION) (2) PRANAB
Document2 pages
Project-4 (KNN CLASSIFICATION) (2) PRANAB
Arijeet ros
No ratings yet
machine learning final manual
Document45 pages
machine learning final manual
binusha
No ratings yet
PR
Document17 pages
PR
Vanshika Gupta
No ratings yet
Ml Lab Manual
Document36 pages
Ml Lab Manual
I Am Ankur
No ratings yet
Lab 7
Document14 pages
Lab 7
usernamenew2710
No ratings yet
phase 3
Document5 pages
phase 3
kruthiprabhu12345
No ratings yet
Machine
Document45 pages
Machine
Gagan Sharma
100% (1)
CO3
Document8 pages
CO3
sankeerthrockz2002
No ratings yet
ML Lab Programs
Document23 pages
ML Lab Programs
Roopa 18-19-36
No ratings yet
Codes for Project
Document8 pages
Codes for Project
mrudula24
No ratings yet
Tous Les Algo de ML
Document7 pages
Tous Les Algo de ML
Jadlaoui Asma
No ratings yet
FML File Final
Document36 pages
FML File Final
Kunal Saini
No ratings yet
21CSC305P Ml - Lab Programs 1 -9
Document36 pages
21CSC305P Ml - Lab Programs 1 -9
gs1490
No ratings yet
ML With Python Practical
Document22 pages
ML With Python Practical
n58648017
No ratings yet
B24 ML Exp-3
Document10 pages
B24 ML Exp-3
SAKSHI TUPSUNDAR
No ratings yet
Data analytics
Document10 pages
Data analytics
LIBIN R K
No ratings yet
Machine Learnin
Document23 pages
Machine Learnin
Manoj Kumar 1183
100% (2)
Comprehensive Overview of Common ML Techniques
Document7 pages
Comprehensive Overview of Common ML Techniques
Shreya M
No ratings yet
Data Science
Document8 pages
Data Science
Geetha A L
No ratings yet
Unit2 ML Programs
Document7 pages
Unit2 ML Programs
diroja5648
No ratings yet
Exp 4
Document10 pages
Exp 4
jay
No ratings yet
ML Internal questions
Document15 pages
ML Internal questions
kallempudisai
No ratings yet
10.3389-fphy.2024.1349463-citation.txt-4
Document7 pages
10.3389-fphy.2024.1349463-citation.txt-4
Salton Gerard
No ratings yet
Import Pandas As PD
Document21 pages
Import Pandas As PD
captainsaad838
No ratings yet
lab-5-nguyenngocmaithi-20130120
Document20 pages
lab-5-nguyenngocmaithi-20130120
duong nguyen
No ratings yet
Additional Program
Document573 pages
Additional Program
abinayarj
No ratings yet
Lab - 8 - 21130616 - TranThanhVu - Ipynb - Colab
Document4 pages
Lab - 8 - 21130616 - TranThanhVu - Ipynb - Colab
nguyennhutoan722003
No ratings yet
KNN Age Prediction Model
Document9 pages
KNN Age Prediction Model
ARINA SYAKIRAH MUHAIYUDDIN
No ratings yet
Kabir Khan 1147 - 4
Document4 pages
Kabir Khan 1147 - 4
mohammed.ibrahimdurrani.bscs-2020b
No ratings yet
Week 7 Laboratory Activity
Document12 pages
Week 7 Laboratory Activity
Gar Noob
No ratings yet
Machine Learning
Document56 pages
Machine Learning
Mani Vrs
100% (5)
AML Clustering
Document7 pages
AML Clustering
ppradhan222003
No ratings yet
CART Practical 6
Document2 pages
CART Practical 6
pranayaws15
No ratings yet
ML Lab Manual
Document6 pages
ML Lab Manual
proplayer684i
No ratings yet
Home Work
Document12 pages
Home Work
sandeepssn47
No ratings yet
ML Lab File Final.docx - Google Docs
Document17 pages
ML Lab File Final.docx - Google Docs
akhil gharu
No ratings yet
Feature Selection
Document8 pages
Feature Selection
Abinaya C
No ratings yet
Vtu ML
Document13 pages
Vtu ML
akshay.deappy
No ratings yet
ML - Practical File
Document15 pages
ML - Practical File
Jatin Mathur
No ratings yet
Code
Document4 pages
Code
tkfx2jf9zs
No ratings yet
Arnav MLlab05
Document12 pages
Arnav MLlab05
Atomic Mole
No ratings yet
SL Classification For Data Science..
Document4 pages
SL Classification For Data Science..
shivaybhargava33
No ratings yet
pratham ML
Document14 pages
pratham ML
sagarbhond0
No ratings yet
ML-FINANCE - NPTES_BSR
Document36 pages
ML-FINANCE - NPTES_BSR
bmsakhil10
No ratings yet
2403RES29 - Hemant Choudhary - CS582 - Assignment - 2
Document6 pages
2403RES29 - Hemant Choudhary - CS582 - Assignment - 2
Hemant Choudhary
No ratings yet
Correction
Document3 pages
Correction
bougmazisoufyane
No ratings yet
stanfordKNNassignment
Document78 pages
stanfordKNNassignment
nomialsCry
No ratings yet
Linearregression SVM
Document3 pages
Linearregression SVM
4023 Keerthana
No ratings yet
Case Study - Classifier
Document5 pages
Case Study - Classifier
Stuti Singh
No ratings yet
Hands-On AI: Building ML Models with Python
From Everand
Hands-On AI: Building ML Models with Python
Anand Vemula
No ratings yet
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
Rating: 3 out of 5 stars
3/5 (1)
Mini Project With Output
Document8 pages
Mini Project With Output
sushantsx8.nemesis
No ratings yet
Final Assemblr Drg v2
Document1 page
Final Assemblr Drg v2
sushantsx8.nemesis
No ratings yet
DOMC Lab Subm Deadlines-step by Step Design Procedure 24-25
Document4 pages
DOMC Lab Subm Deadlines-step by Step Design Procedure 24-25
sushantsx8.nemesis
No ratings yet
Mini Project
Document8 pages
Mini Project
sushantsx8.nemesis
No ratings yet
IE - Gita Juniarti (254-259)
Document6 pages
IE - Gita Juniarti (254-259)
Yui
No ratings yet
Encyclopedia Stats v3
Document37 pages
Encyclopedia Stats v3
Amit
No ratings yet
Manual 3NH
Document39 pages
Manual 3NH
Yasmira Villavicencio Rosario
No ratings yet
Pengaruh Kompensasi Dan Motivasi Kerja Terhadap Kinerja Karyawan Pada Pt. Devina Surabaya
Document15 pages
Pengaruh Kompensasi Dan Motivasi Kerja Terhadap Kinerja Karyawan Pada Pt. Devina Surabaya
Gerry Yusman
No ratings yet
Unit 1 Data Science Notes
Document33 pages
Unit 1 Data Science Notes
p.brinda
No ratings yet
A Report
Document53 pages
A Report
Imnone
No ratings yet
Influences of Environmental and Hedonic Motivations On PI Green Product
Document11 pages
Influences of Environmental and Hedonic Motivations On PI Green Product
Ngọc Trần
No ratings yet
CertDA WS
Document13 pages
CertDA WS
Mentally Ill Sinner
No ratings yet
Temporal Analysis and Geo-Mapping of Fire Incidents in The City of Manila
Document7 pages
Temporal Analysis and Geo-Mapping of Fire Incidents in The City of Manila
Benito C. Shea
No ratings yet
Part 2 Exploring Relationships Among Variables
Document8 pages
Part 2 Exploring Relationships Among Variables
pu3bsd
No ratings yet
2022-Widiastuti 2022 IOP Conf. Ser. Earth Environ. Sci. 995 012026
Document6 pages
2022-Widiastuti 2022 IOP Conf. Ser. Earth Environ. Sci. 995 012026
Indah Widiastuti
No ratings yet
Pharma Data Analysis
Document2 pages
Pharma Data Analysis
KIng Kumar
No ratings yet
Lucky Charms Stats II - Math Work Sample
Document10 pages
Lucky Charms Stats II - Math Work Sample
api-319062102
No ratings yet
Mod 3 Worksheet Review 14KEY
Document5 pages
Mod 3 Worksheet Review 14KEY
Ayman Halime
No ratings yet
Case Processing Summary 1
Document3 pages
Case Processing Summary 1
ridhwan khalid06
No ratings yet
5103A1
Document6 pages
5103A1
Maesha Armeen
No ratings yet
MPC 006 PDF
Document55 pages
MPC 006 PDF
Jyoti
No ratings yet
Seminar Presentation
Document25 pages
Seminar Presentation
PaDiNjArAn
No ratings yet
Capitulo 8 Redaccion de Informes
Document22 pages
Capitulo 8 Redaccion de Informes
ofelix505
No ratings yet
Introduction To Econometrics, 5 Edition: Chapter 2: Properties of The Regression Coefficients and Hypothesis Testing
Document32 pages
Introduction To Econometrics, 5 Edition: Chapter 2: Properties of The Regression Coefficients and Hypothesis Testing
Ramarcha Kumar
No ratings yet
Research Methods For Business A Skill Building Approach 7th Edition Uma Sekaran download pdf
Document55 pages
Research Methods For Business A Skill Building Approach 7th Edition Uma Sekaran download pdf
rebulafiesta
100% (1)
Gujarat Technological University: Handbook
Document19 pages
Gujarat Technological University: Handbook
venkat naidu
No ratings yet
BQQ6214 Statistical Formulae
Document3 pages
BQQ6214 Statistical Formulae
Robert Oo
No ratings yet
Lab PRGM
Document16 pages
Lab PRGM
Nitesh Hu
No ratings yet
Marketing Research Report
Document4 pages
Marketing Research Report
Nga nguyen thi
100% (2)
TS Sproj Diesel Oil
Document12 pages
TS Sproj Diesel Oil
Abi S. Urmeneta
No ratings yet
PublishedPaperNo.8 2022
Document14 pages
PublishedPaperNo.8 2022
Sushmitha Thulasimani
100% (1)
Subjective of Modules 6
Document6 pages
Subjective of Modules 6
LaZeR
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Mini Project Sushant 612210154

Uploaded by

Copyright:

Available Formats

Mini Project Sushant 612210154

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Mini Project Sushant 612210154

Uploaded by

Copyright:

Available Formats

Step 1: Data Acquisition and Understanding

1. Load required Libraries and Dataset

2. Perform initial Exploratory Data Analysis (EDA) to understand basic statistics:

3. Check for missing values:

Step 2: Data Preprocessing and Transformation

3. Feature scaling on data:

Step 3: Data Visualization

1. Correlation Matrix to see relationships between features:

import seaborn as sns

2. Distribution Plots of key features to understand the spread of values:

3. Pair Plots to visualize relationships between input features:

sns.pairplot(df[['Area', 'Perimeter', 'MajorAxisLength',

Step 4: Model Building

Implement multiple models for comparison:

from sklearn.linear_model import LogisticRegression

2. Support Vector Machine (SVM):

from sklearn.svm import SVC

3. K-Nearest Neighbors (KNN):

from sklearn.neighbors import KNeighborsClassifier

Step 5: Model Evaluation

from sklearn.metrics import accuracy_score

from sklearn.metrics import accuracy_score

K-Nearest Neighbors (KNN):

from sklearn.metrics import accuracy_score

2. Accuracy across models to select the best one. For instance:

Conclusion and Insights

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.