Open navigation menu

Scribd

0% found this document useful (0 votes)

3 views5 pages

assig_5_mining

The document outlines a Python script that implements various machine learning classifiers on the breast cancer dataset using cross-validation. It evaluates the classifiers based on metrics such as accuracy, precision, recall, F1 score, and AUC, and saves the results to an Excel file. Additionally, it generates ROC and Precision-Recall curves, as well as a boxplot for test accuracy across different classifiers.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views5 pages

assig_5_mining

The document outlines a Python script that implements various machine learning classifiers on the breast cancer dataset using cross-validation. It evaluates the classifiers based on metrics such as accuracy, precision, recall, F1 score, and AUC, and saves the results to an Excel file. Additionally, it generates ROC and Precision-Recall curves, as well as a boxplot for test accuracy across different classifiers.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

import pandas as pd

import numpy as np

from sklearn.model_selection import cross_val_predict, StratifiedKFold

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score,

matthews_corrcoef, roc_curve

from sklearn.metrics import auc, precision_recall_curve

from sklearn.ensemble import RandomForestClassifier

from sklearn.svm import SVC

from sklearn.neighbors import KNeighborsClassifier

from sklearn.linear_model import LogisticRegression

from sklearn.naive_bayes import GaussianNB

from sklearn.tree import DecisionTreeClassifier

from sklearn.neural_network import MLPClassifier

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

from sklearn.gaussian_process import GaussianProcessClassifier

from sklearn.datasets import load_breast_cancer

import matplotlib.pyplot as plt

import seaborn as sns

# Load dataset

data = load_breast_cancer()

X, y = data.data, data.target

# Define classifiers

classifiers = {

'RandomForest': RandomForestClassifier(),

'SVM': SVC(probability=True),

'KNN': KNeighborsClassifier(),

'LogisticRegression': LogisticRegression(),

'NaiveBayes': GaussianNB(),

'DecisionTree': DecisionTreeClassifier(),

'MLP': MLPClassifier(),

'LDA': LinearDiscriminantAnalysis(),

'GaussianProcess': GaussianProcessClassifier(),

# Cross-validation

skf = StratifiedKFold(n_splits=10, shuffle=True, random_state=42)

results = []

for clf_name, clf in classifiers.items():

for fold, (train_idx, test_idx) in enumerate(skf.split(X, y), 1):

X_train, X_test = X[train_idx], X[test_idx]

y_train, y_test = y[train_idx], y[test_idx]

clf.fit(X_train, y_train)

y_pred = clf.predict(X_test)

y_prob = clf.predict_proba(X_test)[:, 1] if hasattr(clf, "predict_proba") else y_pred

acc_train = clf.score(X_train, y_train)

acc_test = accuracy_score(y_test, y_pred)

precision = precision_score(y_test, y_pred)

recall = recall_score(y_test, y_pred)

f1 = f1_score(y_test, y_pred)

mcc = matthews_corrcoef(y_test, y_pred)

fpr, tpr, _ = roc_curve(y_test, y_prob)

auc_score = auc(fpr, tpr)

prec, rec, _ = precision_recall_curve(y_test, y_prob)

pr_auc = auc(rec, prec)

results.append([data.feature_names[0], clf_name, acc_train, acc_test, precision, recall, f1, mcc,

auc_score, pr_auc])

# Save results to Excel

df_results = pd.DataFrame(results, columns=['Dataset', 'Classifier', 'TrainAccuracy', 'TestAccuracy',

'Precision', 'Recall', 'F1Score', 'MCC', 'AUC', 'PR_AUC'])

df_results.to_excel('UCI_Results.xlsx', index=False)

# Plot ROC Curve

plt.figure()

for clf_name, clf in classifiers.items():

y_prob = cross_val_predict(clf, X, y, cv=skf, method='predict_proba')[:, 1]

fpr, tpr, _ = roc_curve(y, y_prob)

plt.plot(fpr, tpr, label=f'{clf_name} (AUC = {auc(fpr, tpr):.2f})')

plt.xlabel('False Positive Rate')

plt.ylabel('True Positive Rate')

plt.legend()

plt.title('ROC Curves')

plt.show()

# Plot Precision-Recall Curve

plt.figure()

for clf_name, clf in classifiers.items():

y_prob = cross_val_predict(clf, X, y, cv=skf, method='predict_proba')[:, 1]

prec, rec, _ = precision_recall_curve(y, y_prob)

plt.plot(rec, prec, label=f'{clf_name} (PR AUC = {auc(rec, prec):.2f})')

plt.xlabel('Recall')

plt.ylabel('Precision')

plt.legend()

plt.title('Precision-Recall Curves')

plt.show()

# Plot Boxplot for Test Accuracy

plt.figure(figsize=(10, 6))

sns.boxplot(x='Classifier', y='TestAccuracy', data=df_results)

plt.xticks(rotation=45)

plt.title('Boxplot of Test Accuracy for Different Classifiers')

plt.show()

You might also like

TVPS 3 (Tablas Correctoras)
100% (9)
TVPS 3 (Tablas Correctoras)
14 pages
DH_20_2001_PAL
No ratings yet
DH_20_2001_PAL
310 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
Machine learning Lab Assignment 1
No ratings yet
Machine learning Lab Assignment 1
23 pages
Test Bank For Statistics For Business Decision Making and Analysis 3rd Edition Stine Foster 0134497163 9780134497167
100% (41)
Test Bank For Statistics For Business Decision Making and Analysis 3rd Edition Stine Foster 0134497163 9780134497167
36 pages
FY10 ICD-9-CM Procedure Codes Linked To NHSN Operative Procedure Categories
No ratings yet
FY10 ICD-9-CM Procedure Codes Linked To NHSN Operative Procedure Categories
22 pages
AML_lab[1] (1)
No ratings yet
AML_lab[1] (1)
14 pages
III AID_ML
No ratings yet
III AID_ML
30 pages
AAM Practicals 6-10
No ratings yet
AAM Practicals 6-10
13 pages
Corozal North
No ratings yet
Corozal North
180 pages
Transmittal Outgoing Migrant
No ratings yet
Transmittal Outgoing Migrant
78 pages
Vertopal.com Experiment01 Baseline Models Accuracy
No ratings yet
Vertopal.com Experiment01 Baseline Models Accuracy
35 pages
Ml Lab Experiment Shortened With Same Output
No ratings yet
Ml Lab Experiment Shortened With Same Output
6 pages
ml_all_projectpdf_removed
No ratings yet
ml_all_projectpdf_removed
41 pages
bacdeaf_23032025_115708_split_1
No ratings yet
bacdeaf_23032025_115708_split_1
37 pages
DA LAB MANNUAL
No ratings yet
DA LAB MANNUAL
25 pages
Pavithra Birth Certificate
No ratings yet
Pavithra Birth Certificate
1 page
MLfull
No ratings yet
MLfull
29 pages
Mesopotamia PDF
100% (1)
Mesopotamia PDF
57 pages
ANN_EXPERIENTIAL_LEARNING
No ratings yet
ANN_EXPERIENTIAL_LEARNING
43 pages
ML pdf
No ratings yet
ML pdf
30 pages
IRis
No ratings yet
IRis
19 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
Birth Certificates
No ratings yet
Birth Certificates
2 pages
ES001S240010343
No ratings yet
ES001S240010343
1 page
23BCE7199 ML Lab Assignment[1]
No ratings yet
23BCE7199 ML Lab Assignment[1]
15 pages
AI ML - Cycle 2 Programs (1)
No ratings yet
AI ML - Cycle 2 Programs (1)
15 pages
Traduccion Julio
No ratings yet
Traduccion Julio
5 pages
Fort George
No ratings yet
Fort George
34 pages
Code Examples in space
No ratings yet
Code Examples in space
13 pages
All in one
No ratings yet
All in one
13 pages
HEART DIS
No ratings yet
HEART DIS
13 pages
Shobit Sharma (2124399) ML lab file pdf
No ratings yet
Shobit Sharma (2124399) ML lab file pdf
19 pages
Appendix_ Complete Code Implementation
No ratings yet
Appendix_ Complete Code Implementation
8 pages
CP4252 Lab Manual(1)
No ratings yet
CP4252 Lab Manual(1)
13 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
ml
No ratings yet
ml
11 pages
1
No ratings yet
1
13 pages
PMI January 2014
No ratings yet
PMI January 2014
8 pages
Bcer
No ratings yet
Bcer
1 page
DA_012307
No ratings yet
DA_012307
8 pages
AIML Practical 02 22105A2021
No ratings yet
AIML Practical 02 22105A2021
8 pages
05 E RandomForest LoanData
No ratings yet
05 E RandomForest LoanData
8 pages
23UCC554
No ratings yet
23UCC554
9 pages
ML internal 2
No ratings yet
ML internal 2
7 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
ML-1
No ratings yet
ML-1
6 pages
decision tree
No ratings yet
decision tree
6 pages
ML II lab
No ratings yet
ML II lab
5 pages
Birth Certificate
No ratings yet
Birth Certificate
1 page
Vertopal.com Untitled (2)
No ratings yet
Vertopal.com Untitled (2)
4 pages
Slip
No ratings yet
Slip
5 pages
22104057_Prakhar_Week 5
No ratings yet
22104057_Prakhar_Week 5
8 pages
Random Forest
No ratings yet
Random Forest
5 pages
CODE
No ratings yet
CODE
4 pages
I Avaliação Parcial - 25.0 PTS - Gabarito
No ratings yet
I Avaliação Parcial - 25.0 PTS - Gabarito
9 pages
ML Codes
No ratings yet
ML Codes
9 pages
6 Binary Classifier
No ratings yet
6 Binary Classifier
4 pages
ML Lab
No ratings yet
ML Lab
4 pages
Lab4 - Jupyter Notebook
No ratings yet
Lab4 - Jupyter Notebook
7 pages
Data analytics
No ratings yet
Data analytics
10 pages
Lacking Requirements BECEd Batch 2024 2025
No ratings yet
Lacking Requirements BECEd Batch 2024 2025
3 pages
ML Lab
No ratings yet
ML Lab
7 pages
Birth Certificate
No ratings yet
Birth Certificate
3 pages
Mll
No ratings yet
Mll
2 pages
Exercise - Statistics I - Box Plots Amel
No ratings yet
Exercise - Statistics I - Box Plots Amel
3 pages
NB
No ratings yet
NB
2 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Fall Semester 2020-21 AI With Python ECE-4031
No ratings yet
Fall Semester 2020-21 AI With Python ECE-4031
5 pages
t3-m-4256-box-plot-matching-pairs-activity-sheet-english_ver_3
No ratings yet
t3-m-4256-box-plot-matching-pairs-activity-sheet-english_ver_3
2 pages
creating-box-plots-2
No ratings yet
creating-box-plots-2
2 pages
DP-AR-ALBERT OCT 1-15
No ratings yet
DP-AR-ALBERT OCT 1-15
2 pages
02 Certificate of Expenses Not Requiring Receipt COENRR (2)
No ratings yet
02 Certificate of Expenses Not Requiring Receipt COENRR (2)
2 pages
Preductive Modelling Assignment
No ratings yet
Preductive Modelling Assignment
3 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Tandag Diocesan Catholic Schools Association: (Tadicsa) DBOMARTAH (Cluster 2)
No ratings yet
Tandag Diocesan Catholic Schools Association: (Tadicsa) DBOMARTAH (Cluster 2)
4 pages
Online Payment Fraud Detection Using Machine Learning
No ratings yet
Online Payment Fraud Detection Using Machine Learning
2 pages
Sinaloa Mexico Birth Certificate
No ratings yet
Sinaloa Mexico Birth Certificate
2 pages
Document5 Location Cavite
No ratings yet
Document5 Location Cavite
6 pages
Lipa City 2020 Census
No ratings yet
Lipa City 2020 Census
8 pages
ML EXTERNAL XEROX
No ratings yet
ML EXTERNAL XEROX
1 page
2011 Census NFSA Coverage: District/Block/GP
No ratings yet
2011 Census NFSA Coverage: District/Block/GP
7 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
Sadiq Ullah B
No ratings yet
Sadiq Ullah B
1 page
Affidavit of Legitimation
No ratings yet
Affidavit of Legitimation
1 page
TensorFlow深度学习项目实战: Chinese Edition
From Everand
TensorFlow深度学习项目实战: Chinese Edition
Posts & Telecom Press
No ratings yet
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
Scala Data Analysis Cookbook (new): Navigate the world of data analysis, visualization, and machine learning with over 100 hands-on Scala recipes
From Everand
Scala Data Analysis Cookbook (new): Navigate the world of data analysis, visualization, and machine learning with over 100 hands-on Scala recipes
Arun Manivannan
No ratings yet

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Alternative Proxies:

Alternative Proxy