以葡萄酒数据集为研究对象,对比归一化对各种算法的影响,分析算法的差异。

# 不同分类算法的差异

import numpy as np

from sklearn.tree import DecisionTreeClassifier

from sklearn.linear_model import LogisticRegression

from sklearn.svm import SVC

from sklearn import datasets

from sklearn.model_selection import train_test_split #导入数据拆分包

from sklearn.preprocessing import StandardScaler #Z-score归一化

import warnings

warnings.filterwarnings('ignore')

1.加载数据

data=datasets.load_wine()

X=data['data']

y=data['target']

#三种算法是否具有特征重要性属性?

2.归一化处理

np.set_printoptions(suppress=True) #科学计数法转为小数点表示

standard=StandardScaler()

X=standard.fit_transform(X) #数据归一化

X

3.1 LR逻辑斯蒂回归模型应用

%%time

score=0

for i in range(100): #100次计算

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2) #数据拆分

lr=LogisticRegression() #惩罚项可以选1.0和2.0,最大迭代次数max_iter

lr.fit(X_train,y_train)

s=lr.score(X_test,y_test)

score&

相关链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。