逻辑回归主要用来判断是、否的一个应用。例如本例子使用的是乳腺癌的数据,最后验证下来判断是否得乳腺癌。
一、准备工作
load breast cancer数据集是一个经典的乳腺属数据集,包含了569个样本和30人特征,其中包括了肿痛的大小、形状、质地等信息,该数据集被广泛应用于机器学习领域中的分类和预测任务,旨在帮助医生和研究人员更好地了解乳腺癌的发展和治疗。
pip install scikit-learn
二、程序主体结构
跟上一篇一样,所有的机器学习就这几个步骤。
引入库准备数据建模–这里建2层的模型。编译模型-指定梯度算法和损失计算规则训练-把数据传进去调用模型预测结果
三、程序代码
#引入代码库
import tensorflow as tf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
#引入数据的库,前面pip下载下来的
from sklearn.datasets import load_breast_cancer
#准备数据,这里X是输入内容,y是输出内容
#这里看后面第4章的解释,X,y里面到底是什么
X, y = load_breast_cancer(return_X_y=True)
#看一下X的数据类型,返回(569,30)是表示,569行,30列
#这个30后面要用的
X.shape
#开始建模
model=tf.keras.Sequential()
model.add(tf.keras.layers.Dense(10,input_shape=(30,),activation='relu')) #input_shape是30列的数据,所以是(30,)
model.add(tf.keras.layers.Dense(4,activation='relu'))
model.add(tf.keras.layers.Dense(1,activation='sigmoid'))
model.summary() #这里后面第4章有解释
#编译,这里acc表示准确率计算,loss用的是binary_crossentropy,不是上次的平方差
model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['acc'])
#开始训练
history=model.fit(X,y,epochs=100)
#看一下训练的返回值dict_keys(['loss','acc'])
history.history.keys()
#看一下训练次数与准确度的关系
plt.plot(history.epoch,history.history.get("loss"))
plt.plot(history.epoch,history.history.get("acc"))
四、重要内容解释
(1)输入数据和目标数据
告诉模型,我输入X,输出的结果应该是y
(2)模型的情况
(3)看100次训练后的结果
(4)看训练结果的效果
好文阅读
发表评论