逻辑回归主要用来判断是、否的一个应用。例如本例子使用的是乳腺癌的数据,最后验证下来判断是否得乳腺癌。

一、准备工作

load breast cancer数据集是一个经典的乳腺属数据集,包含了569个样本和30人特征,其中包括了肿痛的大小、形状、质地等信息,该数据集被广泛应用于机器学习领域中的分类和预测任务,旨在帮助医生和研究人员更好地了解乳腺癌的发展和治疗。

pip install scikit-learn

二、程序主体结构

跟上一篇一样,所有的机器学习就这几个步骤。

引入库准备数据建模–这里建2层的模型。编译模型-指定梯度算法和损失计算规则训练-把数据传进去调用模型预测结果

三、程序代码

#引入代码库

import tensorflow as tf

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline

#引入数据的库,前面pip下载下来的

from sklearn.datasets import load_breast_cancer

#准备数据,这里X是输入内容,y是输出内容

#这里看后面第4章的解释,X,y里面到底是什么

X, y = load_breast_cancer(return_X_y=True)

#看一下X的数据类型,返回(569,30)是表示,569行,30列

#这个30后面要用的

X.shape

#开始建模

model=tf.keras.Sequential()

model.add(tf.keras.layers.Dense(10,input_shape=(30,),activation='relu')) #input_shape是30列的数据,所以是(30,)

model.add(tf.keras.layers.Dense(4,activation='relu'))

model.add(tf.keras.layers.Dense(1,activation='sigmoid'))

model.summary() #这里后面第4章有解释

#编译,这里acc表示准确率计算,loss用的是binary_crossentropy,不是上次的平方差

model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['acc'])

#开始训练

history=model.fit(X,y,epochs=100)

#看一下训练的返回值dict_keys(['loss','acc'])

history.history.keys()

#看一下训练次数与准确度的关系

plt.plot(history.epoch,history.history.get("loss"))

plt.plot(history.epoch,history.history.get("acc"))

四、重要内容解释

(1)输入数据和目标数据

告诉模型,我输入X,输出的结果应该是y

(2)模型的情况

(3)看100次训练后的结果

(4)看训练结果的效果

好文阅读

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。